Comment se servir d'une concordance
Qu’est-ce qu’une concordance? C’est la présentation informatisée du vocabulaire d’un texte (littéraire ou autre) ou d’une série de textes. La concordance permet de présenter ce vocabulaire de deux façons – selon la liste des fréquences de mots ou selon le contexte de chaque occurrence d’un mot.
Évidemment les mots grammaticaux (pronoms, prépositions, adverbes, conjonctions etc.) sont les plus fréquents. Le plus souvent, on ne s’intéresse pas au fait que le mot de apparaît 440 fois dans Le Cid de Corneille (bien que certains critiques soutiennent que l’analyse statistique des mots grammaticaux constitue la façon la plus sûre de vérifier l’identité de l’auteur d’un texte disputé). À partir de la liste de fréquences du Cid, on apprend que les noms les plus fréquents sont: père (69 occurrences); mort (50); roi (49); coeur (46); amour (42); sang (41); gloire (36); devoir (36); combat (36) et honneur (34).
En regardant de plus près les 41 occurences du mot sang
avec la fonction KWIC (Key Word in Context) on peut donc apprendre les choses
suivantes:
1) la dernière occurrence a lieu à la ligne 2785 du dossier
et se trouve dans le contexte suivant “D’avoir trempé mes mains
dans le sang paternel?”;
2) il y a 10 occurrences du mot dans la scène viii de l’Acte
II (où Chimène décrit la mort de son père), dont
6 aux positions fortes à la rime ou en début de vers;
3) en analysant de plus près chacune des occurrences, on peut constater
que le mot renvoie à la famille 6 fois, qu’il est employé au
sens concret un certain nombre de fois, qu’il constitue une synecdoque un
certain nombre de fois, qu’il est employé par Chimène x fois,
par Rodrigue x fois, qu’il se trouve à la rime x fois, etc.
Cependant, si le logiciel permet de repérer les occurrences, c’est à vous d’en faire l’analyse détaillée et d’en tirer les conséquences. Essayons de voir comment se servir des concordances disponibles à partir du site de l’ABU (Association des Bibliophiles Universels). Ce site contient un nombre très élevé de textes (pièces, nouvelles, romans, essais) avant 1900. Il y a peu de textes modernes pour des raisons de droits d’auteur. Un autre système, un peu plus compliqué mais assez performant se trouve à http://www.etudes-francaises.net/nefbase/theatre/ mais n'a dans son répertoire qu'un nombre limité de textes de théâtre (Corneille, Racine, Molière, Marivaux et Beaumarchais). Il existe aussi des concordanciers qu'on peut acheter et utiliser sur des documents en format HTML ou texte. Le concordancier de WebCorp (interface en anglais, gratuit si limité à un emploi privé) permet d'établir sa propre concordance à partir de documents sur le Web http://webcorp.org.uk/index.html.
Le logiciel de l'ABU (comme tous les concordanciers d'ailleurs) ne permet pas de distinguer entre les emplois différents d’un mot (verbe/ nom, nom/adverbe etc.) donc si on s’intéresse au nom point (un point d’honneur), il faut trier manuellement pour exclure les occurrences de l’adverbe de négation (je ne veux point en entendre parler).
Également, le logiciel employé par l’ABU cherche une suite de letttres et ne permet pas de distinguer entre un mot et ses composés et va sortir pour le mot bras embrasser et brasé. L’exemple du mot sang va aussi repérer l’adjectif sanglantes. Parfois, on veut examiner ces mots ensemble, parfois non. Si on cherche toutes les occurrences du verbe aimer dans toutes ses lemmes (formes différentes selon la morphologie), on mettra aim comme objet de recherche (mais on aura à ce moment-là des mots comme daim aussi).
Regardons maintenant quelques captures d'écran tirées du
site de l'ABU:
NOTE : Puisque j'ai capté les images, les boutons sur ces images
ne marchent pas. Si vous allez directement au site de l'ABU, vous pouvez
naviguer de façon normale.
#1 - écran d'entrée à la pièce.
#2 - demande d'occurrence du mot sang dans la pièce.
#3 résultat de la recherche du mot sang:
Travaux pratiques
travailler à deux par ordinateur - comparez
vos réponses avec celles de vos voisins.
1. Connectez-vous au site de l'ABU http://abu.cnam.fr/ et trouvez le texte du Tartuffe de Molière.
Laissez cette page ouverte pour plus tard.
Regardez la liste de fréquences. À partir
de quel mot est-ce qu'on commence à voir des noms communs?
2. Identifiez et notez dans la liste de fréquences ci-dessous du Tartuffe tous les mots du réseau lexical de l’amour et de la religion avec plus de 5 occurrences. Que constatez-vous? Une fois que vous avez fait ce travail, consultez la page suivante: http://fis.ucalgary.ca/fr/339/theatre/TartReligion.htm.
3. Cherchez toutes les occurrences du mot dévot.
Combien de fois voit-on des composés? Quels sont ces composés?
Combien de fois est-ce que le mot (ou un de ses composés) est prononcé
par Tartuffe? par Cléante? Y a-t-il une concentration des occurrences
à des moments particuliers de la pièce? Pour faire ce travail,
vous aurez besoin d'utiliser la fonction recherche dans le site de
l'ABU (voir ci-dessus). Cliquez sur le nombre à gauche pour avoir
le contexte plus complet. Comme noté ci-dessus, les lignes
du fichier ABU ne correspondent pas aux vers de la pièce.
Acte I se termine au vers 426 mais à la ligne 697
Acte II se termine au v. 822 mais à la ligne 1675
Acte III se termine au v. 1183 mais à
la ligne 2332
Acte IV se termine au v. 1572 mais à la ligne
2593
Acte V se termine au v. 1962 mais à la ligne
3648
4. Est-ce que le mot Dieu se rapporte toujours à la religion? Citez des exemples. Quel mot est employé le plus pour renvoyer à Dieu? Quelle conclusion en tirez-vous?
5. Cherchez toutes les occurrences du mot foi. Combien d'occurrences y a-t-il qui n'ont rien à voir avec le mot que vous cherchez? Quels sont ces mots?
Si vous avez des problèmes d'accès
au site de l'ABU, répondez à la question 2 en travaillant
à partir de l'échantillon ci-dessous et aux questions 3 à
5 à partir des fichiers dokwic fournis.
occurrences de quelques mots clés dans le
Tartuffe:
Dévot http://fis.ucalgary.ca/fr/339/theatre/dokwicDevot.html
Dieu http://fis.ucalgary.ca/fr/339/theatre/dokwicDieu.html
Foi http://fis.ucalgary.ca/fr/339/theatre/dokwicFoi.html
Amour http://fis.ucalgary.ca/fr/339/theatre/dokwicAmour.html
MOTS DU FICHIER PAR FREQUENCES DECROISSANTES (échantillon édité)
Liste de fréquences simplifiée
DJM Notes
1. Le nombre de lignes (3648) est bien supérieur au nombre de vers (1962) puisque le texte est établi d'une édition du XIXe siècle. Les didascalies de présentation (identifiant le personnage qui parle) comptent comme ligne dans le fichier mais pas comme vers. D'une façon semblable, lorsqu'un vers est divisé entre deux ou plusieurs répliques, chaque partie du vers compte comme ligne.
2. Pour raccourcir le fichier, j'ai éliminé certains mots grammaticaux (pronoms, prépositions etc.) ainsi que les verbes être, avoir aller, faire, prendre, mettre et les mots avec avec moins de 3 occurrences.
62 coeur
56 rien
52 Ciel
41 Tartuffe
35 homme
34 voir
34 père
34 Madame
33 peu
32 veut
31 âme
30 fort
27 jamais
27 gens
27 frère
26 veux
25 mieux
25 fille
25 Non
25 Dorine
25 Ah
24 fils
24 Mariane
23 vrai
22 Valère
21 zèle
21 moins
21 doute
21 Orgon
20 monde
20 bon
19 yeux
19 doux
19 discours
18 mari
18 grâce
18 crois
18 Damis
17 non
17 mal
17 femme
17 Dieu
16 porte
16 foi
16 Elmire
15 souffrir
15 main
15 croire
15 Cléante
14 céans
13 époux
13 voulez
13 vie
13 temps
13 prie
13 personne
13 beau
12 voeux
12 mère
11 vertu
11 soin
11 bonne
10 vouloir
10 raison
10 gloire
10 faux
9 tête
9 traître
9 maître
9 fâcheux
9 fois
9 courroux
9 bontés
9 biens
9 ardeur
9 amour
8 voulu
8 soins
8 secret
8 plaît
8 petit
8 pauvre
8 hymen
8 honnête
8 devoir
8 coup
8 besoin
8 affaire
7 vivre
7 sens
7 plaire
7 peur
7 nulle
7 nul
7 mérite
7 moindre
7 l'intérêt
7 l'esprit
7 l'amour
7 l'affaire
7 joie
7 honneur
7 efforts
7 dévot
7 coupable
7 bouche
6 éclat
6 user
6 trouble
6 sentiments
6 sage
6 plaisir
6 peine
6 mains
6 l'apparence
6 genoux
6 douceur
6 Hélas
6 Fort
6 Adieu
5 vérité
5 vrais
5 voulez-vous
5 trait
5 tort
5 soeur
5 scandale
5 révère
5 parole
5 pardonne
5 obstacle
5 mériter
5 moyen
5 juste
5 intérêt
5 humeur
5 honte
5 haine
5 franc
5 fou
5 force
5 esprit
5 espoir
5 dévots
5 dévotion
5 défendre
5 donation
5 d'Orgon
5 coups
5 conseil
5 coeurs
5 chère
5 bru
5 bonté
5 blesse
5 beau-frère
5 attraits
5 ami
5 amant
5 aime
5 actions
5 Prince
5 Pernelle
5 Certes
4 éclater
4 voudrois
4 violence
4 veux-tu
4 veulent
4 vers
4 vaut
4 traits
4 surprise
4 sots
4 sein
4 scélérat
4 rire
4 refus
4 péché
4 pure
4 punir
4 pudeur
4 prête
4 présent
4 pieux
4 perfide
4 paroles
4 oreilles
4 noble
4 méchant
4 moquez-vous
4 misère
4 l'orgueil
4 l'avoue
4 fourbe
4 foiblesse
4 flamme
4 fin
4 femmes
4 désirs
4 droit
4 douleur
4 court
4 conscience
4 conduite
4 colère
4 cher
4 cassette
4 bâton
4 bras
4 bonheur
4 aveu
4 affaires
4 action
4 accuser
4 Loyal
4 Laissez
4 J'enrage
4 Ha
3 ô
3 élire
3 vuider
3 vouliez
3 voudriez
3 voudrez
3 voie
3 vit
3 vengeance
3 vains
3 vain
3 usage
3 tromper
3 traiter
3 tour
3 tomber
3 tombe
3 tendresses
3 sûr
3 supplice
3 soupirs
3 soufflet
3 souci
3 sort
3 secrets
3 secours
3 salut
3 sainte
3 sacré
3 repos
3 renoncer
3 recours
3 raisons
3 qu'aucun
3 pur
3 prétends
3 prétendre
3 promis
3 prince
3 pied
3 permis
3 perdu
3 passion
3 parer
3 pardon
3 paix
3 orgueil
3 ordres
3 ordre
3 offense
3 obliger
3 nouvelle
3 nez
3 nature
3 méchante
3 mourir
3 merveilleux
3 meilleur
3 mauvais
3 mariage
3 malheureux
3 là-haut
3 leçons
3 l'éclat
3 l'âme
3 l'oreille
3 l'hymen
3 l'honneur
3 l'homme
3 l'envie
3 l'art
3 l'amitié
3 justice
3 juger
3 intérêts
3 insolence
3 ingratitude
3 heureux
3 gueux
3 grimace
3 glorieux
3 gendre
3 fripon
3 fous
3 feux
3 feu
3 ferveur
3 ferme
3 favorable
3 faveurs
3 faute
3 excès
3 enfants
3 désire
3 désir
3 désespoir
3 démentir
3 droits
3 douce
3 don
3 docteur
3 desseins
3 crédit
3 croyez
3 criminel
3 crimes
3 crime
3 cour
3 convaincre
3 chemin
3 charité
3 charitable
3 bons
3 blâme
3 belle
3 audace
3 aucune
3 armes
3 ardeurs
3 alliance
3 aise
3 Point
3 Laurent
3 Jamais
3 Flipote
--------------------------------------------
Estelle Dansereau Daniel Maher |
Français 339 |
Module 3 |
page créée le 15 août 2001
dernière mise à jour le 13 mars 2003