introduction a une approche instrumentee de la synonymie

introduction a une approche instrumentee de la synonymie
Cahier du CRISCO
n°32
Septembre 2011
ISSN 2116-6242
INTRODUCTION A UNE APPROCHE
INSTRUMENTEE DE LA SYNONYMIE
L’exemple du Dictionnaire Electronique des Synonymes
du CRISCO
Gaëlle DOUALAN
CRISCO
Université de Caen (Bât. Sciences Porte SA S13), 14032 CAEN CEDEX
Tél. : 02 31 56 56 27 — Fax : 02 31 56 54 27 — Site web : www.crisco.unicaen.fr
Courriel direction : franck.neveu@unicaen.fr
Courriel secrétariat : liliane.docquiert@unicaen.fr
Le Centre de Recherches Interlangues sur la Signification en Contexte (CRISCO) contribue au
débat linguistique à l’aide de trois outils éditoriaux :
I
Syntaxe & Sémantique
Revue de linguistique créée en 2000 aux Presses Universitaires de Caen
Responsables de la revue : J. FRANÇOIS & N. LE QUERLER
Comité de rédaction : E. DELENTE, J. FRANÇOIS, E. GILBERT, C. GUIMIER, I. HAIK, M. KRAUSE, D.
LEGALLOIS, V. LENEPVEU, N. LE QUERLER, F. NEVEU, R. RENAULT.
Comité scientifique : P. BLUMENTHAL (Cologne), A. BORILLO (Toulouse-le-Mirail, Toulouse II), M.
CHAROLLES (Sorbonne Nouvelle, Paris III), B. COMBETTES (Nancy II), J.P. DESCLES (Paris-Sorbonne,
Paris IV), D. GEERAERTS (Louvain), B.N. GRUNIG (Paris VIII, Vincennes – Saint-Denis),
P. HIRSCHBUHLER (Ottawa), G. KLEIBER (Sciences Humaines, Strasbourg II), P. KOCH (Tübingen), B.
LAMIROY (Louvain), A. LEMARECHAL (Paris-Sorbonne, Paris IV), R. MARTIN (Paris-Sorbonne, Paris
IV), S. MEJRI (Villetaneuse, Paris XIII), C. VET (Groningen), B. VICTORRI (CNRS, Paris).
n°1
Connecteurs et marqueurs de connexions, sous la direction de Claude GUIMIER (mars 2000)
n°2
Sémantique du lexique verbal, sous la direction de Françoise CORDIER, Jacques FRANÇOIS et Bernard
VICTORRI (avril 2001)
n°3
Les grammaires du français et les “mots outils”, sous la direction de Gudrun LEDEGEN et Nathalie
ROSSI (mars 2002)
n°4
La valence vue d’Allemagne, sous la direction de Peter BLUMENTHAL et Peter KOCH (mars 2003)
n°5
Polysémie et polylexicalité, sous la direction de Salah MEJRI (avril 2004)
n°6
Aux marges de la prédication, sous la direction de Irmtraud BEHR, Jacques FRANÇOIS, Anne
LACHERET-DUJOUR & Florence LEFEUVRE (décembre 2005)
n°7
La terminologie linguistique – Problèmes épistémologiques, conceptuels et traductionnels, sous la
direction de Franck NEVEU (mars 2007)
n°8
Eléments de relation : de la phrase au texte, sous la direction de Claude GUIMIER (décembre 2007)
n°9
Texte, documents numériques, corpus. Pour une science des textes instrumentée, sous la direction de
Mathieu VALETTE (décembre 2008)
n°10
Rhénania : dimensions syntaxiques et sémantiques, sous la direction de Jean-Christophe Pellat et Hélène
Vassiliadou (2009)
n°11
Noms abstraits intensifs et modification adjectivale, sous la direction de Jacques FRANCOIS et de
Nicole LE QUERLER (2010)
II
Bibliothèque de Syntaxe & Sémantique
collection de linguistique créée en 2002 aux Presses Universitaires de Caen
Traits d’union, sous la direction de Nicole LE QUERLER & Georges KLEIBER [Actes des Journées de
Linguistique Rhénane de novembre 2000, organisées par SCOLIA et le CERLICO] (mai 2002)
L’adjectif en français et à travers les langues, sous la direction de Jacques FRANÇOIS [Actes du colloque de
Caen, 28-30 juin 2001] (janvier 2005)
Composition syntaxique et figement lexical, sous la direction de Jacques FRANÇOIS & Salah MEJRI [Actes de
l’atelier franco-tunisien de Caen, septembre 2002] (printemps 2006)
Autour de la préposition, sous la direction de Jacques François, Éric Gilbert, Claude Guimier et Maxi Krause,
(décembre 2009)
III
Cahiers du CRISCO
ISSN 2116-6242
Cahiers de recherche linguistique diffusés par le CRISCO depuis 2000. Les Cahiers du CRISCO sont
distribués gratuitement.
A. Cahiers 1-12 en format papier
n°1
Jacques FRANÇOIS, Sur la grammaire de van Valin (septembre 2000)
n°2
Véronique LENEPVEU, Adjectifs et adverbes : une corrélation syntactico-sémantique (janvier
2001)
n°3
Jacques FRANÇOIS & Hansjakob SEILER, Gespräche
Universalienforschung (mai 2001, version originale en allemand)
n°4
Denis RAMASSE, L’intonation des phrases présentant un détachement à gauche en français : une
première approche (juin 2001)
n°5
Heike BALDAUF, Voyage au bout de la langue : quelques remarques sur des énoncés minimaux
(mars 2002)
n°6
Jacques FRANÇOIS (avec la participation de Hansjakob SEILER, La faculté de langage et les
universaux : perspectives fonctionnalistes actuelles (mars 2002)
n° 7
Catherine CAMUGLI GALLARDO, La langue des jeunes en Italie — Guide à une enquête de
terrain (mars 2002)
n° 8
Jacques FRANÇOIS, La représentation des structures verbo-nominales et du figement verbal dans
deux formalismes de grammaire fonctionnelle (mai 2002)
n° 9
Valeriano BELLOSTA von COLBE & Jacques FRANÇOIS, Windowing of attention and the coreperiphery boundary (septembre 2002)
n° 10/1
Maxi KRAUSE, AUS, élément prépositionnel, élément constitutif de particules diverses et particule
verbale (septembre 2002)
n° 10/2
Maxi KRAUSE, VON, préposition et élément constitutif d’adverbes et de tournures adverbiales
(octobre 2002)
n° 10/3
Maxi KRAUSE, BEI, préposition, élément constitutif de particules diverses et particule verbale
(novembre 2002)
n° 10/4
Maxi KRAUSE, MIT, préposition, élément constitutif de particules diverses et particule adverbiale
(novembre 2002)
n° 11
Richard RENAULT, Morphosyntaxe des participes finnois (décembre 2002)
n° 12
Dominique LEGALLOIS (coordination), Unité(s) du texte [Journée Scientifique du CRISCO, 6
décembre 2002] (juin 2003)
über
Hansjakob
Seilers
B. Cahiers 13-29 téléchargeables sur le site du CRISCO : www.crisco.unicaen.fr
n°13
Jacques FRANÇOIS (dir.), Aspects de la « Role and Reference Grammar » [Journée Scientifique du
CRISCO, 14 mars 2003] (septembre 2003)
n°14
Jacques FRANÇOIS, Jean-Luc MANGUIN & Bernard VICTORRI, La réduction de la polysémie
adjectivale en cotexte nominal : une méthode de sémantique calculatoire (octobre 2003)
n°15
Emmanuelle ROUSSEL, Le commentaire associé au passif anglais (février 2004)
n°16
Corinne OZOUF, Caractère différentiel et relation d’équivalence entre voir et regarder (juin 2004)
n°17
Jean-Luc MANGUIN & Jacques FRANÇOIS (coordination), Le Dictionnaire Electornique des
Synonymes du CRISCO – Un mode d’emploi à trois niveaux (juillet 2004)
n°18
Dominique LEGALLOIS & Song-Nim KWON, Sémantique lexicale et examen écologique de la cooccurrence (janvier 2005)
n°19
Jacques FRANÇOIS, Les bases épistémologiques des grammaires cognitives et ‘néo-fonctionnelles’ (juin
2005)
n°20
Jacques FRANÇOIS, Le fléchage synonymique de la polysémie verbale (octobre 2005)
n°21
Dominique LEGALLOIS & Jacques FRANÇOIS (coordination), Autour des grammaires de
constructions et de patterns (janvier 2006) [avec la participation de Philippe GREA et Morgane
SENECHAL]
n°22
Odile BLANVILLAIN, Le marqueur SUCH en anglais contemporain – Anaphore qualitative et
identification notionnelle (mai 2006)
n°23
Jacques FRANÇOIS & Ahmed BRAHIM (coordination), Morphosyntaxe et sémantique du verbe
(novembre 2007)
n°24
Jacques FRANÇOIS, Une approche diachronique quantitative de la polysémie verbale (janvier 2008)
n°25
Mayu SHINTANI, Une vision rhétorique des expressions BOUT et HASHI – universalité cognitive et
comparaison entre français et japonais (février 2008)
n°26
Jacques FRANÇOIS, Les grammaires de construction, un bâtiment ouvert aux quatre vents (septembre
2008)
n°27
Lise HAMELIN, L’alternance entre complémentation ditransitive et complémentation prépositionnelle :
étude des marqueurs to et for (mai 2009)
n°28
Lise HAMELIN (coordination), Travaux des doctorants du CRISCO 2008-2009 (octobre 2009)
n°29
Jacques FRANCOIS, L’attestation des combinaisons lexicales à l’aide de la base de données
FRANTEXT (janvier 2010)
n°30
Lise HAMELIN (coordination), Travaux des doctorants du CRISCO 2009-2010 (mai 2010)
n°31
Charlotte BAILLEUL (coordination), Travaux des doctorants du CRISCO 2010-2011 (juin 2011)
Gaëlle DOUALAN
Introduction à une approche instrumentée de la synonymie1
L'exemple du Dictionnaire Électronique des Synonymes du CRISCO
Résumé : Le présent travail cherche à exposer quels sont les apports de l'informatique à
la synonymie. Nous avons replacé cette notion sémantique dans le cadre de la
« construction dynamique du sens » énoncée par Victorri et Fuchs. De cette théorie a
découlé une nouvelle représentation du sens sous forme d'espaces sémantiques. C'est
cette nouvelle représentation qui est à l'origine du Dictionnaire Electronique des
Synonymes (DES) : dictionnaire de synonymes permettant de visualiser la répartition des
sens d'une unité lexicale et par là même sa polysémie. Néanmoins, le DES a été conçu à
partir de sept dictionnaires de synonymes français. Une analyse métalexicographique
s'impose afin d'avoir une meilleure compréhension des synonymes qu'il renferme. Mais
en tant que dictionnaire électronique, le DES apporte de nombreuses innovations au
traitement de la synonymie. C'est le cas par exemple de la symétrisation des relations
synonymiques qui comble les oublis des autres lexicographes. L'informatique est surtout
l'occasion d'implémenter des méthodes d'extraction automatique de synonymes afin
d'enrichir le DES avec rapidité et fiabilité. Ces améliorations nous donnent la possibilité
de lutter contre l'obsolescence de la ressource et ainsi conserver la satisfaction des
utilisateurs. Cependant, le DES n'est pas sans comporter quelques faiblesses. Les
premières touchent aux limites de l'apport informatique à la synonymie et les secondes
sont les limites de la notion elle-même, chacune pouvant être révélées par l'hyperonymie
et la diachronie.
Abstract: This dissertation aims at showing the computing contribution to synonymy
studies. We analyze synonymy in the theory called « dynamic construction of meaning »
stated by Victorri and Fuchs. This theory provides a new representation of meaning as
semantic areas. The Electronic Synonym Dictionary (ESD) is based on this new
representation. This synonym dictionary makes it possible to visualize the meaning
representation of an item and thus its polysemy. Nevertheless, seven French synonym
dictionaries were used to design the ESD. A metalexicographical analysis can be useful to
get a better understanding of the synonyms it contains. As an on-line dictionary, the ESD
introduces many innovations in synonymy processing. One example is the symetrization of
synonymic relations that fills in the omissions of others lexicographers. Computer science is
a way to implement automatic synonym extraction methods in order to enhance the quality
of ESD with swiftness and reliability. These improvements allow us to fight against the
obsolescence of this dictionary and hence to keep the users satisfied. However, we are
faced with two kinds of failures with the ESD. The first is related to the limits of the
computing contribution to synonymy studies and the second is the limits of the notion itself,
which hyperonymy and diachrony reveal.
Mots clés : synonymie, dictionnaire électronique, lexicographie, représentation du sens,
informatique
1
Mémoire de Master 1 soutenu sous la direction de Franck NEVEU.
Sommaire
0. Introduction………………………………………………………………………3
1. La synonymie : qu’est-ce que c’est ?........................................12
2. Le Dictionnaire Electronique des Synonymes : aspects
lexicographiques………………………………………………………………23
3. Description du DES : aspects techniques…………………………..…37
4. Les apports de l’informatique à la synonymie……………………...49
5. Quand l’outil remet en cause la notion : l’exemple de
l’hyperonymie………………………………………………………………….69
6. Conclusion……………………………………………………………………….82
Références…………………………………………………………………………..86
Annexe……………………………………………………………………………….89
2
0. Introduction
Le Dictionnaire Électronique des Synonymes du CRISCO nous propose adéquat, à peu
près, approchant, équivalent, pareil, remplaçant, similaire, substitut comme synonymes
de l'entrée synonyme. D'après le tableau de la répartition des synonymes en fonction des
dictionnaires d'origine, nous constatons qu'un consensus se crée autour du mot
équivalent puisqu'il est comptabilisé par 5 dictionnaires sur les sept. On voit donc que la
synonymie possède un lien avec l'équivalence sémantique. Quant aux autres synonymes,
ils proviennent pour la plupart du Bertaud du Chazaud.
synonymes
Guizot
Lafaye
Bailly
Bénac
Larousse
Robert
Du
Chazaud
à peu près
adéquat
approchant
équivalent
pareil
remplaçant
similaire
substitut
Tableau 1 : Répartition des synonymes de synonyme en fonction des dictionnaires
d'origine.
Observons l'espace sémantique de synonyme afin de voir comment se répartissent
les différents synonymes de cette entrée.
Figure 1 : Visualisation de l'espace sémantique de synonyme.
3
L'espace sémantique montre bien la répartition et la connexion des sens. À peu près
évolue vers approchant qui glisse vers similaire qui se termine par pareil. Cependant
équivalent regroupe à la fois similaire, pareil et adéquat, ce dernier terme possédant une
connotation quelque peu logique. Ainsi, équivalent est le synonyme le plus englobant; on
comprend qu'il fasse l'unanimité. Il devient donc inévitable d'étudier ce qui lie et associe
l'équivalence à la synonymie.
0.1. La synonymie : une notion épilinguistique
La synonymie semble une relation naturelle qui fait partie du savoir épilinguistique de
tout locuteur si bien qu'il est difficile de la définir. Interrogez le sens commun et l'on vous
dira que la synonymie est une relation d'équivalence sémantique : deux termes sont
synonymes lorsqu'ils se valent et que l'on peut remplacer l'un par l'autre. Tout le monde
pense savoir de quoi il s'agit et ainsi donne un sens large à cette notion, un sens trop
large et trop flou pour en faire une notion réellement scientifique. On comprend dès lors
la nécessité de recadrer plus rigoureusement cette notion. Le discours scientifique
nécessite une définition rigoureuse de la notion. Quant à lui, le savoir épilinguistique se
contente d'une définition plus large et plus souple qui convient à tous les locuteurs, tant
que cette définition ne remet pas en cause l'intercompréhension.
Cette idée d'une synonymie assimilable à une équivalence de sens n'est pas récente
puisque déjà Furetière2, dans son dictionnaire, définissait synonyme de cette manière :
Synonyme : adj. m. & f. Mot qui signifie la même chose qu'un autre. Voilà deux dictions, deux termes
synonymes, qui ne disent pas plus l'un que l'autre. (Furetière, 1690/1978)
Nous ne remettons pas en cause la définition de Furetière. Elle était assurément valable à
l'époque à laquelle il a écrit son dictionnaire. Cependant, cette définition nous sert à
illustrer notre propos : les locuteurs ont tendance à considérer la synonymie comme une
relation d'équivalence sémantique d'après leur savoir épilinguistique. Furetière, avec son
dictionnaire, entendait rendre compte de manière objective de la langue parlée à son
époque. Il n'avait pas le souci d'intervenir dans la manière d'utiliser cette langue mais
seulement d'en exposer l'usage. Malgré sa démarche qui relève d'une certaine
objectivité, le but de Furetière n'était pas de définir avec scientificité la synonymie mais
seulement d'en donner la définition qui était pratiquée par les locuteurs. Il s'attache donc
davantage à donner la définition pratiquée par les locuteurs selon leur savoir
épilinguistique au lieu de s’attacher à une définition provenant d'un quelconque savoir
scientifique, qui n'avait pas encore cours à cette époque. En revanche, quelques années
plus tard, Girard, dans son traité sur les synonymes La Justesse de la langue françoise
(1718) donne une autre définition de la synonymie. Il ne s'agit plus d'une équivalence
sémantique. Au contraire, il cherche à mettre au jour les différences imperceptibles qui
existent entre les mots. Précisons toutefois que l'ouvrage de Girard ne traite que de la
synonymie. Il n'est nullement question d'un dictionnaire de langue. Ainsi, il est
compréhensible qu'une plus grande attention soit portée sur la définition de ce qu'il
entend par synonymie. De ce fait, sa définition revêt un caractère plus rigoureux, plus
« scientifique » oserons-nous dire, puisque dépourvue de tout ancrage dans le savoir
épilinguistique. Il n'en demeure pas moins que cela montre une certaine instabilité de la
définition de la notion qui balance entre savoir épilinguistique et savoir linguistique. Cette
instabilité participe du changement lexical, faisant glisser le sens d'un mot vers d'autres
significations.
Ainsi, comme tous les mots, le mot synonymie a connu des changements de sens.
Son sens évolue avec le temps. En attestent les extensions données au mot synonyme
en tant qu'adjectif : dans le Dictionnaire historique de la langue française 3, on peut lire :
2
3
Furetière, 1978, tome 3.
Rey, 1992.
4
« Par figure, « être synonyme de » signifie (XIXème siècle) « évoquer une notion
équivalente à » » (Rey, 1992 : 2067). D'ailleurs, Littré place les adjectifs synonyme et
équivalent comme synonymes dans un renvoi de l'article Synonyme. Nous remarquons
que, dans la langue, synonymie et équivalence sont souvent associées par le savoir
épilinguistique. La synonymie est considérée comme une équivalence de sens.
Cependant, ce terme d'équivalence est polysémique. Est équivalent ce qui est
rigoureusement égal sur le plan logique. En revanche, équivalent peut avoir un sens
beaucoup plus lâche qui serait une égalité approximative, une ressemblance. Ainsi, la
synonymie, étant associée à l'équivalence, suit, elle aussi, ce glissement sémantique ce
qui tend à la rendre polysémique à son tour. Elle prend donc un sens plus large, plus
simple à manier, moins contraint et qui peut donc recouvrir un grand nombre de réalités.
De là, elle s'étend de l'équivalence sémantique au sens strict (équivalence en tant
qu'égalité) à l'analogie sémantique en tant qu'approximation sémantique. Intéressonsnous désormais à l'analogie.
0.2. Analogie et renvois
0.2.1. Synonymie et analogie
Le Robert4 définit l'analogie comme une « relation entre les mots qui sont apparentés par
le sens, les mots d'un même champ sémantique » (Rey, 2008 : 89). Cette définition nous
montre que l'analogie est une relation sémantique plus lâche que la synonymie. En effet,
elle est constituée de nuances, ou dirons-nous d'un continuum de nuances qui s'étend de
la synonymie à l'analogie. La synonymie est une relation sémantique très pauvre en
nuances afin de garder la meilleure substituabilité possible. En revanche, les nuances
sont constitutives de la notion d'analogie. Cela en fait donc une notion moins précise et
moins rigoureuse. Par conséquent, nous nous intéresserons dans cette étude à la
synonymie, débarrassée de la notion d'analogie.
Bertaud du Chazaud définit ensemble la synonymie, l'analogie et la notion de « sens
voisin » dans son Dictionnaire de synonymes et mots de sens voisin (2003). Ces trois
notions sont donc rapprochées les unes des autres, comme si elles étaient synonymes
entre elles ou tout du moins, comme si une certaine analogie les liaient. On peut donc
penser que Bertaud du Chazaud, dans son dictionnaire, ne relève pas seulement les mots
synonymes mais qu'il étend cette notion à l'analogie et à celle de « mots de sens
voisin ». En effet, il propose que son dictionnaire soit « une extension de la synonymie
vers l'analogie » (Bertaud du Chazaud, 2003 : 10)5. Cela confirme le fait que l'analogie
semble un prolongement de la synonymie, comme si la seule notion de synonymie n'était
pas suffisante pour faire un dictionnaire.
Avec l'analogie, ce n'est pas seulement la notion de synonymie en elle-même qui se
trouve étendue mais aussi ce que renferme les dictionnaires dits de synonymes. Ils ne se
limitent plus seulement à des synonymes, ils poussent leur compilation jusqu'à l'analogie.
Cela est dû parfois à l'idée selon laquelle l'analogie serait comme un synonyme de la
synonymie, la première pouvant servir à définir la seconde. Voici ce qui est dit dans le
Larousse du XXème siècle : synonyme « se dit des mots qui ont entre eux une analogie
générale de sens, mais avec des nuances différentes d'acception » (Augé, 1933 : 552).
Bertaud du Chazaud précise que « contrairement à l'idée reçue, le sens n'est donc pas le
critère majeur pour définir la synonymie, il faut d'abord qu'intervienne le critère
grammatical » (Bertaud du Chazaud, 2003 : 9)6. En effet, il définit l'analogie comme
nécessitant un critère de sens mais non un critère grammatical. L'analogie est une
association d'idées, un noyau de sens entouré d'une nébuleuse d'autres sens plus diffus.
Elle a trait au champ sémantique, elle peut donc regrouper des mots de différentes
catégories grammaticales. Nous verrons plus loin que ce n'est pas le cas de la synonymie
4
Rey, 2008.
Bertaud du Chazaud, 2003, préface.
6
Ibid.
5
5
comme l'a dit Bertaud du Chazaud7.
0.2.2. Les renvois synonymiques
Nous retrouvons également l'analogie dans les dictionnaires de langue, comme par
exemple Le Grand Robert de la langue française (1985) dont le sous-titre n'est autre que
« Dictionnaire alphabétique et analogique de la langue française ». Le lien avec l'analogie
est donc clairement marqué. En effet, le dictionnaire dispose d'un système de renvois
analogiques indiqués par un signe conventionnel (=>). Dans la préface de la deuxième
édition, on peut lire que
ce système [analogique] est une pédagogie du vocabulaire. Ce type de dictionnaire est le seul où, ne
connaissant pas ou ayant oublié une forme de la langue, l'utilisateur a les plus fortes chances de la
trouver (de la retrouver) de la manière la plus naturelle qui soit, c'est-à-dire au moyen des formes qu'il
maîtrise déjà (Rey, 1985 : LI).
Ainsi, les renvois dans les dictionnaires ont un but pédagogique, ils sont une aide à la
production, de texte bien souvent. Ils ne sont présents qu'à titre indicatif, ils complètent
la définition. Certes, les exemples sont là à cet effet. Ils apportent des attestations de
l'entrée en discours. Seulement, il est dit dans Le Lexis Le Dictionnaire érudit de la
langue française (2009) que : « l'exemple est lui-même précisé par la mention de
synonymes et de contraires » (Dubois, 2009 : XII). Les synonymes sont donc vus comme
des aides à la définition et à la compréhension. En plus de la définition qui est censée
définir l'entrée en langue et en plus des exemples qui apportent des contextes d'emploi
de l'entrée, les renvois analogiques étendent le champ définitoire à des relations de sens
plus lâches que sont les « synonymes » ou les « rapports logiques » (nous entendons par
rapports logiques : métonymie, synecdoque...).
La présence de synonymes en tant que renvois dans des dictionnaires de langue
s'expliquent par le soutien à la compréhension qu'ils peuvent apporter, mais surtout ils
contribuent à l'élargissement de la définition et créent des connexions entre des termes
que l'ordre alphabétique ne rend pas voisins. Ils sont le moyen d'introduire des relations
analogiques entre les entrées. Ainsi, les dictionnaires de langue étendent leurs
compétences à celles des dictionnaires analogiques.
0.3. La définition synonymique : problème de lexicographie
Les synonymes ne sont pas uniquement présents dans un dictionnaire de langue en tant
renvois analogiques. La synonymie est également présente dans les articles dédiés aux
entrées. Dès lors, ils font partie de la définition, ils sont la définition même. Ce ne sont
plus des ajouts présents à titre indicatif. Comme le dit B. García-Hernández, « la
synonymie périphrastique est un recours habituel dans les définitions lexicographiques »8
(García-Hernández, 1997 : 386). En effet, on trouve aisément des définitions
lexicographiques comportant des synonymes lorsque les lexicographes ne se contentent
pas d'un synonyme pour toute définition. La synonymie est parfois utilisée comme
procédé lexicographique, mais elle est une facilité dont les lexicographes ne devraient
guère faire usage. Cela fait dire à Littré, dans sa préface du premier tome 9, que « la
synonymie touche à la lexicographie par quelques points qui ne doivent pas être
négligés » (Littré, 1968 : 140). En effet, il rappelle que
la définition des mots est une des grandes difficultés de la lexicographie. Quand on fait un dictionnaire
d'une langue morte ou d'une langue étrangère, la traduction sert de définition; mais, quand il faut
expliquer un mot par d'autres mots de la même langue, on est exposé à tomber dans une sorte de
cercle vicieux ou explication du même par le même (Ibid. : 140).
7
Voir le point 1.2.4. sur la place de la catégorie grammaticale dans la synonymie.
8
« la sinonimia perifrástica es un recurso usual en la definición lexicográfica ».
Littré, 1968, préface.
9
6
Littré soulève ce point dans sa préface car il constate de nombreuses définitions
synonymiques dans le dictionnaire de l'Académie. « Ainsi, le Dictionnaire de l'Académie
définit fier par hautain, altier; il définit hautain par fier, orgueilleux. Évidemment, il y a là
un défaut duquel il faut se préserver » (Ibid. : 140). Il met au jour un problème
lexicographique majeur qui est la circularité des définitions. Effectivement, il est très
difficile de définir un terme d'une langue dans cette même langue. Il arrive souvent que
ce soit la synonymie qui soit utilisée dans ces cas. Cela peut porter préjudices aux
dictionnaires de langue. Lafaye10, à son tour, critique les dictionnaires de langue ayant
recours à la synonymie et plus particulièrement le dictionnaire de l'Académie :
ils [les dictionnaires de langue] désignent d'une manière générale et approchante l'ordre d'idées exprimé
par le mot donné, sans insister sur la place qu'il y occupe, sur le caractère particulier qui le distingue
comme espèce dans le genre » (Lafaye, 1858 : X).
De ce fait, Lafaye conclut que les dictionnaires des synonymes « sont, en ce qui regarde
les définitions, des compléments des dictionnaires ordinaires » (Ibid. : X). En effet,
Lafaye conçoit les dictionnaires des synonymes comme devant apporter des définitions
des entrées mais surtout des distinctions entre ces mêmes entrées. En fait, chaque
article de dictionnaire comporte plusieurs mots-vedette qui sont définis ensemble. Dès
lors, les distinctions données par le synonymiste servent à percevoir les divergences
aussi infimes soient-elles qui distinguent ces mots. Ainsi, cela permet de savoir les
employer correctement. Nous évoquerons plus loin la théorie des synonymes que
développe Lafaye dans son dictionnaire des synonymes11.
A. Collinot, dans une étude sur l'hyponymie dans le discours lexicographique
(Collinot, 1990), évoque également la synonymie dans les définitions lexicographiques. Il
explique que l'hyponymie procède de deux manières dans les définitions : par
transformation ou par équivalence synonymique. Ce second procédé est celui qui est
critiqué par Littré et Lafaye, surtout lorsqu'il en est fait abus. Collinot met au jour un
continuum synonymique dans les définitions allant d'une synonymie syntagmatique à une
synonymie paradigmatique. La première ne touche en rien à la substituabilité en
contexte. De synonymie, elle n'a que le nom. En revanche, la seconde répond à ce critère
de substituabilité. En effet, l'idée même de paradigme sous-entend celle de substitution.
Collinot précise que « l'hyperonymie serait de ce dernier type » (Ibid. : 62). Par
conséquent, il est fréquent de retrouver la synonymie dans des définitions
lexicographiques mais elle se partage le terrain avec l'hyperonymie.
0.4. L'étymologie de la synonymie
Quelles sont les évolutions sémantiques subies par la notion de synonymie ?
0.4.1. Étymologie aristotélicienne
Synonyme vient du grec sunônumos formé à partir de sun qui « signifie « ensemble » et
indique l'idée de réunion, de communauté » (Rey-Debove, 2004 : 1663) et onoma qui
signifie « nom ». Cela pourrait se traduire par « prendre des noms ensemble ». Ainsi, il
serait question de regrouper des noms ensemble selon des critères probablement
sémantiques. En grec ancien, sunônumos formait un couple avec homônumos :
en raison du sens voisin de homos et de sun, homônumos et sunônumos commencent en grec par être
... synonymes, l'un et l'autre en qualifiant des porteurs différents du même nom. Ainsi, s'explique sans
doute l'apparition tardive et l'extrême rareté (avant Aristote) du second, qui n'était qu'un doublet du
premier » (Aristote, 2002 : 243)12.
10
Lafaye, 1858.
Voir la sous-partie consacrée à Lafaye et son dictionnaire de synonymes.
12
Aristote, 2002, glossaire.
11
7
A l'origine, homônumos et sunômumos ont pour idée commune celle de la ressemblance
entre des unités lexicales qui se trouvent par là associées. « homo » signifie « semblable,
le même » (Rey-Debove, 2004 : 831). Les homonymes sont donc des noms qui se
ressemblent. Quant aux synonymes, ce sont des noms qui peuvent être mis ensemble.
Mais s'ils sont mis ensemble, c'est bien parce qu'ils se ressemblent d'une manière ou
d'une autre. Ainsi, sunônumos et homônumos transcrivent la même idée de
ressemblance ce qui explique qu'ils soient pris comme synonymes. Toutefois, des deux
termes pour désigner la même chose, un seul était principalement employé, l’autre étant
superflu.
Cependant, « Aristote, réutilisant les deux composés possessifs synonymes (au sens
moderne) que la langue lui fournit, leur donne le statut d'un couple linguistique
d'opposés » (Ibid. : 244). Ainsi, dans les Catégories (présentation, traduction et
commentaires de F. Ildefonse et J. Lallot), Aristote écrit :
[1a] On dit synonymes les items qui ont le nom en commun, et dont l'énoncé de l'essence,
correspondant au nom, est le même par exemple [on dit] zôion [être animé] pour l'homme et pour le
bœuf; [on les dit synonymes] car on les appelle tous les deux du commun nom de zôion et l'énoncé de
l'essence, correspondant au nom, est le même. Si en effet, on doit donner la définition de chacun d'eux,
de ce que c'est, pour chacun d'eux, d'être zôion, on donnera la même définition (Ibid. : 59).
En résumé, « sont synonymes les choses qui se rangent sous un même genre (et à
ce titre peuvent être désignées par le nom du genre) » (Ibid. : 245). Cette idée de genre
renvoie à la notion d'hyperonymie. Ainsi, la définition aristotélicienne de la synonymie
semble avoir trait à la notion d'hyperonymie telle que nous l'employons aujourd'hui. En
effet, d'après la définition d'Aristote, deux noms sont synonymes dès lors qu'ils peuvent
être regroupés sous la dénomination d'un autre terme, plus général qui leur tient lieu de
nom générique. On peut donc considérer que des synonymes au sens aristotélicien sont
en réalité ce que l'on nomme des cohyponymes. Ils sont des termes de moindre
généralité qui peuvent être rattachés à un terme générique. Ainsi, ce qui est pris en
compte avec cette relation de synonymie est non pas les différences inhérentes à chaque
individu mais bien plus la ressemblance qui les lie. Ainsi, les différences semblent
s'effacer pour ne laisser place qu'à la similitude.
« La postérité gardera le couple mais en changeant son sens » (Ibid. : 244). Le sens
d'homonyme ne changera pas mais le terme synonyme perdra son sens ancien pour
prendre le sens moderne que nous lui connaissons aujourd'hui. L'idée de ressemblance
demeurera mais pas nécessairement celle de genre. De même, l'idée de similitude
perdurera mais elle sera parfois éclipsée au profit de celle de distinction, surtout chez les
lexicographes.
Précisons toutefois que Aristote « s'en tient à l'interprétation originaire des deux
composés comme composés possessifs, ce qui implique qu'ils s'appliquent, non à des
désignations (noms, mots), mais à des entités désignées (que, pour simplifier, on
appellera ici des « choses ») » (Ibid. : 243). Avec Aristote, ce qui est synonyme ce sont
les référents, les entités désignées et non les signifiants en tant que désignations. Ainsi,
ce qui est, avant tout, pris en compte, c'est le monde, la réalité extralinguistique, les
unités de la langue étant secondes.
0.4.2. Changement de sens
Voici le début de la définition de synonyme donnée par le Dictionnaire culturel en langue
française (2005) :
vx. Qui désigne une chose de même genre (et dont on n'envisage pas la différence spécifique : ex chêne
et hêtre). En linguistique moderne, ce concept est appelé cohyponymie » (Rey, 2005 : 1176).
Ceci correspond à la définition première de la notion telle qu'on la rencontrait dans la
langue grecque. Ainsi, à l'origine, la synonymie est une relation sémantique de l'ordre de
l'hyperonymie. Comme nous l'avons dit, elle masque les différences pour mettre en avant
les similitudes entre les entités. Le Dictionnaire historique de la langue française (1992)
8
retrace le changement de sens de la notion: « Chez Aristote, la notion, en logique,
concerne des noms dont le sens est lié (sun) par un genre commun, mais qui ont des
sens différents » (Rey, 1992 : 2067).
Par la suite, le terme synonymie « s'applique au XVIème siècle à un mot qui a avec un
autre, une analogie de sens (genre commun) mais des acceptions différentes » (Ibid. :
2067). A partir de la Renaissance, on remarque donc un changement du sens du mot
synonyme, changement qui se traduit en réalité par un glissement sémantique. En effet,
la définition aristotélicienne faisait de la synonymie une cohyponymie. Mais le point
crucial de cette définition était l'idée d'une entité générique fédérant les termes
synonymes grâce à leurs similitudes. C'est d'après cette idée que la notion de synonymie
a changé de sens. Au XVIème siècle, subsiste donc l'idée d'un genre commun qui se
retranscrit sous la forme d'une analogie. C'est cette idée même qui sert à définir la
synonymie. Puis, « à l'époque classique et surtout à partir du XVIIIème siècle, la notion,
par refus de l'approximation et du cumul, évolue vers l'idée moderne de « mot de même
sens qu'un autre, mais pouvant différer par un autre aspect » » (Ibid. : 2067). Ainsi,
c'est par rejet du caractère flou de la définition du XVIème siècle qu'est apparue la
définition de la synonymie telle que nous la connaissons aujourd'hui. Avec l'idée de « mot
de même sens », on retrouve la définition, donnée par Furetière dans son dictionnaire
universel, d'une synonymie qui serait une équivalence sémantique. Cependant, cet autre
aspect, pour lequel peuvent différer des synonymes, rejoint assurément l'idée qu'avait
Girard de la synonymie. Les synonymes diffèrent par d'imperceptibles nuances souvent
dues aux contextes d'emploi des unités lexicales. Nous aboutissons donc à la synonymie
telle que nous la connaissons.
L'étude de l'étymologie de la synonymie nous éclaire sur le fait qu'elle soit très liée à
l'analogie. Dans sa définition première, la synonymie revêtant un caractère
hyponymique, avait trait au genre commun et donc d'une certaine manière à une forme
d'analogie. Cette idée d'analogie a progressivement disparu de la définition même de la
synonymie. Cependant, elle s'est conservée dans le savoir épilinguistique des locuteurs
qui ont une définition large de la synonymie. On comprend donc mieux que la synonymie
et l'analogie puissent être confondues ou associées.
Après avoir considéré le sens qu'a pu prendre la notion de synonymie au fil des
siècles, intéressons-nous à son traitement dans les ouvrages de linguistique et les
grammaires.
0.5. La synonymie dans les ouvrages de linguistique et de grammaire
0.5.1. La synonymie dans les grammaires
Après avoir consulté différentes grammaires et ouvrages de linguistique de facture plutôt
récente, nous avons noté quelques thèmes récurrents dans la définition de la synonymie.
C'est une relation entre deux signifiants ayant un même signifié. Au plan logique, la
synonymie est une implication réciproque. Cependant, cette définition contrevenant au
principe d'économie de la langue demeure insuffisante car elle ne tient pas compte du
contexte discursif. Cela aboutit à considérer deux types de synonymies : l'une partielle,
l'autre totale. La première, correspondant à une définition large de la synonymie et qui
tient compte du contexte, se rencontre bien plus fréquemment que la seconde qui
équivaut à la définition logique de l'implication réciproque.
Il ne semble […] pas exister véritablement de synonymes absolus et nombre de dictionnaires de
synonymes, depuis le modèle fameux de Girard au XVIIIème siècle, nous en offrent pour ainsi dire
l'illustration en s'attachant à nous montrer les différences parfois subtiles qui séparent des mots très
proches par leurs sens.
C'est pourquoi les linguistes qui adoptent une définition très étroite de la synonymie sont
généralement conduits à remettre en cause la notion même de synonymie et préfèrent parler dans tous
les cas de parasynonymes ou de synonymes approchés. Mais ne vaut-il pas mieux s'en tenir à la
définition large de la synonymie, ne serait-ce que pour s'accorder avec l'usage courant et éviter ainsi
9
discussions et malentendus inutiles ?13 (Nyckees, 1998 : 181-182).
La synonymie partielle requiert un contexte car c'est lui qui détermine si deux termes
sont substituables. Deux unités lexicales seront dites substituables si elles « ne font subir
aucune modification sémantique à l'énoncé » (Neveu 2004 : 281). De même, les aspects
dénotatifs et connotatifs du langage rentrent en compte dans la relation de synonymie.
Pour les auteurs de la Grammaire méthodique du français14, « la synonymie totale n'est
concevable qu'au plan strictement dénotatif » (Riegel, Pellat & Rioul, 1994/2009 : 927).
Cela signifie que les connotations apportent des distinctions entre des synonymes,
principalement sur le plan socioculturel d'après les auteurs de la Grammaire
d'aujourd'hui15. D'ailleurs, Dubois16 dans son dictionnaire de linguistique fonde deux
types de synonymies : la synonymie complète et la synonymie incomplète sur le critère
dénotation / connotation. Selon lui, une synonymie est complète dès lors que les termes
se recouvrent tant sur le plan dénotatif que connotatif. Quant à elle, la synonymie
incomplète se limite à la dénotation.
Certes, dans les différentes grammaires que nous avons étudiées, la synonymie
prend divers aspects selon que l'accent est mis sur certaines de ces caractéristiques.
Cependant, certains points sont récurrents : la substituabilité, l'aspect partiel de cette
notion et les divergences entre plan dénotatif et connotatif. Cela jette les bases des
points à aborder lors de notre définition de la synonymie, points que nous ne
manquerons pas de traiter.
0.5.2. La synonymie dans les ouvrages de linguistique : l'exemple de Saussure
Dans son Cours de linguistique générale (1916/1986), F. de Saussure ne consacre aucun
point de ses réflexions à la synonymie dans le cadre d'une théorie sémantique.
Cependant, il évoque la synonymie en ces termes :
Dans l'intérieur d'une même langue, tous les mots qui expriment des idées voisines se limitent
respectivement : des synonymes comme redouter, craindre, avoir peur n'ont de valeur propre que par
leur opposition; si redouter n'existait pas, tout son contenu irait à ses concurrents » (Saussure,
1916/1986 : 160).
Pour Saussure, on n'introduit pas de pensable dans une langue. Les rares cas où du
pensable peut être introduit dans la langue correspondent à l'apparition d'un nouveau
référent. Si un référent vient à disparaître, le mot qui le désignait tend également à
disparaître. En revanche, le phénomène inverse se rencontre peu : si un mot disparaît, le
référent n'en disparaît pas pour autant. Il change seulement de désignation. Ainsi, un
autre mot hérite de la signification de ce mot disparu. La signification ne se perd pas, elle
est redistribuée. C'est ce qu'entend démontrer Saussure avec l'exemple sur redouter,
craindre et avoir peur.
Pour Saussure, les mots n'ont de valeur que les uns par rapport aux autres. Il prend
pour exemple des mots qui expriment des idées voisines. S'il fallait les représenter
graphiquement par des surfaces, ces mots se recouperaient assurément. Les seules
parties de leur représentation graphique qui ne se recouperaient pas seraient justement
ce qui est unique et particulier à chaque mot. Cela rejoint les représentations graphiques
que suggère Lafaye dans sa théorie des synonymes, anticipant par là même les
diagrammes de Venn (voir Annexe 4). La théorie de Lafaye est l'aboutissement de tous
les travaux effectués au cours du XVIIIème et XIXème siècle par les synonymistes. Pour ces
synonymistes, les synonymes possèdent des différences infimes qu'ils cherchent à mettre
au jour afin de distinguer correctement ces mots synonymes les uns des autres. Les
travaux des synonymistes corroborent le propos de Saussure quant à la valeur des mots.
13
Nyckees (1998 : 181-182) cit. Neveu (2004 : 281).
Riegel, Pellat & Rioul, 2009.
15
Arrivé, Gadet & Galmiche, 1986.
16
Dubois, 2007.
14
10
Ces ouvrages de linguistique soulignent l'aspect partiel de la synonymie. Nous
définirons plus en profondeur cet aspect de la synonymie mais nous entrevoyons que
c'est là la pierre angulaire des problématiques abordant la synonymie. En effet, les mots
sont substituables entre eux en fonction du sens qu'ils prennent en contexte. Ainsi, deux
mots synonymes ne le sont que dans certains cas particuliers. On remarque donc que la
synonymie est une relation sémantique extrêmement difficile à saisir du fait des multiples
possibilités qu’offre l'association des sens des unités lexicales à tous les contextes
possibles. Une entreprise envisageable serait de dépasser l'activité lexicographique qui
consiste à répertorier les sens d'un mot. Il faudrait pouvoir systématiser cette opération
pour la rendre à la fois automatique et fiable. Cela pourrait éventuellement prendre la
forme d'une représentation géométrique comme le suggérait Lafaye. Mais qui dit
représentation géométrique et automatisme, dit mathématiques et informatique. Ainsi,
une meilleure compréhension de ce qu'est la synonymie passerait par une étape
d'informatisation de cette notion.
Cela nous amène donc à considérer une approche instrumentée de la synonymie. En
quoi pourrait consister une telle approche ? De nos jours, instrumentation rime avec
informatique, si bien que les nouveaux outils de recherche linguistique passent
nécessairement par l'informatique. Cela a donné naissance à une nouvelle discipline : la
linguistique informatique qui cherche comment l'informatique peut être mise au service
de la recherche linguistique. Ces outils informatiques apportent systématisation,
automatisation, rigueur et rapidité aux recherches. Dans notre cas, nous nous
restreindrons au domaine de la sémantique puisque la synonymie est une relation de
sens. Précisons que nous nous intéressons exclusivement à la synonymie au travers de
l'exemple que constitue le Dictionnaire Electronique des Synonymes du CRISCO
Avant toute chose, nous devons définir ce que nous entendons par synonymie car
comme nous venons de le voir dans cette introduction, ce n'est pas une notion qui va de
soi. Cependant, il faut replacer notre définition dans un cadre théorique de sémantique
linguistique si bien que nous devons au préalable préciser ce que nous entendons par
sens et référence. Enfin, après avoir exposé notre définition de la synonymie, nous
développerons les divers aspects que recouvre cette notion. Comme nous avons décidé
de nous intéresser à la synonymie par l'intermédiaire du DES, il nous faut expliciter sa
genèse lexicographique. Revenir sur son fondement, c'est en avoir une connaissance
approfondie, mieux en faire le tour et déceler d'éventuelles limites. Pour cela, nous nous
attarderons sur les sept dictionnaires constitutifs du DES ainsi que sur les
caractéristiques de ce dictionnaire. Une description technique de la ressource s'impose
pour avoir connaissance de toutes les fonctionnalités qu'elle offre et qui, d'ailleurs,
permettent un traitement approfondi de la synonymie. Tous ces aspects techniques n'ont
pu voir le jour que grâce à l'informatique. L'existence du DES constitue déjà, en soi, un
apport de l'informatique à la synonymie. Le succès du DES devient patent lorsqu'on
s'arrête sur les statistiques de fréquentation. Cependant, cette ressource peut
continuellement être enrichie à l'aide de méthodes automatiques. Toutefois,
l'informatique révèle aussi les limites du DES et par là, celles de la synonymie. Cela se
traduit notamment sur le plan diachronique. Enfin, nous avons choisi l'exemple de
l'hyperonymie pour mettre au jour les faiblesses du DES et des synonymes qu'il propose
mais aussi pour expliquer ces faiblesses.
11
1. La synonymie : qu'est-ce que c'est ?
1.1. La synonymie : une relation de sens
On comprend aisément que la synonymie soit une relation sémantique. Mais avant de la
définir davantage, une précision s'impose : qu'entend-on par sens ? De quoi s'agit-il ?
Comment peut-on le définir ? De cette définition découlera la conception que l'on aura de
la synonymie. Nous prendrons le parti de définir le sens en lien avec la référence. Le lien
que ces deux notions entretiennent sera exposé dans le corps de notre réflexion.
1.1.1. Définitions du sens et de la référence
G. Kleiber pose cette question : « le sens doit-il être conçu en termes référentiels ou non
? » (Kleiber, 1997 : 9). Les linguistes ont cherché à y répondre et ils ont mis en œuvre
diverses théories pour tenter d'apporter une solution à ce problème :

La théorie objectiviste : la référence est une relation langue-monde, un lien entre le
monde réel et les expressions linguistiques. Toutefois, cette théorie a tendance à réduire
les langues à des nomenclatures avec d'un côté le monde et de l'autre le langage, sans
compter que l'objectivisme implique un point de vue objectif sur le monde, ce qui n'est
vraisemblablement pas possible.

La théorie constructiviste : elle s'oppose à l'objectivisme en ce qu'elle considère qu'il
n'y a pas de réalité objective mais seulement un monde perçu. Cependant, pour éviter le
travers du constructivisme pur, il est essentiel de prendre en compte le « sentiment
d' « objectivité » que peut dégager ce monde « projeté » » (Ibid. : 13). Il bénéficie d'une
« stabilité intersubjective » (Ibid. : 13). En effet, « nos conceptualisations ou notre
modèle mental du monde est largement identique d'un individu à l'autre et forme une
sorte de socle pour une intercompréhension réussie » (Ibid. : 14).
Il ne faut pas oublier que « le langage en tant que système de signes est tourné vers
le dehors […] parce qu'un signe n'est signe que s'il représente quelque chose d'autre que
lui-même » (Ibid. : 16). Le sens porté par les signes est donc tourné vers la référence.
Précisons seulement avec Neveu que « la notion de référence, du point de vue
linguistique, gagne en consistance si elle est décrite comme un ensemble de phénomènes
liés à la référenciation » (Neveu, 2004 : 251), en sachant que « la référenciation peut
être définie comme un acte consistant à saisir les objets du monde (physiques ou
conceptuels), et à les présenter en discours » (Ibid. : 251).
Maintenant déterminons quel est le rapport qu'entretiennent le sens et la référence :
soit « le sens conditionne la référence ainsi il doit être décrit en termes référentiels »
(Kleiber, 1997 : 20), soit il doit demeurer intact, c'est-à-dire sans aucun rapport avec la
référence, ainsi il sera décrit en des termes non référentiels.
Dans le cas d'un sens référentiel, « une expression linguistique pose donc des
conditions qui doivent être remplies pour que la référence à des occurrences particulières
au moyen de cette expression puisse avoir lieu » (Ibid. : 21). « Le sens établit les
conditions de possibilités générales d'une désignation » (Ibid. : 22). Étant référentiel, il
est « conçu comme un ensemble de conditions d'applicabilité référentielle » (Ibid. : 34).
Le sens préexiste à la référence, elle en est dépendante. Bien sûr, l'aspect conventionnel
du langage est pris en compte dans une telle perspective. En résumé, le sens en tant que
mode de présentation du référent permet la sortie vers le réel.
En revanche, un « sens aréférentiel » (Ibid. : 23) prend en compte le « caractère
dynamique » du sens. C'est « une interprétation négociée ou renégociée par les
interlocuteurs à chaque emploi ou construite à chaque fois contextuellement c'est-à-dire
par son environnement linguistique » (Ibid. : 24) Une telle perspective ne laisse pas
place au hors-contexte, elle ne considère que le discours et non la langue. Elle omet
l'aspect conventionnel du langage qui en est pourtant un aspect fondamental. C'est la
convention qui fait que le langage est un code de communication qui peut être utilisé par
tous les locuteurs d'une même langue. S'il n'y avait pas d'aspect conventionnel du
12
langage, chaque locuteur resterait figé dans sa propre idiosyncrasie et il ne pourrait pas y
avoir d'échanges communicationnels. D'ailleurs, s'il y a compréhension entre les
locuteurs, c'est qu'il doit y avoir un socle commun de signification qu'ils partagent, socle
qui, justement, sert de base à la renégociation du sens.
Cela nous conduit à penser que la perspective du sens aréférentiel omet l'aspect
conventionnel de la langue tandis que le sens référentiel ne tient pas compte de la
renégociation sémantique qui s'opère en contexte. Ainsi, ces deux perspectives ne
suffisent pas à rendre compte de la réalité du sens, réalité complexe qui nécessite la
fusion de ces deux théories. Cela aboutira à la conception dynamique du sens que nous
traiterons dans le point suivant.
Revenons un instant sur le sens et évoquons une autre manière de le subdiviser dont
il sera question ultérieurement. Ainsi, le sens peut se diviser en :

un sens dénotatif qui est la partie stable de la signification autrement dit la partie
commune à tous les locuteurs. En un mot, c’est la part conventionnelle de la signification
dans le langage.

un sens connotatif qui regroupe les traits non stables, subjectifs et variables en
contexte d'une signification. Cela correspond à toutes les influences contextuelles que
peut subir le sens.
Vu sous cet angle, nous remarquons donc que le sens est à la fois conventionnel et
construit en contexte, ce qui rejoint, à nouveau, la conception dynamique du sens.
Enfin, pour en revenir aux deux théories exposées dans ce point, le sens tel que nous
l'entendons parvient d'une certaine façon à réconcilier les deux théories. En effet, « les
traits qui le composent sont objectifs en ce qu'ils sont intersubjectivement stables »
(Ibid. : 34). Ainsi, on retrouve une certaine objectivité dans la conception du sens. C'est
justement l'aspect conventionnel ou encore le sens dénotatif qui incarne cette objectivité,
en réalité, faite d'une stabilité intersubjective. En outre, le sens peut appartenir au
constructivisme en ce qu'il est construit en contexte. Cela correspond en partie au sens
connotatif.
Ici, nous avons vu le sens de manière générale, en lien avec la référence. Désormais,
passons au sens lexical en tant que signifié. De là, émergera comme principale
problématique la polysémie.
1.1.2. Conception dynamique du sens
« Toute théorie sémantique se heurte à la difficulté de définir le sens des mots »
(Victorri, 1994 : 733) du fait de la polysémie. Certaines approches défendent l'unicité du
sens tandis que d'autres formalisent les sens d'un mot sous forme de traits sémantiques.
Voyons donc quelle approche est suivie par B. Victorri et C. Fuchs dans leur ouvrage La
polysémie : construction dynamique du sens17.
« Il faut donc prendre en compte à la fois le fait que chaque forme linguistique
possède une unicité et une spécificité qui imposent leur marque dans tout énoncé qui
contient cette forme et le fait que la plupart des formes possèdent aussi une capacité
d'exprimer une pluralité de sens » (Ibid. : 736). Voilà donc ce que l'on constate dès lors
qu'on s’attache à comprendre ce qu'est le sens des unités lexicales. Ainsi, il n'est pas
possible de trancher entre une unicité du sens ou une spécificité du sens selon les
contextes18. Au contraire, le sens participe des deux approches. Il faut tenter de mettre
en œuvre une conception du sens qui tienne compte de l'unicité et de la spécificité afin
d'englober les deux approches mais aussi de rendre compte au mieux de la réalité du
sens. Pour pallier ce problème, Victorri et Fuchs ont proposé « une conception dynamique
du sens ». Le sens n'est plus figé dans son unicité ni dépendant des spécificités, il est
dynamique, il va de l'un à l'autre. Dans cette conception, à chaque unité linguistique est
associé « un noyau de sens unique attaché à la forme lexicale (le « signifié de
puissance » des guillaumiens) » (Ibid. : 736). Cela revient à la dichotomie
17
18
Victorri & Fuchs, 1996.
Cela renvoie aux théories de la désignation et de la signification qui seront exposées au point suivant.
13
aristotélicienne « en puissance / en acte ». Le sens de ce noyau n'est pas réalisé, mais il
est potentiel. Quand, il se réalise, ce sens est « capable de prendre, en fonction des
éléments co-textuels qui l'entourent et de leur agencement, des valeurs plus ou moins
éloignées les unes des autres, suivant le degré de polysémie de l'unité linguistique en
question » (Ibid. : 736). Ainsi, chaque noyau en puissance se réalise en acte de manière
différente selon les contextes où il se situe. Grâce à cette perspective, la polysémie est
prise en compte, phénomène majeure dans la langue, qui joue aussi un rôle important
dans la relation de synonymie. Souvent la polysémie ne parvenait pas à être expliquée
par les autres approches. De ce fait, la construction dynamique du sens se révèle une
innovation.
Donnons la définition que prend le sens lexical dans le cadre de la construction
dynamique du sens :
le sens d'une unité linguistique dans un énoncé donné est le résultat de l'interaction entre un apport
sémantique constant associé à cette unité que l'on peut appeler son noyau de sens, ou encore sa forme
schématique et le contexte d'énonciation de cette unité19 » (Venant, 2009 : 2).
Venant poursuit : « le noyau de sens n'est donc pas un sens à proprement parler mais
plutôt un schéma de base à partir duquel se construisent les différents sens d'une unité »
(Ibid. : 2). Ce noyau correspond bien à un signifié en puissance. Il est unique ; cela donc
reprend l'approche de l'unicité. Cependant, il n'est pas figé dans son unicité puisque c'est
une potentialité. « En contexte, ce noyau de sens entre en interaction avec les autres
éléments linguistiques pour donner naissance à un sens précis » (Ibid. : 2). Il est
également tenu compte des spécificités puisque le contexte influe sur le sens de l'unité
lexicale. Toutefois, elles dépendent aussi du noyau de sens. Ainsi, le noyau de sens et le
contexte sont pris en compte dans cette conception du sens, chacun interagissant pour
construire le sens.
Pour résumer, « le sens d'une expression donnée apparaît comme le résultat d'un
processus » (Victorri, 1994 : 736). « C'est la mise en œuvre de ce mécanisme qui
constitue la construction dynamique du sens » (Ibid. : 736).
Plus généralement, « le sens d'un énoncé est le résultat d'un double mouvement
puisque ce sens est évidemment fonction du sens des expressions qui le composent mais
qu'inversement le sens de ces expressions dans cet énoncé est fonction du sens global de
l'énoncé lui-même » (Victorri & Fuchs, 1996 : 41) Il s'agit là des « principes de base de
la Gestalttheorie : le tout est plus que la somme de ses parties » (Ibid. : 41) et « une
partie dans un tout est autre chose que cette partie isolée ou dans un autre tout »20
(Guillaume, 1979 : 23). Cela revient d'une certaine manière à considérer un sens simple
qui renverrait au sens lexical de chaque unité et un sens complexe ou syntaxique qui se
développerait en contexte en fonction des éléments environnants. Le sens simple se
développerait en contexte, certains sèmes seraient mis en avant en fonction de
l'environnement. Mais comme le dit P. Guillaume, le sens lexical isolé est autre que le
sens en contexte. En effet, si on parle en termes de sèmes, pris isolément, certains
sèmes du sens lexical demeurent présents, en puissance, tandis qu'en contexte, ils
peuvent être neutralisés. De même, ce même sens lexical n'est plus le même lorsqu'il est
activé dans un autre contexte, puisque d'autres sèmes sont actualisés. Ainsi, chaque
unité lexicale possède un potentiel sémantique qui se réalise différemment selon les
environnements.
Suite à la construction dynamique du sens en contexte, il existe un
processus d'interprétation qui consiste à découvrir la fonction qu'exerce un énoncé donné dans une
situation d'énonciation donnée : c'est au cours de ce deuxième processus que se déterminent les valeurs
référentielles des différents constituants de l'énoncé » (Victorri, 1994 : 736).
En effet, nous avons dit que le sens conditionnait la référence. Ainsi, ce second processus
ne peut avoir lieu qu'une fois le premier établi. La référence est dépendante du sens.
19
20
Définition que Venant reprend à Victorri et Fuchs.
Guillaume, 1979 cit. Victorri & Fuchs (1996 : 41).
14
C'est dans l'interprétation que le lien sens-référence se fait. L'interprétation part du sens
en contexte et détermine parmi les référents présents dans le monde ceux qui
concordent avec le sens. Elle se base sur la Gestalt du référent (une Gestalt est un
ensemble de propriétés structurées et interactionnelles de nature perceptive,
fonctionnelle, motrice et intentionnelle) mais elle est également imprégnée de
connaissances historiques et socioculturelles. C'est donc un processus complexe qui
demande l'intervention de paramètres extralinguistiques.
Les relations entre le sens et la référence peuvent être considérées sous divers
angles, principalement celui de la théorie de la désignation ou celui de la théorie de la
signification.
1.1.3. Théories de la désignation et de la signification
Comme le dit J. Rey-Debove :
il peut y avoir des synonymes dans une théorie de la désignation qui établit des relations entre le monde
et les signes mais pas dans une théorie de la signification parce que tout signifié est double possédant
une partie désignative qu'il peut avoir en commun avec d'autres mots et une partie connotative propre
qui ne se retrouve dans aucun autre mot » (Rey-Debove, 1997 : 95).
La théorie de la désignation s'en tient strictement à la référence et surtout au processus
de référenciation. Dans cette considération, il ne s'agit que d'établir des liens entre le
monde et le langage. Le sens est « conçu comme un ensemble de conditions
d'applicabilité référentielle » (Kleiber, 1997 : 34). En revanche, dans la théorie de la
signification, l'accent est mis sur le sens au détriment de la référence. Et d'ailleurs,
l'accent est plus particulièrement mis sur la partie connotative de la signification. Cela
explique pourquoi la référence est peu prise en compte : elle renvoie à la partie
désignative de la signification. Rappelons que la connotation équivaut à l'aspect
sémantiquement variable du signifié, à tout ce qui relève des associations d'idées, de
l'affectivité, de la création individuelle. Il existe différents types de connotations, en voici
quelques uns :

« connotations de contenu liées à la mémorisation de contextes langagiers et
situationnels » (Rey-Debove, 1997 : 96)

« connotations de signes liées à la cooccurrence des mots dans la phrase » (Ibid. :
96)

« connotations de signifiants d'un signe à l'autre » (Ibid. : 96)

« connotations formelles qui portent sur le signe » (Ibid. : 96)
La connotation correspond à la partie idiosyncrasique de la signification. Elle est le lieu de
l'expression de l'individualité du locuteur. Il s'approprie le sens désignatif et le modèle à
sa guise consciemment ou inconsciemment. Ainsi, la connotation est seulement un
aspect du sens en contexte. Elle se focalise sur l'apport de signification inhérent au
locuteur. Le sens en contexte est pétri par d'autres paramètres, qui font justement la
difficulté du sens contextuel. Dans ce sens contextuel, peuvent notamment influer sur les
conditions de la situation d'énonciation : le locuteur, son ou ses interlocuteurs, l'espace,
le temps, … De ce fait, les connotations semblent des aspects trop individuels de la
signification pour susciter de l'intérêt. D'ailleurs, rappelons que le langage est possible
grâce à la stabilité intersubjective qui se crée lors de situations de communication. Les
connotations sont par là marginalisées ce qui aboutit à minimiser l'importance de la
théorie de la signification. En tant que procédé de renégociation du sens en contexte, la
connotation se trouve englobée dans la conception dynamique du sens.
Ce propos sur la théorie de la désignation corrobore ce qui a déjà été dit à ce sujet :
la désignation est un mécanisme de référenciation. Le sens impose à la référence les
conditions qui permettent la désignation.
15
1.2. Définition de la synonymie
1.2.1. La synonymie : une notion onomasiologique
La synonymie est communément reconnue comme étant une relation sémantique entre
deux unités lexicales de sens proche. Elle fait donc partie de la sémantique lexicale.
Toutefois, une relation sémantique est une relation de contenu à contenu. Or ce n'est pas
le cas de la synonymie. Celle-ci est une relation de contenu à expression. Un même
contenu est représenté par différentes expressions, autrement dit un signifié possède
plusieurs signifiants21. Ainsi, « la synonymie est une relation entre ce contenu et ses
expressions possibles »22 (García-Hernández, 1997 : 385). Cependant, « nombreux sont
les sémanticiens qui considèrent la synonymie comme une relation sémantique, c'est-àdire une relation entre signifiés »23 (Ibid. : 383). Toutefois, le plan du sens est trop
souvent mis en avant au détriment de celui de la référence. « Les synonymes sont
coréférentiels en tant qu'ils dénotent la même chose »24 (Ibid. : 382). « La synonymie
est une relation de dénomination diverse d'un même référent »25 (Ibid. : 382).
Considérons que des synonymes sont coréférentiels sur le plan de la dénotation. Dans
une théorie qui tiendrait compte des connotations, ils ne pourraient être coréférentiels.
Cependant, nous avons pris le parti de ne pas prendre en compte les connotations dans
le processus de référence. Néanmoins, « la référence est une condition nécessaire mais
non suffisante pour que l'on parle de synonymie »26 (Ibid. : 383). Le noyau de sens
commun aux expressions possibles d'un même référent fait de ces expressions de
véritables synonymes. C'est cette part de sens commun qui est le fondement de la
relation synonymique. Nous avons tâché de mettre en avant le plan de l'expression qui
est souvent omis. Ainsi, la synonymie est une relation qui se place à la fois dans la
sphère du sens et dans celle de la désignation. Cela en fait une relation qui tient à la fois
compte du signifiant et du signifié. C'est en ce sens qu'elle est une relation
onomasiologique. Certes, la synonymie relève de la sémantique lexicale mais plus
précisément de l'onomasiologie.
Remarquons que la polysémie qui a déjà été citée (et qui sera mise en lien avec la
synonymie au paragraphe 1.3.) est une relation d'un autre type que la relation
synonymique. La polysémie est en quelques sortes le phénomène inverse de la
synonymie puisqu'elle est une relation d'expression à contenu et non plus de contenu à
expression. En effet, une expression dite polysémique possède plusieurs contenus,
autrement dit un signifiant pour plusieurs signifiés. Dès lors, la polysémie en tant que
relation sémantique n'est pas de l'ordre de l'onomasiologie, mais de la sémasiologie qui
traite les relations entre une expression et ses différents contenus.
1.2.2. Synonymie totale / synonymie partielle
Sommairement, nous pouvons dire que la synonymie est une relation de substituabilité
en contexte. Plus précisément, nous pouvons énoncer la définition de la synonymie par
S. Ploux et B. Victorri en sachant que ces deux auteurs distinguent deux synonymies :
une synonymie pure (encore appelée totale ou absolue) et une synonymie partielle. Voici
les définitions qu'ils donnent :
Synonymie pure : « deux unités lexicales sont en relation de synonymie pure si toute
occurrence de l'une peut être remplacée par une occurrence de l'autre dans tout
21
Voir à ce sujet le point sur les cliques dans la 4e partie sur les apports de l'informatique à la synonymie.
« es una relación entre ese contenido y sus posibles expresiones ».
23
« son muchos los semantistas que entienden la sinonimia como una relación semántica, esto es, como una relación
entre significados ».
24
« los sinónimos son correferenciales, en cuanto que denotan el mismo hecho ».
25
« es una relación entre ese contenido y sus posibles expresiones ».
26
« la referencia es una condición necesaria pero no suficiente para que se dé sinonimia ».
22
16
environnement sans modifier notablement le sens de l'énoncé dans lequel elle se
trouve » (Ploux & Victorri, 1998 : 162).
Synonymie partielle : « deux unités lexicales sont en relation de synonymie27 si toute
occurrence de l'une peut-être remplacée par une occurrence de l'autre dans un certain
nombre d'environnements sans modifier notablement le sens de l'énoncé dans lequel elle
se trouve » (Ibid. : 162).
Notons que ces définitions sont quasi similaires. Elles diffèrent uniquement par le
nombre d'environnements de substituabilité : la synonymie pure comprenant tous les
environnements et la synonymie partielle seulement un certain nombre. C'est là
justement toute la différence entre ces deux synonymies. Il serait si aisé que la
synonymie comprenne tous les environnements de substituabilité. Mais le phénomène est
bien plus complexe : seulement une partie de ces environnements est prise en compte.
La difficulté réside dans la détermination de ce nombre d'environnements. Le nombre en
est incertain puisqu'il dépend de l'unité lexicale dont il est question et de son sens pris en
considération. C'est cette indétermination qui fait la richesse et la complexité de cette
notion de synonymie partielle et qui la rend très difficilement formalisable et donc
exploitable.
Nous pouvons remarquer que les auteurs Ploux et Victorri ont préféré le terme de
« environnement » à celui de « contexte ». Cela s'explique par le trop grand usage du
terme « contexte » qui confond différentes réalités, qu'il s'agisse du contexte
extralinguistique ou du contexte à l'intérieur de l'énoncé ou cotexte. Ils définissent donc
l'environnement comme étant la somme du contexte et du cotexte, en sachant que le
contexte équivaut aux conditions d'énonciation et à la situation extralinguistique et le
cotexte correspond aux unités linguistiques présentes dans l'énoncé et dans le texte. De
ce fait, il n'y aucune confusion entre contexte et cotexte, environnement englobant les
deux.
Ces deux définitions de la synonymie sont à mettre en lien avec les propriétés
algébriques que l'on peut attribuer à cette notion.
1.2.3. Les propriétés algébriques de la synonymie
Ces propriétés servent à insérer la notion de synonymie dans une perspective logique,
afin en partie d'accéder à une modélisation mathématique de cette notion. Les propriétés
de la relation de synonymie dans l'ordre classique de l'algèbre sont la réflexivité, la
symétrie et la transitivité, propriétés qui servent à définir toute relation algébrique.
Voyons donc chacune de ces propriétés :

la réflexivité28 : « nous pouvons affirmer sans risque que la relation de synonymie
est réflexive, puisque toute unité lexicale peut se substituer à elle-même » (Manguin,
2004b : 2).

la symétrie29 : si A a pour synonyme B alors B doit avoir A pour synonyme.

la transitivité : « si A est synonyme de B, et B est synonyme de C, alors A est
synonyme de C » (Ibid. : 2).
Si la relation de synonymie respecte ces trois propriétés alors c'est une relation
d'équivalence et en tant que telle elle est aisément formalisable en traitement
automatique des langues. Seule la synonymie pure telle que la définissent Ploux &
Victorri est une relation d'équivalence, à la fois réflexive, symétrique et transitive.
Cependant, il s'agit d'une relation très restrictive, quasi impossible. En revanche, la
synonymie partielle s'observe dans le discours. Elle est même la seule que l'on y
rencontre. Toutefois, elle n'est que réflexive et symétrique, elle n'est pas transitive. En
effet, A peut être synonyme de B et B synonyme de C mais A n'est pas forcément
27
Les auteurs Ploux et Victorri emploient le mot « synonymie » pour désigner la synonymie partielle car c'est la
synonymie la plus répandue, ainsi, il est plus commode de la désigner du seul nom de synonymie.
28
La réflexivité de la synonymie est démontrée dans les propositions d'enrichissements (Manguin, 2004b : 5).
29
La propriété de synonymie sera l’objet de développements ultérieurs ; en effet, elle joue un rôle crucial dans le DES.
17
synonyme de C. Prenons l'exemple du mot bureau. Il possède comme synonyme table
puisque le bureau en tant que meuble est une table de travail. Il possède également le
synonyme pièce car le bureau est aussi une pièce dans laquelle l'on travaille. Seulement,
table et pièce ne sont aucunement synonymes. Ainsi, deux synonymes d'un même mot
ne sont pas systématiquement synonymes entre eux. Ainsi, la transitivité se rencontre
peu dans le discours du fait de la polysémie des mots. Cela fait que la synonymie n'est
pas une relation d'équivalence au sens strict; elle ne peut donc être aisément
formalisable30.
1.2.4. La place de la catégorie grammaticale dans la synonymie
Nous avons établi que la synonymie était une relation de substituabilité en contexte. En
effet, il s'agit de substituer un terme par un autre dans un contexte donné sans changer
le sens de ce contexte. Certes, le sens est un critère fondamental dans l'appréciation de
la synonymie en tant qu'elle est une relation sémantique. Cependant, comme le
remarque Bertaud du Chazaud dans son Dictionnaire des synonymes et de mots de sens
voisins (2003), le critère sémantique n'est pas le seul à être en jeu dans la relation de
synonymie. Le critère grammatical occupe lui aussi une place prépondérante dans cette
relation. La substituabilité fait jouer les axes paradigmatique et syntagmatique.
Considérons une phrase : elle représente l'axe syntagmatique dans lequel est incluse
l'unité lexicale sur laquelle va jouer la synonymie. L'axe paradigmatique correspond à
l'ensemble des synonymes de cette unité de ce contexte précis. Plus le nombre de
synonymes est important, plus le paradigme offre de choix. L'unité lexicale qui doit être
substituée se trouve au croisement des deux axes. Cependant, quel que soit le choix du
synonyme qui sera fait, la chaîne syntagmatique ne doit pas subir de remaniement. Un
changement syntaxique entraîne bien souvent des changements sémantiques. Ainsi, l'on
doit se garder de toutes modifications de l'axe syntagmatique. Pour ce faire, le
paradigme des synonymes ne doit comporter que des mots de même catégorie
grammaticale que l'unité lexicale qui doit être substituée. Cela corrobore donc le propos
de Bertaud du Chazaud concernant l'importance du critère grammatical pour la relation
de synonymie. La catégorie grammaticale est une des garanties de la conservation du
sens du contexte.
Jusqu'à présent il n'a été question que de la synonymie des unités lexicales. Cela
s'explique par le fait que notre perspective est avant tout lexicographique. En effet, notre
objet d'étude est ici le Dictionnaire Electronique des Synonymes du CRISCO. D'ailleurs,
comme nous venons de l'expliquer la catégorie grammaticale joue un rôle important dans
la relation de synonymie. Ce critère grammatical concerne principalement les unités
lexicales. Cependant, nous devons mentionner le fait que certains auteurs étendent la
synonymie à des unités plus larges comme des syntagmes, des propositions ou encore
des phrases. Dès lors, nous nous éloignons doucement de la notion de synonymie pour
passer dans le champ de la paraphrase. Ainsi, il existerait un continuum entre synonymie
et paraphrase. En outre, dans la conception dynamique du sens, Victorri et Fuchs traitent
de la polysémie à l'aide de la paraphrase et non de la synonymie.
1.2.5. La synonymie : une relation synchronique
Considérons désormais la synonymie sous l'angle temporel. Nous avons dit qu'il s'agissait
d'une relation de substituabilité entre deux unités lexicales selon des contextes
déterminés. Il ne s'agit ici que d'une perspective synchronique. À un moment t, un mot
est synonyme d'un autre dans un certain nombre de contextes. Mais cela n'est valable
qu'à ce moment t. La synonymie est une relation strictement synchronique. En effet, la
relation de synonymie est une relation de sens. Elle touche au sens des unités lexicales.
Ainsi, elle ne peut que varier avec les sens de ces unités. Elle subit les changements
sémantiques, elle en est dépendante. Ces changements s'expliquent du fait de la
30
A ce sujet, voir synonymie relative et synonymie subjective, in Lafourcade & Prince, 2001.
18
mutabilité du signe. Le signe évolue car il est matériel. En tant que tel, il est historique et
spatial si bien qu'il évolue dans l'espace et dans le temps. Son signifiant se modifie du
point de vue graphique et sonore. Bien qu'il ne soit pas matériel, le signifié change
également. Il fluctue, il apparaît ou disparaît. C'est cela qui fait les changements
sémantiques. De ce fait, une relation de synonymie établit à un moment t n'est plus
forcément valide au moment t+1, ce pas temporel étant le temps moyen que met un
sens pour changer. On comprend dès lors que la synonymie est une relation purement
synchronique. Elle n'a plus aucune légitimité en diachronie. Cela réduit considérablement
la validité de la notion de synonymie et c'est valable pour toutes les relations basées sur
le sens puisque les langues n'échappent pas au changement sémantique. La mince
épaisseur temporelle de la synonymie lui retire une partie de son intérêt linguistique et
scientifique. Pour maintenir l'établissement des relations synonymiques des unités
lexicales, il faudrait sans cesse les renouveler car elles tombent vite en désuétude du fait
du changement sémantique.
1.3. Une réalité à deux faces : imbrication de la synonymie et de la
polysémie
Nous avons vu que la conception dynamique du sens était issue d'un constat : nombre
d'unités lexicales sont polysémiques. Justement, l'un des points centraux de cette théorie
est la place qu'occupe le contexte dans le processus sémantique, contexte qui est
également crucial pour la définition de la synonymie. Ainsi, la synonymie et la polysémie
se rejoignent sur cette notion. Voyons donc de quelle manière elles sont imbriquées.
1.3.1. Définition de la polysémie
Avant d'expliciter cette imbrication de la synonymie et de la polysémie, il nous faut
définir ce qu'est la polysémie. Nous devons la naissance de cette notion à M. Bréal qui la
définit ainsi dans son Essai de sémantique31 :
Le sens nouveau, quel qu'il soit, ne met pas fin à l'ancien. Ils existent tous les deux l'un à côté de
l'autre. Le même terme peut s'employer tour à tour au sens propre ou au sens métaphorique, au sens
restreint ou au sens étendu, au sens abstrait ou au sens concret... A mesure qu'une signification
nouvelle est donnée au mot, il a l'air de se multiplier et de produire des exemplaires nouveaux,
semblables de forme, mais différents de valeur. Nous appellerons ce phénomène de multiplication la
polysémie (Bréal, 1897 : 154-155).
Ainsi, la polysémie est la capacité qu'ont certains mots de « prendre un sens nouveau qui
coexiste avec l'ancien » (Victorri & Fuchs, 1996 : 11). Cette capacité de production de
nouveaux signifiés qu'est la polysémie peut opérer de diverses manières. En effet,
depuis Darmesteter (1887/1979 : 67-75)32, on sait qu’historiquement la diversification du sens s’effectue
de manière radiale (processus de « rayonnement » selon Darmesteter) ou linéaire (processus d’ «
enchaînement » selon Darmesteter), entrant fréquemment en combinaison » (François & Manguin, 2004,
note 24 p. 11).
Plus précisément, la polysémie s'effectue par glissement de sens, par métaphore, par
analogie. De ce fait, une unité lexicale qui possède un sens voit au cours du temps
l'acception de son sens se modifier. Par exemple, le sens peut être employé
métaphoriquement dans de nouveaux contextes jusqu'à ce que ce sens métaphorique
entre en langue et constitue un nouveau sens à part entière de l'unité lexicale qui dès
lors se retrouvera avec non plus un mais deux sens. Pour illustrer la formation de sens
polysémiques, prenons l'exemple de café. A l'origine, il s'agissait d'une plante, qui porte
toujours ce nom d'ailleurs. Avec cette plante, est fabriquée une boisson chaude qui, de ce
fait, a également pris le nom de café. Enfin, ce nom s'est étendu à l'établissement où est
31
32
Bréal, 1897 cit. Victorri & Fuchs (1996 : 11).
Darmesteter, 1887/1979 cit. François & Manguin, 2004.
19
servie cette boisson chaude. Il est en de même pour le mot bureau que nous avons déjà
évoqué : le meuble sur lequel on travaille a donné son nom à la pièce dans laquelle l'on
travaille et enfin, c'est le lieu de travail lui-même qui a pris le nom de bureau.
1.3.2. Quand la synonymie aide à définir la polysémie
C'est de la définition de Bréal que partent Victorri et Fuchs dans leur ouvrage intitulé « La
polysémie : construction dynamique du sens » (Victorri & Fuchs, 1996). Cependant, ils y
ajoutent des critères permettant la détection du caractère polysémique ou nonpolysémique d'un mot. En effet, leur but est de mettre en place une méthode pour
représenter la polysémie des unités lexicales. Pour eux, « en gros, un mot est
polysémique quand il n'admet pas les mêmes paraphrases dans différents énoncés »
(Ibid. : 16). Il faut savoir qu'ils entendent par relation de paraphrase le remplacement
d'une expression linguistique par une autre « dans un certain nombre d'énoncés sans en
changer notablement le sens » (Ibid. : 15). La paraphrase ressort donc de la substitution
en contexte tout comme la synonymie. N'oublions pas que « le remplacement d'une
expression par une autre produit presque toujours une différence, si légère soit-elle, de
sens » (Ibid. : 15) ce qui revient à dire qu'une « synonymie pure » serait
« exceptionnelle pour ne pas dire inexistante » (Ibid. : 16). Abstraction faite de ces
légères modifications sémantiques dues à la paraphrase, on comprend que la polysémie
ne peut être définie sans la notion de paraphrase.
Toutefois, une précision s'impose. Victorri et Fuchs emploient le terme de paraphrase
en ce qui concerne le remplacement d'une expression linguistique par une autre. Leur
définition de la polysémie concerne aussi bien les unités lexicales, les unités
grammaticales que les constructions syntaxiques. Dans notre cas, nous nous limitons aux
seules unités lexicales du fait même de l'exemple que nous avons pris pour illustrer notre
sujet : le Dictionnaire Électronique des Synonymes. En effet, aucune construction
syntaxique ne figure dans ce dictionnaire. Quant aux unités grammaticales, elles sont
minoritaires et dénuées d'intérêt pour notre analyse. C'est ainsi que nous emploierons le
terme de synonymie là où Victorri et Fuchs parlent de paraphrase. En effet, dans leur
analyse, ils vont jusqu'à considérer la paraphrase entre énoncés phrastiques. Pour nous,
la synonymie se limite aux unités lexicales. En conséquence, c'est une relation de
paraphrase entre des unités lexicales.
Ainsi, nous l'aurons compris : Victorri et Fuchs définissent la polysémie à l'aide de la
synonymie, la première n'allant pas sans la seconde. Désormais, inversons cette relation.
La synonymie nécessite-t-elle l'introduction de la notion de polysémie pour être définie ?
1.3.3. Quand la polysémie participe de la définition de la synonymie
La seule synonymie que l'on est susceptible de rencontrer est la synonymie partielle. En
effet, une unité lexicale n'est substituable à une autre que dans un certain nombre de
contextes, sans que le sens de l'énoncé soit notablement changé. Une unité lexicale aura
donc tel synonyme dans tel contexte et tel autre synonyme dans tel autre contexte.
Ainsi, cette unité aura différentes paraphrases selon ses contextes d'usage, pour
employer le terme de Victorri et Fuchs. Chaque synonyme renvoie donc à un sens
particulier de cette unité lexicale dans le cadre d'une substitution par paraphrase. Cela
revient à dire que cette unité lexicale est polysémique d'après la définition de la
polysémie de Victorri et Fuchs. L'unité lexicale ne pouvant être paraphrasée par un seul
synonyme du fait de sa polysémie, nécessite plusieurs synonymes, ces synonymes ne
couvrant que partiellement le sémantisme de cette unité. Par conséquent, la synonymie
que nous avons nommée partielle existe en raison de la place qu'occupe la polysémie
dans le lexique. D'ailleurs, nombre d'unités de la langue sont polysémiques si bien que
très souvent, la synonymie est partielle.
Nous avons donc montré que la polysémie ne pouvait être définie sans la synonymie
et inversement ce qui nous fait dire qu'elles sont comme les deux faces d'une même
réalité. L'imbrication de ces deux notions légitime donc l'utilisation d'un dictionnaire des
20
synonymes pour déceler la polysémie d'une unité lexicale, notamment afin de la
différencier de l'homonymie.
1.4. La synonymie : un paradoxe entre idéal de monosémie et principe
d'économie
La synonymie et la polysémie, en plus d'être deux notions indissociables sont toutes deux
à mi-chemin entre l'idéal de monosémie et le principe d'économie de la langue.
« Aucun mot de la langue française n'est rigoureusement synonyme d'un autre :
chacun recèle une nuance qui lui est propre, qui le différencie et qui d'ailleurs justifie son
existence» (Boussinot, 2007 : 7), nous dit Boussinot. Cela nous rappelle à quel point la
synonymie repose sur un paradoxe entre l'idéal de monosémie et le principe d'économie
de la langue :

Idéal de monosémie : chaque mot a un sens et à chaque sens correspond un mot.

Principe d'économie de la langue : il ne peut exister deux mots absolument
substituables dans tous les contextes.
Comme nous venons de le mentionner, la polysémie est un phénomène inhérent à la
langue, constitutif de la formation des unités lexicales. Depuis Darmesteter, on sait que la
polysémie opère de « manière radiale (processus de « rayonnement » selon
Darmesteter) ou linéaire (processus d’ « enchaînement » selon Darmesteter) » (François
& Manguin, 2004, note p.11), en sachant que ces deux processus ne sont pas sans se
combiner. Ainsi, avec la polysémie, la diversification du sens s'effectue par glissement de
sens, par métaphore, par analogie. Ces processus s'accompagnent du recyclage des
signifiants; les signifiés anciens s'estompent jusqu'à disparaître tandis que des signifiés
nouveaux les remplacent progressivement.
Quant au principe d'économie de la langue, il reprend certaines sources de création
de la polysémie : éviter de créer des néologismes, recyclage des signifiants, … En effet,
le principe d'économie de la langue est d'une certaine manière un instinct de survie de la
langue. Une langue qui n'observerait plus ce principe tendrait à disparaître. Cela pourrait
se traduire par exemple par une accumulation d'unités lexicales superflues qui ne feraient
que grossir le vocabulaire d'une langue sans pour autant receler la moindre pertinence.
Ainsi, ne sont conservées dans la langue que les unités lexicales qui sont pertinentes
pour l'usage qu'en font les locuteurs. Toute unité lexicale dénuée de cette pertinence
tend à disparaître. Dans une perspective cognitive, il serait question du coût cognitif que
demande aux locuteurs le maniement d'un vocabulaire surchargé en unités lexicales.
Ainsi, ne demeurent que celles qui sont pertinentes33 c'est-à-dire celles dont le coût
cognitif ou ratio de l'effet cognitif sur l'effort de traitement reste raisonnable. Mais si
quelques rares unités lexicales ne semblent pas se soumettre à ce principe et ne
disparaissent pas pour autant, cela se justifie par l'arrière-plan historique et socioculturel
de la langue.
Confrontons désormais la synonymie au principe d'économie de la langue et à l'idéal
de monosémie. Si elle se veut absolue ou totale c'est-à-dire une exacte concordance
entre deux termes quel que soit le contexte, la synonymie se heurte au principe
d'économie de la langue. La synonymie absolue engendrerait des paires de mots
rigoureusement substituables ce qui va à l'encontre du principe d'économie de la langue
qui est pourtant constitutif de celle-ci. Un des deux termes tendrait forcément à
disparaître au profit de l'autre à moins qu'il ne se spécialise dans un contexte particulier.
Maintenant, voyons ce qu'il en est de l'idéal de monosémie ? Avec cet idéal de
monosémie, il n'y aurait plus de polysémie dans la langue et donc a priori la synonymie
pourrait être totale puisque le sens d'une unité lexicale ne dépendrait plus d'un contexte,
il n'y aurait plus d'ambiguïté à ce sujet. Ainsi, un mot aurait un synonyme et uniquement
un synonyme. Mais cela contrevient à l'idéal de monosémie lui-même : comment un sens
pourrait-il se retrouver dans deux mots alors que la monosémie implique la stricte
33
Il s'agit ici de la pertinence au sens de Sperber & Wilson in Sperber D. et Wilson D. (1989), La pertinence, Paris,
Editions de Minuit.
21
équivalence entre un mot et un sens. De ce fait, la monosémie se contredit au regard de
la synonymie. On comprend dès lors que la synonymie et la polysémie soient aussi
imbriquées l'une l'autre. En conséquence, la monosémie demeure un idéal.
La phrase de Boussinot nous rappelle à quel point la synonymie est une relation
difficilement identifiable. En effet, elle associe ensemble des mots différents du fait de
leurs ressemblances. Bien sûr, ces ressemblances et ces différences ne jouent pas sur le
même plan : ce sont les signifiants qui sont différents et les signifiés qui se ressemblent.
Cependant, toute l'instabilité de la synonymie réside dans le fait que ces signifiés ne sont
jamais exactement identiques. Une substitution par synonymie peut apporter de légères
modifications de sens au contexte, sans compter que les contextes sont plus ou moins
sensibles aux substitutions sémantiques. Enfin, les unités lexicales étant polysémiques, il
est parfois difficile de cerner avec exactitude quel sens est en jeu dans un contexte avant
de le substituer.
La synonymie est une relation instable si l'on considère divers critères. Elle n'est que
partielle et donc rarement totale. Cela vient du fait que ce n'est pas une relation
transitive selon l'ordre de l'algèbre. En outre, c'est une relation purement synchronique,
elle n'a aucune pérennité en diachronie. Tout ceci la rend floue et difficilement
théorisable. Il est donc ardu de déterminer ce qui ressort de la synonymie et ce qui n'y a
pas trait. Et pourtant, on ne peut que constater l'existence de dictionnaires des
synonymes. Dès lors, nous pouvons nous interroger sur la définition de la synonymie que
se donnent les lexicographes, et par là sur la légitimité de leurs dictionnaires. Nous nous
focaliserons sur le DES et les dictionnaires qui ont servi à son élaboration.
22
2. Le Dictionnaire Électronique des Synonymes : aspects
lexicographiques
Nous nous s'appuyons sur le DES comme exemple de dictionnaire électronique des
synonymes. Il est donc important de consacrer une section de notre réflexion à la
lexicographie de la synonymie, aux différents dictionnaires à l'origine du DES et au DES
lui-même, afin de comprendre quelles sont les problématiques en jeu en lexicographie de
la synonymie et dans le DES.
2.1. Historique lexicographique de la synonymie
La synonymie est une notion apparue durant l'Antiquité grecque comme nous l'avons
signalé dans l'introduction. Voyons comment cette notion a été traitée au cours des
siècles au travers des ouvrages abordant la question et notamment en se penchant sur
les dictionnaires des synonymes.
« Le traitement de la synonymie est un thème central depuis l'Antiquité » écrit J.-C.
Chevalier (Chevalier, 1997 : 8). Au Moyen-Âge, cette notion faisait l'objet d'une étude
rhétorique. En effet, il s'agissait d'éviter les répétitions abusives. Cette étude était
également le reflet d'une tendance à varier propre à la culture de la Renaissance :
développer la langue française afin qu'elle s'émancipe du latin et deviennent une langue
à part entière. Le débat sur la synonymie s'est poursuivi au XVIIème siècle avec
notamment Ménage, Vaugelas et le Père Bouhours. Pour ces trois auteurs, il est question
de pureté de la langue, de bon usage et de norme linguistique. En effet, la langue doit
être juste et elle doit éviter les synonymes inutiles selon le Père Bouhours. Quant à
Vaugelas, il considère la synonymie comme un moyen de « mieux se faire entendre ».
Ainsi, la synonymie est source d'une plus grande expressivité quand elle n'est pas un
ornement.
Tous ces grammairiens n'étudiaient la synonymie que dans des ouvrages généraux
portant sur la justesse de la langue. La synonymie n'était qu'un point parmi d'autres
concernant le bon usage de la langue. Un vrai pas a été franchi avec l'abbé Girard qui
publia en 1718 ce qu'on pourrait appeler le premier dictionnaire des synonymes, La
Justesse de la langue françoise34. Les nombreuses rééditions attesteront de l'importance
de cet ouvrage tout comme de sa qualité. Certes, on retrouve toujours cette idée de
justesse dans l'emploi de la langue mais désormais, « les synonymes deviennent un
objet d'étude à part entière » (Aruta Stampacchia, 2006 : 17). A côté de la recherche
d'une « belle manière de parler » (Girard, 1718 : XI), celui-ci introduit l'idée que « la
signification des mots ne consiste pas dans la seule idée principale qu'ils présentent,
mais dans toute l'étendue et dans la juste précision du sens qu'ils expriment » (Girard,
1718 : XXX). Il introduit dans son étude la distinction entre idée générale et idée
particulière ce qui est le signe avant coureur d'une problématique de la synonymie : sans
que les termes soient utilisés, la synonymie sera désormais traitée selon des traits
distinctifs autrement dit des sèmes.
Cette idée novatrice de la distinction entre idée principale et idée accessoire perdura
dans l'Encyclopédie de Diderot et D'Alembert. Beauzée, qui avait participé à la rédaction
d'articles de l'Encyclopédie, publia une nouvelle édition des synonymes de Girard en 1769
car selon lui, la méthode de Girard était la marche à suivre. Lafaye considère Beauzée
comme un logicien, il écrit même à son sujet que, pour lui, le livre des synonymes
ne doit plus être une œuvre de goût, passagère comme lui et composée de morceaux sans liaison où l'on
se propose de plaire par leur variété même; ce doit être une œuvre de science qui laisse des résultats
durables, une œuvre de logique » (Lafaye, 1858 : XXVII).
Ainsi, avec Beauzée, l'on s'émancipe de l'aspect rhétorique que revêtait encore l'étude
des synonymes avec Girard puisque l'idée de justesse, de bon goût était encore présente
34
Girard, 1718.
23
chez lui. En revanche, Beauzée veut faire de cette étude un travail scientifique basé sur
la logique.
Ce désir de scientificité sera repris par Roubaud dans son dictionnaire de synonymes,
Nouveaux synonimes français35. Celui-ci appuie ses analyses des mots synonymes sur
leur étymologie. Cela est censé aider à distinguer ces synonymes en passant par l'origine
de leurs radicaux. C'est donc l'idée propre de chaque mot qui est mise en valeur.
L'étymologie devient une clef de lecture et un gage de scientificité. Toutefois, il faut
savoir que le recours à l'étymologie est parfois contestable. D'ailleurs, Roubaud en fait
souvent un usage excessif en attribuant des étymologies douteuses à des mots. Il n'en
demeure pas moins qu'il a été l'un des premiers à mettre en œuvre une analyse
morphologique sans pour autant lui donner ce nom-ci. Quoi qu'il en soit, il avait cerné
l'importance des terminaisons des mots, idée qui sera reprise plus tard par Guizot et
Lafaye. Ainsi, « Roubaud met l'accent sur le caractère particulier de chaque synonyme
plutôt que sur les éléments communs aux termes » (Aruta Stampacchia, 2006 : 21). On
retrouve donc encore cette distinction entre idée principale et idée accessoire, comme un
fil conducteur des études de la synonymie.
Le dictionnaire des synonymes le moins connu est celui de Condillac et pourtant la
découverte du travail de ce dernier a été à l'origine de la théorie des synonymes de
Lafaye. Pour Condillac, « la 'justesse' de la pensée dépend de l'arrangement correct d'un
système de signes » (Ibid. : 23). En conséquence, on passe d'une justesse de la langue
avec Girard à une justesse de la pensée avec Condillac. Cependant, l'idée maîtresse
demeure de distinguer dans chaque synonyme le contenu essentiel commun et les
éléments accessoires qui les nuancent. Ainsi, Condillac reste dans la lignée inspirée par
Girard. A. Aruta Stampacchia écrit à propos de Condillac : « son but était de donner, par
rapport aux termes abstraits (substantifs, adjectifs, verbes), une définition, fondée sur
une analyse précise de la notion dont ils sont le symbole, des conditions et des intentions
de l'emploi qu'en fait le langage à un moment donné » (Ibid. : 24). Cette mention du
moment donné montre que Condillac avait le pressentiment de l'importance du facteur
temporel dans la langue. Ainsi, la signification des mots n'est valable qu'à un moment
donné dans le temps.
Cet historique de la lexicographie de la synonymie du XVIIIème nous permet de voir
l'évolution de cette discipline et de comprendre les fondements des dictionnaires de
synonymes du XIXème et du XXème siècle.
2.2. Typologie des dictionnaires des synonymes
Afin d'avoir un meilleur aperçu de différents types de dictionnaires des synonymes qui
existent, nous reprenons la typologie d'A. Ferrara. S'inspirant de celle de B. Quemada,
elle distingue 4 types de dictionnaires des synonymes qui sont :

les distinctifs : aux entrées, figurent plusieurs mots vedettes définis ensemble afin
d'analyser les différences entre ces termes souvent reconnus comme synonymes. Ces
définitions sont augmentées de précisions et d'exemples qui servent le propos de
l'auteur. Cependant, à chaque fois, « le synonymiste propose un sens dans lequel les
mots se rapprochent, il montre les différences, mais ne définit le terme que dans un sens
possible » (Ferrara, 2010 : 930). On ne trouve pas de synonymes correspondants aux
différents contextes dans lesquels peuvent être employées les entrées. Ainsi, l'auteur
restreint grandement son étude et les synonymes qu'il fournit ce qui réduit l'intérêt de
tels dictionnaires.
Les premiers dictionnaires des synonymes appartenant à ce genre distinctif sont celui de
Girard36 et celui de Roubaud37.
35
Roubaud, 1785.
Girard, 1718.
37
Roubaud, 1785.
36
24

les compilations38 : il s'agit de compilations d'articles des dictionnaires du type
précédent. Les auteurs ont conservé ce qu'ils estimaient être le meilleur des
dictionnaires. Ils ont toutefois ajouté des articles de leur main. Guizot fut celui qui en
ajouta le plus : il est l'auteur de 122 articles pour un total de 1341 articles dans son
dictionnaire. « Bien que ce soit un travail basé sur l'emprunt, les compilateurs de
dictionnaires de synonymes sont des synonymistes à part entière puisqu'ils établissent
des choix concernant les mots-vedettes, les définitions, les étymologies, etc. » (Ibid. :
931). En tant que compilation de dictionnaires distinctifs, nous avons ici à faire à un
sous-genre des dictionnaires distinctifs.
Un des dictionnaires des synonymes de type compilation les plus connus est celui de
Guizot39.

les semi-distinctifs40 : c'est un genre hybride ou plutôt une variation pour reprendre
le terme de Ferrara, à la frontière entre les dictionnaires distinctifs et les cumulatifs. Il
est distinctif dans sa démarche mais moins fourni en explications d'un dictionnaire
distinctif classique. Il « se présente sous forme de liste » (Ibid. : 931) ce qui le rapproche
des dictionnaires cumulatifs. Cependant, les termes sont distingués par des contextes
(d'énonciation) et des exemples ce qui l'éloigne du dictionnaire cumulatif. Mais il n'est
pas pour autant distinctif puisqu'il est dépourvu de définitions qui différencient les
termes. On peut donc dire que « les auteurs de ce dictionnaire se sont plus occupés du
contexte variable que des sens possibles » (Ibid. : 932) des mots. D'ailleurs, une des
particularités innovantes du dictionnaire semi-distinctif est qu'il prend en compte les
registres de langue dans ses distinctions ce qui était rarement fait auparavant. Ce genre
hybride s'explique par le fait qu'il ait vu le jour à une période charnière durant laquelle
les dictionnaires distinctifs disparaissaient et les cumulatifs apparaissaient.
Un des seuls pour ne pas dire le seul dictionnaire semi-distinctif est le Nouveau
Dictionnaire des Synonymes (1977) autrement appelé le Genouvrier41.

les cumulatifs42 : ils sont constitués de listes de termes synonymes du mot-vedette
sans que les différences entre les termes ni leur degré de synonymie ne soient indiqués.
Seules subsistent les marques de registre. L'utilisateur n'est pas guidé par des
explications, c'est de lui-même qu'il doit choisir le terme qui convient selon le contexte
dans lequel il a besoin d'un synonyme. Certes, cela laisse une plus grande liberté de
choix à l'utilisateur mais lorsque des informations lui manquent quant aux acceptions du
synonyme, il est livré à lui-même. Dans ce cas, le recours à un dictionnaire de langue
peut s'avérer nécessaire. C'est le problème des dictionnaires de type cumulatif, ils ne
fournissent plus de gloses. Cependant, leur sécheresse est compensée par un nombre
conséquent d'entrées d'où cette qualification de cumulatif : ils cumulent les synonymes.
Mais ce qui manque fondamentalement à ces dictionnaires, c'est le contexte.
Aujourd'hui, la majeure partie des dictionnaires des synonymes présents sur le
marché sont des cumulatifs, que ce soient des dictionnaires papier ou électroniques.
Les références en matière de dictionnaire cumulatif sont ceux de Bertaud du Chazaud 43.
Ainsi, ces quatre types de dictionnaires n'apportent pas les mêmes informations
quant aux synonymes. Ils n'avaient pas non plus les mêmes objectifs. Nous discernons
deux grands genres de dictionnaires des synonymes qui sont le distinctif et le cumulatif.
Le passage de l'un à l'autre dénote une évolution de la problématique lexicographique :
du souci de la précision et de la justesse, l'on passe au souci de l'exhaustivité en matière
de langue. Ce caractère cumulatif et exhaustif est exacerbé de nos jours avec l'apparition
des dictionnaires électroniques qui offrent de nouvelles possibilités de stockage de
38
Pour un exemple, voir Annexe 1.
Guizot, 1864.
40
Pour un exemple, voir Annexe 2.
41
Genouvrier, 1977.
42
Pour un exemple, voir Annexe 3.
43
Bertaud du Chazaud, 1971, Bertaud du Chazaud, 1979 et Bertaud du Chazaud, 2003.
39
25
données et ne sont plus contraints du point de vue de la dictionnairique. À ce sujet, nous
verrons le cas du DES.
2.3. Les dictionnaires des synonymes dans le DES
2.3.1. Description métalexicographique de ces dictionnaires
Le Dictionnaire Electronique des Synonymes a été formé à partir de 5 dictionnaires de
synonymes : Guizot, Lafaye, Bailly, Bénac, Bertaud Du Chazaud, les deux premiers étant
des dictionnaires datant du 19ème siècle et les trois autres du 20ème siècle. À cela, ont
été ajoutées les indications synonymiques de deux dictionnaires analogiques : le Grand
Larousse et le Grand Robert.
Description des 7 dictionnaires à l'origine du DES :
Le Guizot :
Comme nous l'avons déjà dit, le dictionnaire des synonymes de Guizot est un
dictionnaire du type compilatoire, ce qui fait également de lui un dictionnaire distinctif. En
effet, Guizot a repris bon nombre d'articles de ses prédécesseurs, de Girard à Beauzée en
passant par Roubaud. Le programme que se donne Guizot est de « définir les mots pour
définir les différences de sens qui les distinguent » (Guizot, 1864 : II), ainsi chaque
synonyme est accompagné d'une définition. D'après la définition que donne Guizot de la
synonymie, les synonymes parfaits ne semblent pas pouvoir exister. Il reconnaît luimême qu'il y a peu de mots dans son dictionnaire mais que cela est compensé par la
variété des significations de ces mots. Nous devons reconnaître que le Guizot est un
dictionnaire contribuant peu à apporter des synonymes au DES. Selon Guizot, les
conditions nécessaires pour que des mots soient synonymes sont qu'ils partagent une
idée générique commune et des idées particulières (peu distantes entre elles et de l'idée
générique) qui les différencient. Par conséquent, plus l'idée générique est proche de
l'idée particulière et plus la synonymie est grande. Guizot entend regrouper les familles
de synonymes autour d'un hyperonyme. Comme le dit A. Aruta Stampacchia : « à la
suite de l'intuition de Roubaud sur la valeur des terminaisons, Guizot comprend qu'il y a
le germe d'une science synonymique qui, au-delà de la simple analyse étymologique,
peut aboutir à des principes classificatoires » (Aruta Stampacchia, 2006 : 26).
Le Lafaye :
Contrairement à son prédécesseur Guizot, le dictionnaire de Lafaye relève du genre
distinctif, il ne se désigne pas comme compilatoire, d'où son originalité et son intérêt.
Pour Lafaye, il n'existe pas de synonymes parfaits, il y a forcément des traits
distinctifs pour les discriminer. Il décèle de nombreuses définitions synonymiques dans
les dictionnaires de langue ce qui lui fait dire que les dictionnaires des synonymes
servent à remédier aux imperfections des dictionnaires de langue puisqu'ils apportent des
réelles définitions aux mots en les distinguant bien les uns des autres.
Dans son ouvrage, Lafaye distingue trois types de synonymes. Les premiers sont des
synonymes à radicaux différents, ils nécessitent une considération attentive de leur
signification. Ce sont eux qui constituent le dictionnaire des synonymes à proprement
parler. La deuxième espèce de synonymes est ceux qui ont les mêmes radicaux
cependant ils diffèrent quant à leur préfixe ou leur suffixe. Les synonymes grammaticaux
font l'objet d'un dictionnaire spécifique séparé du premier dictionnaire des synonymes. Et
enfin, il existe des synonymes appartenant à des langues différentes par leur origine.
Pour Lafaye, les synonymes à radicaux divers doivent être étudiés du point de vue de
leur étymologie, car leur différence vient de leurs radicaux. L'idée novatrice de Lafaye est
de vouloir représenter les significations des mots à l'aide de cercles44. En effet, « pour
que des mots soient synonymes, il faut qu'ils représentent des notions complexes ou
44
Voir Annexe 4.
26
générales, collection d'idées simples » (Lafaye, 1858 : XXXIX), écrit Lafaye dans son
introduction. Le nombre d'idées simples d'un mot est corrélé à l'étendue des cercles qui
le représente. Ces idées simples peuvent se retrouver dans divers mots d'où des
synonymes possibles. Ainsi, les cercles représentant les mots peuvent être conjoints. La
partie commune aux deux cercles équivaut aux idées que les deux mots ont en commun.
Les synonymes en tant que termes complexes renferment des idées génériques et des
idées accessoires. Cela renvoie à l'idée déjà énoncée par Guizot. De même que celui-ci,
Lafaye songe à regrouper les mots selon une idée générale afin de constituer des
familles. Selon Lafaye, les termes techniques ne peuvent figurer dans un dictionnaire des
synonymes que s'ils sont passés dans la langue ordinaire. De même pour certains mots
au sens propre, leur sens figuré ne sera mentionné que parce qu'il est fréquent en
langue. Malgré tout, le Lafaye est un dictionnaire qui propose peu de synonymes.
Lafaye impose une rupture dans l'étude des synonymes car il propose une méthode
et des règles afin d'apporter de la scientificité à cette étude.
Le Bailly :
Pour Bailly, un bon dictionnaire des synonymes doit présenter des définitions des
entrées afin d'aider à discriminer les synonymes entre eux. Dans la préface du
dictionnaire (préface de M. de Toro), l'existence des dictionnaires des synonymes est
justifiée par le fait que les mêmes définitions seraient données pour des mots synonymes
s'ils étaient pris séparément. En revanche, tous ensemble, il devient possible de les
discriminer d'où la justification du dictionnaire des synonymes de type distinctif. On
comprend dès lors que Bailly ait adopté le type distinctif pour son dictionnaire. Il
considère comme synonymes des mots possédant un rapport assez étroit, avec tout de
même des différences légères mais réelles qui diversifient ces mots. Le dictionnaire est
vu comme une aide à la production de textes écrits lorsque la mémoire fait défaut. Le
Bailly se veut un dictionnaire du XXème siècle c'est-à-dire comportant des mots vieux et
classiques comme des mots jeunes, nouveaux et familiers. Bailly propose une
classification des différents types de synonymes dans son introduction. La dernière
catégorie a trait aux synonymes de type analogique, d'où un certain empiètement sur le
dictionnaire analogique.
Le Bénac :
Considérant le Lafaye comme le meilleur dictionnaire des synonymes du XIXème
siècle, Bénac s'est employé à le reprendre. Il est en partie compilatoire mais il est surtout
distinctif. Cependant, il a apporté des modifications aux articles de Lafaye du fait de
l'évolution de la langue. « Pour cela, nous avons fait passer dans nos colonnes l'essentiel
de ce qui demeure vivant dans son dictionnaire en ajoutant un très grand nombre
d'articles portant sur des synonymes que l'usage de son temps ignorait ou qui avaient
échappé à sa perspicacité » (Bénac, 1956 : 7). Pour Bénac, des synonymes sont des
termes « qui ont entre eux une analogie de sens avec des nuances d'acception
particulières à chacun d'eux » (Ibid. : 7). Bénac tient compte du vocabulaire familier et
populaire voire vulgaire. Toutefois, il prend également en compte les mots vieillis
« lorsque les écrivains du passé les ont illustrés, car il nous a paru bon que ce
dictionnaire pût servir aussi, dans une certaine mesure, à l'intelligence de nos chefsd’œuvre classiques » (Ibid. : 8). Ainsi, il conserve des états de langue anciens afin de
pouvoir comprendre les textes anciens si bien que son dictionnaire ne se place pas dans
une seule synchronie mais plusieurs.
Le Bertaud du Chazaud :
Bertaud du Chazaud définit la synonymie comme une relation de substituabilité. Le
synonyme remplit la même fonction grammaticale et lexicale que le terme qu'il remplace.
Cela distingue la synonymie de l'analogie, qui, elle, ne tient pas compte du critère
grammatical, mais seulement de la ressemblance de sens. Par souci de pédagogie,
Bertaud du Chazaud a voulu concilier la commodité de consultation à la richesse de
l'information. C'est pour cela qu'il a fait de son ouvrage un dictionnaire des synonymes
de type cumulatif, le premier dans son genre. En effet, il considère que, certes, des
27
renseignements tels que les définitions, les exemples ou les références étymologiques
sont utiles pour l'emploi correct d'un mot, mais que toutes ces informations réduisent la
place qui doit incomber à la liste des synonymes. Lorsqu'on consulte un dictionnaire de
langue c'est que l'on possède le mot mais que son sens demeure imprécis. « Au
contraire, il arrive qu'on ait à rendre un sens bien précis et que le mot correspondant soit
rebelle à la mémoire » (Bertaud du Chazaud, 1971 : 1)45. C'est à ce moment
qu'intervient le dictionnaire de synonymes. À partir d'un mot approchant ou plus général,
il fournit une liste de synonymes parmi lesquels peut éventuellement se trouver le mot
adéquat, que l'on recherchait. Ainsi, Bertaud du Chazaud se place dans une perspective
de production de texte qui exige d'employer le mot exact et d'éviter les répétitions.
Dans chaque article, les synonymes sont ordonnés selon un triple classement :
grammatical (par exemple : singulier/pluriel, féminin/masculin, nom/adjectif, ...),
sémantique (au propre, par extension et au figuré) et alphabétique. D'autres mentions
figurent comme par exemple (vx) pour les termes archaïques et (arg.) pour les termes
argotiques. L'auteur dit s'être efforcé de retenir les mots les plus fréquents du français
contemporain laissant de côté les termes techniques ou spécifiques.
Le Bertaud du Chazaud étant le seul dictionnaire cumulatif qui a servi à l'élaboration
du DES, il est parmi ceux qui ont fourni le plus de liens synonymiques. Il constitue donc
un biais inévitable dans le DES. Ainsi, la définition et le programme que s'est donné
Bertaud du Chazaud pèsent dans la réalisation du DES : que les définitions de la
synonymie du Bertaud du Chazaud et du DES soient différentes, la première transparaîtra
nécessairement au travers des synonymes proposés par le DES puisqu'issus du Bertaud
du Chazaud.
Le Grand Larousse de la langue française :
Les renvois synonymiques de ce dictionnaire constituent un réseau de relations
s'articulant autour du mot. Ils offrent une gamme étendue de synonymes et d'antonymes
de l'unité lexicale et ainsi proposent des descriptions des associations sémantiques qui
peuvent être faites avec l'entrée. Les lexicographes qui ont produit ce dictionnaire
entendent par là « rejoindre la chose ou la notion par le canal du mot » (Guilbert, 1971 :
V). Certes, il s'agit d'aller au-delà de la simple analogie mais il est tout de même
question d'analogies puisque les renvois synonymiques correspondent à des associations
sémantiques et pas uniquement à des synonymes. Ainsi, ces renvois synonymiques
semblent s'étendre à d'autres relations sémantiques. Bien sûr, les antonymes n'ont pas
été pris en compte dans le DES mais certainement, beaucoup de relations sémantiques
plus larges que la synonymie ont été incorporées au DES (des analogies par exemple).
Cela constitue donc encore un biais pour le DES.
Le Robert Dictionnaire de la langue française :
Le sous-titre de ce dictionnaire est très évocateur puisque ce dictionnaire est dit
« alphabétique et analogique ». En effet, cela semble assez contradictoire dans les
termes. Si un dictionnaire analogique propose quand même des entrées par ordre
alphabétique, il ne s'agit pas de la totalité des entrées, seulement celles qui regroupent
des grands champs d'association d'idées. Par conséquent, seule une partie des mots sont
en entrée dans l'ordre alphabétique, tous les autres mots étant regroupés dans un champ
sémantique donné. Ainsi, ce dictionnaire entend conjuguer les deux modes de
classement des entrées. Cependant, on comprend que l'ordre alphabétique sera
privilégié, l'ordre analogique ne venant qu'en second lieu. Pour corroborer notre propos,
intéressons-nous à ce qui est dit dans la préface de ce dictionnaire. Les lexicographes
qualifient les renvois non de synonymiques mais d'analogiques. Ce sont des renvois
sémantiques qui correspondent à des rapports étroits de sens. Toutefois, il est dit que ce
sont des relations de sens qui peuvent être des « synonymies », des ressemblances ou
des rapports logiques (contenant-contenu, partie-tout, cause-effet, …). Dès le prime
abord, on comprend que parmi ces renvois ne figurent pas seulement des synonymes.
Certes, ce sont des renvois analogiques, ils ne sont pas censés ne comporter que des
45
Bertaud du Chazaud, 1971, avant-propos.
28
synonymes. Il est donc normal que d'autres types de relations sémantiques telles que la
métonymie ou la synecdoque soient prises en compte. Dès lors, comment savoir ce qui,
dans ces renvois, figurent actuellement dans le DES. Certes, des propositions ont dû être
supprimées mais certaines demeurent. Ainsi, tout comme le Larousse, le Robert apporte
des termes s'étendant au-delà de la synonymie, qui, une fois de plus, biaisent le DES. En
outre, le Robert est, après le Bertaud du Chazaud, un des dictionnaires suggérant le plus
de relations synonymiques si bien que, lui aussi, pèse parmi les synonymes du DES.
Chaque synonymiste propose une définition de la synonymie qu'il applique lors de
l'élaboration de son dictionnaire. Bien souvent, ce sont des définitions très proches les
unes des autres étant donné que chacun s'inspirait de ses prédécesseurs. De plus, pour
les dictionnaires de type similaire, on peut comprendre que les définitions le soient
également. Cependant, chaque particularisme dû à tel ou tel auteur se retrouve dans le
DES puisque il est la somme de tous ces dictionnaires. Il reste à savoir si toutes
définitions aussi différentes ou semblables soient-elles correspondent ou tout du moins
sont compatibles avec celle en vigueur dans le DES. Quoi qu'il en soit, certains
dictionnaires pèsent davantage que d'autres du fait de la quantité de liens synonymiques
qu'ils apportent. Ils ne seront donc pas à négliger dans notre étude de la synonymie dans
le DES.
2.3.2. Lexicographie et synchronie
Les dictionnaires à l’origine du DES englobent, du fait de leurs dates d'édition une
période d'environ un siècle et demi. Durant un intervalle de temps si long, la langue a eu
le temps de changer. Intéressons-nous donc à l'aspect diachronique que recèle cette
étude métalexicographique.
Tous les lexicographes ou synonymistes n'explicitent pas quelles sont leur sources
mais certains le font. Guizot reprend un bon nombre d'articles de ses prédécesseurs,
principalement Girard et Roubaud. Le travail de Guizot n'est pas non plus purement
compilatoire, il a ajouté quelques articles de sa plume et a systématisé les analyses
pressenties par Roubaud. Quant à lui, Lafaye est davantage en rupture avec ses
prédécesseurs, il ne dit pas reprendre les articles d'autres synonymistes. Il semble
s'inspirer toutefois de Condillac. Mais est-ce de la méthode dont il s'est inspiré ou a-t-il
repris des articles de ce dernier ? Bailly n'explicite pas ses sources; pas davantage que
Bertaud du Chazaud, qui pourtant cite tous ses prédécesseurs en bibliographie ce qui
laisse entendre qu'il a pu s'en inspirer. En revanche, Bénac affiche clairement le fait qu'il
reprend Lafaye et sa méthode. Cependant, il opère une remise au goût du jour des
définitions et explications proposées par Lafaye lorsque celles-ci sont devenues désuètes
pour l'époque de Bénac, c'est-à-dire environ un siècle plus tard. Que les dictionnaires du
XXème siècle reprennent ceux du XIXème siècle, ceci est tout à fait légitime. Cependant,
pour ce qui est des dictionnaires du XIXème, la reprise concerne le XVIIIème siècle ce qui
étend la période de prise en compte des relations synonymiques dans le DES. Ainsi, le
DES, dictionnaire de synonymes conçu dans les années 1990 est bien plus qu'un simple
dictionnaire de la fin du XXème siècle. Il se retrouve avec des relations synonymiques
datant du XIXème siècle et voire du XVIIIème siècle. Le paramètre temporel n'est donc pas
à négliger, il doit même faire l'objet d'une étude attentive.
Mentionnons toutefois à ce sujet une idée de Bertaud du Chazaud selon laquelle on
ne peut pas faire abstraction de ce qui a déjà été fait, on est toujours plus ou moins
obligé de le reprendre :
Je reconnais tout ce que je dois à mes prédécesseurs proches ou lointains. En lexicographie, comme
dans les autres disciplines, il n'est pas admis d'entreprendre un travail sans tenir compte de ce qui a été
fait avant soi, et l'humble et patiente compilation y tient une place primordiale. C'est ensuite seulement
qu'on peut apporter sa pierre à l'édifice (Bertaud du Chazaud, 2003 : 13)46.
46
Bertaud du Chazaud, 2003, préface.
29
Ainsi, Bertaud du Chazaud reconnaît que le travail du synonymiste est avant tout un
travail de compilation. Cela explique l'apparition du type de dictionnaire des synonymes
qu'est le dictionnaire compilatoire. Il n'est pas ici question de blâmer les synonymistes.
Au contraire, leur travail passe inévitablement par une étape de compilation. Toutefois,
chaque dictionnaire a sa raison d'être puisque chacun apporte de la nouveauté qu'il
s'agisse de la manière de traiter la synonymie ou des nouveaux synonymes incorporés
aux dictionnaires. De même, S. Auroux formule une idée similaire, selon laquelle :
Si les grammaires et les dictionnaires sont des outils linguistiques, comme tous les objets techniques, ils
ont une existence propre et une histoire. Ce fait se manifeste en ce qu'ils obéissent à des procédures
d'accrétion : ils sont construits les uns à partir des autres, ajoutent des informations et de nouveaux
éléments. […] ils totalisent des usages correspondant à des compétences différentes, et c'est par là
qu'ils sont technologiquement utiles (Auroux, 1998 : 267).
Les dictionnaires sont donc le fruit d'une histoire. Ils sont intrinsèquement
compilatoires mais ne se départissent pas pour autant d'un caractère original et nouveau
qui fait leur unicité et leur intérêt (scientifique). En résumé, il ne peut être fait
abstraction du passé. D'ailleurs, nous devons distinguer diverses manières de reprendre
ses prédécesseurs. Dans la plupart des cas, ce qui est repris est la théorie ou la méthode
de travail des auteurs. Le fait est que les dictionnaires dont il est question ici sont des
dictionnaires distinctifs. Cependant, pour ce qui est des dictionnaires à caractère
compilatoire, c'est bien plus que la méthode qui est reprise, ce sont aussi les articles.
Cela nous montre que les dictionnaires des synonymes ont leur manière propre de
gérer le paramètre temporel. Un dictionnaire de langue fait état de celle-ci tous les ans
afin d'en montrer l'évolution et les changements. C'est le propre du dictionnaire de
langue. Mais ce n'est pas le cas du dictionnaire des synonymes. Bien évidemment,
l'intérêt éditorial de la publication annuelle d'un dictionnaire des synonymes est faible.
Mais cela s'explique également par le traitement de la synchronie et de la diachronie
dans les dictionnaires des synonymes. Nous avons montré que les dictionnaires des
synonymes ne s'attachaient pas à une seule synchronie. Bien au contraire, ils accumulent
les états sémantiques de la langue. En effet, chaque dictionnaire est une succession de
strates synchroniques. Cependant, il est difficile de déterminer sur quelle période s'étend
cette succession synchronique et de discerner de manière claire ces strates. Elle est bien
souvent indéfinissable, malgré ce qu'en disent les synonymistes. D'ailleurs, cette période
est souvent plus étendue que ce que qu'ils croient. Cela vient du fait qu'ils reprennent
partiellement leurs prédécesseurs. Bien sûr, les lexicographes sont vigilants quand à
l'usage synchronique de la langue. Ils se délestent des articles désuets de leurs
prédécesseurs afin de représenter au mieux l'état présent de la langue. Cependant, ils
sont influencés par les ouvrages de leurs prédécesseurs et ont tendance à considérer
encore comme présent des états de langue qui tendent à disparaître. Dès lors, ils ne sont
plus dans la stricte représentation de l'état présent de la langue mais l'élargissent aux
états précédents. D'ailleurs, certains lexicographes comme par exemple Bailly ou Bénac
reconnaissent qu'ils tiennent compte de lexèmes anciens et ce, pour diverses raisons.
C'est ainsi que les dictionnaires des synonymes font état d'une succession de synchronies
et non d'une seule synchronie. Certes, c'est aussi le cas des dictionnaires de langue mais
cela est bien plus flagrant avec les dictionnaires des synonymes étant donné que leurs
éditions sont bien moins rapprochées.
En résumé, tout dictionnaire des synonymes devient d'une certaine façon historique
puisqu'il tient compte des différents états de la langue. Mais cette idée doit être prise en
compte avec davantage d'attention pour ce qui est du DES.
Remarque sur les statistiques de répartition des synonymes dans les
dictionnaires comme outil d'analyse et de recherche :
Le DES est à l'origine un outil scientifique. Il est utilisé pour la recherche. D'ailleurs,
il existe des procédures pour vérifier la validité des résultats obtenus à la suite des
recherches. L'une d'elles permet de vérifier si les résultats obtenus sont aberrants ou
non. En réalité, il s'agit d'une relativisation des résultats obtenus en pondérant les
30
synonymes en fonction du nombre de dictionnaires dans lesquels ils apparaissent. Il est
possible d'obtenir un tableau des synonymes d'une unité lexicale en fonction des
dictionnaires dans lesquels se retrouvent ces synonymes.
Prenons l'exemple du mot courage pour illustrer la répartition des synonymes selon
leurs dictionnaires d'origine.
synonymes
Lafaye
Guizot
Bailly
Bénac
ardeur
assurance
audace
bras
bravoure
caractère
chaleur
cœur
confiance
conscience
constance
contenance
cran
cruauté
crânerie
culot
décision
estomac
fanatisme
fermeté
force
force d'âme
front
furie
générosité
hardi
hardiesse
héroïsme
impétuosité
intrépidité
31
Larousse
Robert
Du
Chazaud
passion
patience
persévérance
ressort
ressource
résistance
résolution
sentiment
solidité
stoïcisme
toupet
témérité
vaillance
valeur
vertu
volonté
zèle
âme
énergie
Tableau 2 : Répartition des synonymes de courage en fonction des dictionnaires d'origine.
Nous constatons que les quatre premiers dictionnaires, datant du XIXème et du début
du XXème siècle, sont les plus pauvres en synonymes, tout particulièrement le Guizot et le
Lafaye. N'oublions pas que ce sont des dictionnaires de type distinctif, c'est-à-dire qu'ils
ne sont pas attachés à la quantité de synonymes fournis mais plutôt aux distinctions
faites entre ces synonymes. En revanche, les trois autres dictionnaires, édités durant la
seconde moitié du XXème siècle, sont beaucoup plus fournis. D'ailleurs, c'est de ces
dictionnaires que provient la majorité des synonymes de l'entrée. Cela s'explique
d'autant mieux que ce sont des dictionnaires encyclopédiques pour ce qui est du Robert
et du Larousse. Quant à lui, le Bertaud du Chazaud est un dictionnaire cumulatif, donc il
privilégie la quantité de synonymes fournis.
Ainsi, plus grand est le nombre de dictionnaires dans lesquels se retrouve le
synonyme, plus celui-ci est légitimé. Cela permet de déceler les résultats aberrants qui
fausseraient les recherches et ainsi d'y remédier. Néanmoins, le fait que les lexicographes
s'inspirent de leurs prédécesseurs remet en partie en cause cette relativisation. Certes,
un synonyme qui se retrouve dans de nombreux dictionnaires a plus de légitimité qu'un
autre qui s'y trouverait dans de moindres proportions. Cependant, il faudrait savoir dans
quelle mesure ce synonyme a été repris d'un lexicographe à l'autre. Un synonyme
pourrait apparaître dans beaucoup de dictionnaires mais s'il a été repris de nombreuses
fois d'un dictionnaire à l'autre par les lexicographes, cette analyse statistique perd
quelque peu de sa pertinence. Il ne s'agit là que d'une remarque qui nous semblait
intéressante, notre but n'est pas de remettre en cause radicalement cette méthode.
Toutefois, il est peut-être raisonnable de la relativiser. Mais elle l'est encore davantage
par le fait que les dictionnaires les plus anciens fournissent peu d'entrées par rapport aux
32
dictionnaires les plus récents, ce qui fausse bien plus encore les résultats.
2.4. Le Dictionnaire Électronique des Synonymes
Comme nous l'avons dit, le Dictionnaire Electronique des Synonymes du CRISCO a été
conçu à partir de cinq dictionnaires de synonymes et des renvois synonymiques de deux
dictionnaires de langue. L'ensemble de ces dictionnaires a, au préalable, été numérisé
par l'INLF dans les années 1990/1991. Les entrées et les synonymes de ce dictionnaire
« proviennent de la fusion des sept fichiers contenant les relations présentes dans les
dictionnaires qui ont servi de base à cette construction, et qui nous ont été fournis par
l'Institut National de la Langue Française » (Manguin, 2004a : 2). C'est ainsi que le DES
se présente sous la forme « d'un fichier dans lequel chaque ligne contient un mot-vedette
suivi de la liste de ses synonymes » (Ibid. : 2). Au total, on compte « 49000 motsvedettes reliés les uns aux autres par un réseau de relation. Il y a relation lorsque les
deux vedettes sont synonymes et l'on dénombre un peu plus de 199000 relations pour
tout le dictionnaire » (François & Manguin, 2004 : 1).
Des dictionnaires ont ensuite été extraits toutes les entrées et leurs synonymes. Tous
les commentaires ont été supprimés. Il n'était pas possible de les conserver du fait de la
disparité qui existait entre les découpages et les commentaires de chaque lexicographe.
De ce fait, les dictionnaires ne se réduisaient plus qu'à de simples listes d'entrées avec
leurs synonymes, listes qui ont ensuite été fusionnées pour n'en former plus qu'une seule
qui deviendra le DES.
Tableau 3 : Les entrées et les relations dans le DES47.
Nous remarquons que la majeure partie des données de départ a été conservée. Les
entrées ou relations supprimées étaient le fait d'erreurs de numérisation. L'harmonisation
a également contribué à supprimer quelques entrées ou liens aberrants. Ceux qui ont été
ajoutés sont, pour la plupart, le fruit de la symétrisation, procédé majeur dans
l'élaboration du DES.
2.4.1. La définition de la synonymie dans le DES
Maintenant que nous avons détaillé comment était considérée la synonymie dans les
différents dictionnaires servant de base au DES, voyons quelle est la définition de la
synonymie qui est donnée par les lexicographes qui ont produit ce dictionnaire.
Avant toute chose, rappelons que la spécificité du DES est d'être un dictionnaire
électronique. Ainsi, il ne se présente pas de la même manière qu'un dictionnaire papier.
Tous les dictionnaires que nous avons mentionnés jusqu'à présent étaient des
dictionnaires des synonymes papier. Il nous a été aisé de trouver quelles étaient les
exigences que s'était donné chaque lexicographe dans son ouvrage en consultant
l'introduction de ces dictionnaires. Toutefois, le DES ne peut être pourvu d'une telle
introduction. Il n'est pas pour autant dépourvu d'une définition de la synonymie. Nous
l'avons trouvée sur la page « avertissement » disponible à partir de l'interface de
consultation. La définition donnée est la suivante :
Deux unités lexicales sont en pratique toujours partiellement synonymiques ; cela signifie que c'est
seulement dans un contexte donné que l'on peut remplacer l'une par l'autre sans modifier
47
Tableau issu de François & Manguin (2004 : 2).
33
notablement le sens de l'énoncé. Cela implique al+
ors qu'un autre synonyme ne conviendrait pas forcément à ce contexte.
Cette définition correspond à celle que nous avons déjà donnée. Cela se comprend
puisque Ploux et Victorri ont participé activement à l'élaboration du DES. La dernière
phrase de cette définition découle de ce qui est dit précédemment mais cette précision
est nécessaire pour les utilisateurs du dictionnaire non-initiés aux problématiques de la
synonymie. En effet, l'utilisateur pourrait rapidement trouver les propositions de
synonymes qui lui sont faites aberrantes, et ce, car il n'a pas forcément conscience de la
polysémie des unités lexicales. Il est donc nécessaire de rappeler que les synonymes
proposés ne correspondent qu'à certains contextes.
La suite de l'avertissement est celle-ci :
Certains mots ont ainsi des synonymes à connotation péjorative, injurieuse ou raciste qui ne peuvent
évidemment s'employer dans un contexte neutre, mais qui apparaissent néanmoins ici, puisque ce
dictionnaire est censé être le reflet de la langue dans ses divers emplois.
Les auteurs du DES se déchargent de toute critique en expliquant leur souci
d'exhaustivité qui oblige à considérer l'ensemble du vocabulaire de la langue française.
Enfin, l'avertissement nous informe de la raison de la sécheresse des résultats :
L'originalité de notre dictionnaire réside dans l'obtention des différences de sens par une analyse
mathématique des relations synonymiques ; c'est la raison pour laquelle nous avons volontairement
éliminé des résultats présentés les nuances d'emploi que l'on trouve dans les dictionnaires traditionnels.
Il aurait été impossible de conserver les distinctions et commentaires faits par les
lexicographes lors du traitement automatique des relations synonymiques.
Cela fait du DES un dictionnaire cumulatif au sens de Ferrara. Voyons donc plus en
détail comment peut être caractérisé le DES d'après la typologie de Ferrara.
2.4.2. Un dictionnaire compilatoire et cumulatif …
Le DES n'échappe pas à la règle : comme tous les autres dictionnaires des synonymes
déjà cités ici, il est compilatoire mais ce, de manière plus ostensible. Le DES est
clairement le fait d'une fusion de dictionnaires. Il reprend donc les dictionnaires
antécédents mais il ne faut pas oublier de mentionner que des relations synonymiques
ont été ajoutées « manuellement ». D'ailleurs, toutes les entrées des autres dictionnaires
n'ont pas nécessairement été retenues pour la confection de celui-ci. C'est en cela qu'il
est le fruit d'une histoire, la somme d'un genre. Cependant, il n'est pas dénué
d'originalité. Il apporte sa pierre à l'édifice selon l'expression de Bertaud du Chazaud.
Mais ceci sera traité dans le point suivant.
En tant que dictionnaire compilatoire, le DES est nécessairement placé dans une
perspective historique. Seulement se présente-t-il comme un dictionnaire synchronique ?
Ou assume-t-il son caractère diachronique ? Il est la somme de toutes les synchronies
dont sont faits les autres dictionnaires. Quelle attitude adopter face à cette épaisseur
historique ?
Nous avons dit que le DES se présentait sous la forme d'un fichier contenant une
entrée suivie de ses synonymes. L'informatisation du dictionnaire a nécessité que le
fichier final soit épuré de nombre de données que l'on retrouve dans certains
dictionnaires des synonymes. Il faut signaler que lors de l'élaboration du fichier final, « il
était impossible de conserver les distinctions et divisions d'articles faites dans certains
dictionnaires, en raison de l'hétérogénéité des classifications opérées suivant les
lexicographes48 » (Manguin, 2005 : 2). « Le fichier résultant de la fusion présente donc
une liste des synonymes "en vrac" » (Manguin, 2004a : 2). C'est donc l'hétérogénéité
des classifications opérées par les lexicographes et les besoins de l'informatique qui ont
fait du DES un dictionnaire cumulatif. En effet, il aurait été impossible de conserver un
grand nombre de données superflues lors de l'informatisation, l'implémentation
48
Manguin, 2005 reprend cette idée à Ploux, 1997.
34
informatique nécessitant une grande simplification et une épuration des données à
traiter.
On peut également penser que le DES, en tant que dictionnaire cumulatif, n'a pu voir
le jour que grâce à l'apparition de ce nouveau genre de dictionnaire des synonymes,
genre qui est apparu dans le courant du XXème siècle. En outre, seul ce type de
dictionnaire est implémentable. Ainsi, c'est la conjoncture de l'apparition de ce genre et
les possibilités offertes par l'informatique qui ont permis de concevoir le DES.
Le DES, dictionnaire cumulatif, ne fournit ni explication, ni définition, ni distinction.
Ne figure que la liste des synonymes. C'est un dictionnaire cumulatif le plus épuré qui
soit; on ne retrouve aucune précision de registre, aucune précision syntaxique. C'est ce
que Manguin nomme des réponses relativement abruptes. Cependant, « cette sécheresse
apparente est compensée par le nombre élevé d'entrées et par la grande rapidité
d'obtention des résultats » (François & Manguin, 2004 : 2). Comme tous les dictionnaires
cumulatifs, les explications font défaut ce qui peut laisser l'utilisateur sur sa fin. Mais ceci
est pallié par un hyperlien avec le TLFi. Bien sûr, cet hyperlien n'apporte que des
définitions aux entrées. Il ne fournit pas de distinctions entre les mots synonymes
comme c'est le cas dans les dictionnaires distinctifs.
2.4.3. … mais symétrisé
Comme nous venons de le voir, ce dictionnaire est un dictionnaire compilatoire.
Cependant, il apporte sa pierre à l'édifice d'après le terme de Bertaud du Chazaud. Cela
se traduit principalement par le caractère informatisé de ce dictionnaire. Toutefois nous
verrons au chapitre 4 l'apport de l'informatique à la synonymie. Considérons ici ce qui fait
l'originalité de ce dictionnaire d'un point de vue lexicographique. Dans un dictionnaire de
synonymes classique, figurent des liens de synonymie répertoriés par les lexicographes.
Étant un travail fait par l'humain, nous ne sommes pas à l'abri d'erreurs mais surtout
d'oublis. « Le contenu initial du dictionnaire […] reste néanmoins essentiellement
tributaire des relations posées par les auteurs des dictionnaires compilés » (Manguin et
alii, 2008b : 28). « Comme l'avait déjà signalé Kahlmann d'une part, le travail des
lexicographes peut être entaché d'oublis et d'autre part, même la compilation de
plusieurs ouvrages ne met pas à l'abri de telles lacunes » (Ibid. : 28). C'est là
qu'interviennent l'informatique et les méthodes d'enrichissement qu'elle propose. La
première méthode et la plus importante à ce jour est la symétrisation des relations
synonymiques déjà existantes.
Il a déjà été question des propriétés algébriques de la relation de synonymie, parmi
celles-ci, la symétrie. Une relation synonymique est symétrique c'est-à-dire que A est
synonyme de B et que B est synonyme de A. Néanmoins, nombre de lexicographes ont
omis cette propriété et c'est bien cela que cherche à pallier le DES. C'est ainsi qu'après la
numérisation des dictionnaires et la fusion de ces fichiers en un seul, les liens
synonymiques qui y figuraient ont été symétrisés. Grâce à cette symétrisation, les motsvedette ont gagné en synonymes, mais le dictionnaire a lui-même gagné en motsvedette. Ce procédé a donc permis de combler certains oublis et d'enrichir le dictionnaire.
Les définitions de la synonymie que se donnaient les lexicographes sont tournées
vers la production de texte tandis que celle du DES s'attache tout particulièrement à la
substitution en contexte, avec toute la rigueur que nécessite un tel processus. Ainsi, ces
définitions différentes dénotent des visées divergentes. Et pourtant, le DES a été créé à
partir de ces dictionnaires. Il semble donc tributaire des finalités adoptées par les autres
lexicographes. En outre, certains dictionnaires sont plus représentés dans le DES que
d'autres du fait du grand choix de synonymes qu'ils offrent. Par conséquent, certains
pèsent davantage que d'autres dans les résultats proposés par le DES, si bien que l'on
pourrait considérer qu'il se résume en quelques dictionnaires : le Bertaud du Chazaud, le
Larousse et le Robert, principalement. Cela a donc un impact non négligeable sur les
requêtes faites. Il faut en avoir conscience pour mieux apprécier et comprendre les
résultats obtenus. Cette problématique sera davantage mise au jour dans la section
portant sur l'hyperonymie.
35
Le DES est issu de dictionnaires papier. De ce fait, il dépend de ces dictionnaires, de
leur définition de la synonymie. Ainsi, il était justifié d'étudier ces différents dictionnaires
pour comprendre en profondeur le DES. Toutefois, n'oublions pas que le caractère
innovant du DES vient du fait que c'est un dictionnaire électronique. Il nous faut
expliquer les aspects techniques du DES et son arrière-plan théorique afin de comprendre
son fonctionnement et d'en optimiser l'utilisation.
36
3. Description du DES: aspects techniques
3.1. Protocole expérimental
Le DES a pour arrière-plan théorique la construction dynamique du sens de Victorri et
Fuchs. Ainsi, il est en partie la concrétisation d'une théorie. Dans une perspective
épistémologique, en déduction, la théorie formule des hypothèses qui seront ou non
validées par l'expérimentation. Cette expérimentation se traduit par l'utilisation de
moyens techniques qui sont aujourd'hui, pour beaucoup, de nature informatique.
L'informatique a pris une place de plus en plus importante dans les sciences du langage comme d'ailleurs
dans toutes les disciplines qui relèvent de ce que l'on appelle aujourd'hui les sciences cognitives (Victorri
& Fuchs, 1996 : 87).
En effet, c'est « un moyen efficace de mettre en œuvre un protocole expérimental de
validation de la théorie » (Ibid. : 88). Ceci peut se résumer sous la forme de ce schéma
(Ibid. : 89) :
théorisation
description
linguistique
====>
implémentation
modèle mathématique
<=================
expérimentation
=====>
système
informatique
==============
Toute théorie déductive formule des hypothèses générales (il ne faut pas oublier que
ces hypothèses n'ont pas été formulées in abstracto mais en réalité, elles découlent d'un
processus inductif puisqu'elles sont forcément basées sur un minimum d'observations
avant d'être formulées). L'ensemble de ces hypothèses compose une théorie qu'il faut
donc tester. Toute théorie doit être formalisée d'après un modèle mathématique afin de
pouvoir être exploitable. Dès lors, une implémentation, informatique en l'occurrence, est
envisageable puisque rendue possible par la modélisation. Ainsi, le système informatique
sera la concrétisation de la théorie mais aussi un moyen de la valider ou au contraire de
l'invalider.
Pour appliquer cette explication générale à notre cas particulier, nous dirons que la
théorie correspond à la construction dynamique du sens. Elle a été modélisée
mathématiquement. Enfin, le modèle mathématique est implémenté à l'aide des réseaux
connexionnistes « parce qu'ils permettent (du moins certains d'entre eux) d'implémenter
des systèmes dynamiques » (Ibid. : 88). Seule précision des auteurs de la théorie :
« nous ne faisons pas de modélisation informatique à proprement parler, nous ne faisons
que retranscrire sous forme informatique un modèle élaboré par ailleurs » (Ibid. : 88).
« Ceci dit, cette implémentation reste indispensable : en effet, c'est le seul moyen de
pouvoir traiter des exemples concrets, susceptibles de valider ou d'invalider le modèle
mathématique » (Ibid. : 88). Effectivement, nous pouvons dire que le DES fournit des
représentations du sens et donne des exemples concrets de polysémie.
Toutefois, il faut garder à l'esprit que l'implémentation peut apporter des distorsions
par rapport à la théorie.
3.2. La symétrisation
La propriété de symétrie a fait l'objet de développements dans la thèse de Kahlmann,
intitulée « Traitement automatique d'un dictionnaire de synonymes »49. Son étude l'a
amené à proposer la symétrisation des relations synonymiques dans les dictionnaires
49
Kahlmann, 1975.
37
électroniques des synonymes. Au prime abord, il avait pensé que les relations de
synonymie étaient des relations orientées si bien qu'elles ne pouvaient être symétriques
et donc symétrisées. Cependant, il est revenu sur cette hypothèse : il a réussi à prouver
que la relation de synonymie était symétrique et a donc proposé la symétrisation des
relations synonymiques. Et même, « il en arrive ainsi à considérer que la symétrisation
améliore sensiblement la qualité du dictionnaire, sans pour autant engendrer de relations
aberrantes » (Manguin, 2004b : 2). En effet, la synonymie est symétrique, elle est donc
non-orientée. Ainsi, toutes les relations du dictionnaire qui ne seraient pas bidirectionnelles seraient manquantes. Un important travail de complémentation peut donc
être effectué pour retrouver ces liaisons manquantes. Nous avons vu dans la partie
précédente que la symétrisation du DES permet de combler les omissions des
lexicographes ce qui enrichit le dictionnaire.
L'application de ce procédé a été effectuée automatiquement. Cela a consisté à
détecter les relations synonymiques qui n'étaient pas symétriques : le mot A possède
comme synonymes le mot B, cependant A ne figure pas dans la liste des synonymes de
B. Ainsi, la relation allant de B vers A était manquante, il fallait l'ajouter. A l'aide d'un
programme informatique, cette opération a été effectuée automatiquement, donc sans
risque d'oublis et a enrichi le dictionnaire en liens synonymiques. Néanmoins, cette
méthode a également permis d'enrichir le dictionnaire en entrées. En effet, certains mots
figurant dans les listes de synonymes n'étaient pas présents en tant que mots vedettes
dans la base de données du dictionnaire. Il a donc fallu les ajouter, enrichissant encore
davantage le dictionnaire. Ces enrichissements fructueux vantent les mérites de l'apport
informatique à la synonymie dont nous traiterons dans la section suivante.
3.3. Description de la ressource
3.3.1. Le DES : un immense réseau ou un graphe multidimensionnel
Le DES a pour fondement théorique la théorie de la construction dynamique du sens.
Comme nous venons de l'expliquer dans le protocole expérimental, cette théorie a été
modélisée grâce à des outils mathématiques et ensuite implémentée à l'aide d'un
système informatique. Ce protocole expérimental obtenant des résultats satisfaisants, il a
dès lors été possible de l'élargir à une plus grande quantité de données : un dictionnaire
des synonymes par exemple.
Avant d'être un dictionnaire des synonymes, le DES est un réseau de connexions.
Cela vient du fait que le DES est issu du modèle des réseaux connexionnistes qui permet
d'implémenter des phénomènes de réseaux. Expliquons ce qui fait du DES un réseau. Les
mots vedettes du DES sont des points à partir desquelles partent des connexions qui
relient ces points les uns aux autres par un jeu de relations synonymiques. Ceci forme
bien un réseau car du fait de leur polysémie les entrées possèdent plusieurs synonymes.
Et chacun de ces synonymes possèdent à son tour un certain nombre de synonymes.
C'est ainsi que de proche en proche les entrées sont reliées entre elles formant un
immense réseau interconnecté. Bien que ce soient des cas particuliers, il faut noter
l'existence d'isolats. Il s'agit de groupe de mots vedettes reliés entre eux mais qui ne
connaissent aucune relation avec d'autres entrées. Ils semblent former un groupe
autarcique sans lien avec l'extérieur. Ces isolats sont rares et ne concernent que des
entrées très particulières comme par exemple des noms propres. Pour illustrer ceci, nous
prendrons l'exemple du nom propre Le Diable et de ses synonymes qui sont : Le Démon,
Le Malin, Le Maudit, Lucifer, Méphistophélès, Satan. Les cliques associées à cette entrée
sont :
Le Démon, Le Diable
Le Diable, Le Malin
Le Diable, Le Maudit
Le Diable, Lucifer, Satan
Le Diable, Méphistophélès, Satan
38
Si l'on observe les cliques de chacun de ces synonymes, on obtient exactement
toutes les cliques de l'entrée Le Diable. Ainsi, tous ces mots ne possèdent de liens
synonymiques qu'entre eux, aucun n'est relié à d'autres entrées du réseau. Ils forment
donc un groupe à part entière sans connexion avec le reste du réseau. C'est ce que nous
appelons un isolat.
Abstraction faite des ces isolats, le DES, en tant que réseau peut également être
conçu sous la forme d'un graphe, mais un graphe à n dimensions, n étant le nombre
d'entrées du dictionnaire. Selon cette conception, les entrées du DES seraient les
sommets du graphe et les relations synonymiques seraient les arêtes reliant ces
sommets. « Ce graphe possède 49 000 sommets et environ 400 000 arêtes » (François &
Manguin, 2004 : 11). Il est dit multidimensionnel car il faut imaginer chaque entrée
comme une dimension. Ainsi, il y a autant de dimensions que d'entrées. Des dimensions
qui se coupent possèdent donc un lien de synonymie. Nous savons que la synonymie est
symétrique, nous comprenons donc que quelle que soit la dimension prise en compte au
départ, le lien synonymique sera toujours présent. Si la dimension de A coupe celle de B,
alors il y a une relation de synonymie allant de A à B. De même, si la dimension de B
coupe celle de A, il y a une relation de synonymie allant de B à A. Ici, nous ne prenons
l'exemple que deux dimensions mais il y en a plusieurs milliers dans le DES. Il semble
donc impossible de les représenter et d'apprécier leur répartition. Et pourtant, une astuce
a été trouvée. Nous verrons donc dans le point suivant sur les espaces sémantiques
comment peuvent être visualisées ces dimensions du graphe.
3.3.2. Les espaces sémantiques
3.3.2.1. L'espace sémantique d'après la construction dynamique du sens
D'après la théorie de la construction dynamique du sens, l'espace sémantique est « la
première étape de construction du modèle [qui] consiste à associer à toute expression
polysémique un espace, que l'on appellera son espace sémantique » (Victorri & Fuchs,
1996 : 67). Dans cet espace sémantique seront représentés « les différents sens que
prend cette expression dans différents énoncés » (Ibid. : 67). Cela revient à représenter
la polysémie ou l'homonymie de cette expression. « Plus précisément, le sens de
l'expression dans un énoncé sera modélisé par une région dans l'espace sémantique
associé à l'expression » (Ibid. : 67). A autant de régions correspondront autant de sens.
Cette représentation graphique par un nuage de points permet d’« associer au sens
de l'expression dans un énoncé une région de l'espace sémantique » (Ibid. : 68) comme
nous l'avons déjà dit, mais cela afin de « prendre en compte le fait que les sens de
l'expression dans deux énoncés différents peuvent « se recouper » c'est-à-dire partager
une partie commune, sans pour autant être parfaitement identiques » (Ibid. : 68). Cela
correspond à une caractéristique de la polysémie : elle se fait par glissements de sens
successifs. Un noyau de sens demeure commun mais de nouveaux sens s'agglutinent
accentuant la polysémie de l'unité lexicale considérée. « L'expression admet, pour deux
énoncés différents, un certain nombre de paraphrases communes mais [où] en plus, pour
l'un des deux énoncés au moins, il existe d'autres paraphrases spécifiques qui ne
conviennent pas à l'autre énoncé » (Ibid. : 68) du fait du glissement polysémique.
« Modéliser le sens par des régions permet de traiter ces cas de manière très simple (les
deux régions correspondantes ont une intersection non nulle) » (Ibid. : 68). Deux régions
s'entrecoupent puisqu'elles ont une partie de leur sémantisme en commun. Cependant,
certains traits spécifiques les différencient. De proche en proche, les régions s'enchaînent
de partie commune en partie commune si bien qu'elles représentent la polysémie qui
s'effectue par rayonnement ou enchaînement. Ce point concernant le recoupement sera
développé ci-après lors de la définition des cliques. Mais voyons déjà ce qu'est une
visualisation d'espace sémantique.
3.3.2.2. La visualisation de l'espace sémantique
39
« Une visualisation idéale d'un espace sémantique présenterait autant de dimensions que
de synonymes conformément au modèle mathématique qui construit cet outil » (François
& Manguin, 2004 : 31). Ainsi, on obtiendrait un espace multidimensionnel associé à une
entrée, sous-graphe du graphe total qu'est le dictionnaire. Une réduction de l'espace
multidimensionnel s'impose opérant de ce fait, une coupe en deux dimensions du sousgraphe afin de pouvoir le visualiser. Les visualisations sont générées par le logiciel
VisuSyn sous forme d'un nuage de points, ces points étant soit des synonymes, soit des
cliques.
« Le sens du mot-vedette se trouve ainsi matérialisé sous la forme d'un nuage de
point qui se déploie dans cet espace imaginaire. Pour arriver à une représentation visible
(c'est-à-dire) de ce nuage de points nous effectuons sur ces coordonnées une analyse
factorielle des correspondances dont le but est de fournir les plans selon lesquels il est
plus intéressant d'observer notre nuage de points » (Ibid. : 13). Il est possible de
visualiser différents plans en changeant les coordonnées des axes. « Le logiciel propose
par défaut la visualisation de l'espace sémantique sur le plan défini par les deux
premières dimensions, c'est le plan sur lequel les cliques apparaissent le mieux
distribuées » (Ibid. : 14). « La répartition de ces points dans l'espace donne visuellement
une idée de la proximité ou de l'éloignement entre ces différents sens » (Manguin,
2004a : 9). C'est à partir de l'intersection des axes que se déploie le nuage si bien que
l'on peut considérer que l'entrée dont c'est la visualisation se situe à l'origine de ce
graphe. L'axe des abscisses et celui des ordonnées « n'ont pas de valeur intrinsèque »
(François & Manguin, 2004 : 14). Sur cet exemple, nous voyons que le sens le plus
courant de maison c'est-à-dire foyer correspond à une région très dense en synonymes
et proche de l'origine. Les sens de maison en tant que bâtiment (bâtiment ou taudis)
sont moins denses et s'éloignent de l'origine. Enfin, les sens comme entreprise, lignée et
gens sont peu fournis en synonymes et très éloignés de l'origine.
Figure 2 : Visualisation de l'espace sémantique de maison50.
La coupe du sous-graphe qui correspond à une simplification apporte des distorsions.
50
Graphique issu de François & Manguin (2004 : 20).
40
En effet, le passage d'un graphe multidimensionnel à un sous-graphe en deux dimensions
implique nécessairement des rapprochements de points pourtant très éloignés les uns
des autres du fait du placage des dimensions les unes sur les autres. Par exemple, la
coupe « dérobe obligatoirement à la vue une partie des configurations en donnant pour
toute dimension orthogonale au plan sélectionné une impression de proximité entre deux
points du nuage très éloignés » (Ibid. : 31). Toutefois, le DES apporte une solution
partielle à ce problème car il est possible de zoomer la visualisation ou de changer
l'orientation du sous-graphe à l'aide de la rubrique « Choix des axes », ce qui revient à
« faire ‘tourner’ la représentation » (Ibid. : 14).
Voici un exemple dont la visualisation nécessitait d'être zoomée pour être plus lisible. Il
s'agit de la visualisation du verbe entendre :
Figure 3 : Visualisation de l'espace sémantique du verbe entendre51.
Nous remarquons que cette visualisation est difficilement compréhensible puisque
bon nombre des cliques sont regroupées dans un espace réduit. Ceci est dû à l'extrême
éloignement de certains synonymes (désirer / exaucer) qui désaxe l'origine du graphe. Il
est toutefois possible de les discerner davantage à l'aide de la fonction zoom. Voici donc
un zoom opéré sur cet agglomérat de cliques :
51
Graphique issu de François & Manguin (2004 : 25).
41
Figure 4 : Zoom sur l'espace sémantique du verbe entendre52.
Nous obtenons une bien meilleure lisibilité de cet agrégat de cliques ce qui permet
d'avoir une meilleure appréciation de leur répartition. Cependant, on peut « faire
tourner » la représentation. Pour cela, il faut changer les axes du graphe jusqu'à obtenir
une représentation satisfaisante. Voici ce qu'un changement d'axe peut donner pour
l'exemple du verbe entendre en reprenant la visualisation initiale :
Figure 5 : Visualisation de l'espace sémantique du verbe entendre53.
52
53
Graphique issu de François & Manguin (2004 : 26).
Graphique issu de François & Manguin (2004 : 27).
42
Dès lors, nous obtenons un aperçu de la répartition des sens d'une toute autre
nature, aperçu qui, d'ailleurs, est plus satisfaisant. Ce qui était un agglomérat dans la
première représentation a tendance à se délier dans cette seconde représentation,
éparpillant les sens ce qui permet d'avoir une meilleure vision de leur répartition réelle.
Les synonymes à l'origine accolés les uns aux autres sont en réalité très éloignés. Les
synonymes comme cultiver et préférer qui étaient quasi superposés dans le zoom sont en
fait aux antipodes avec cette nouvelle visualisation.
3.3.2.3. Remarque sur les graduations
Dans le menu associé à la visualisation, il existe une fonction « zoom » qui permet de
grossir une partie du graphe qui serait très dense et ainsi d'en avoir un meilleur aperçu,
comme nous venons de le montrer. Toutefois, le pourcentage de zoom n'est pas précisé.
Il dépend seulement de la taille de la région sélectionnée. Comme aucune graduation ne
figure sur les axes, on ne peut se faire une idée de l'échelle de la visualisation. Ceci pose
d'autant plus de problèmes que l'entrée considérée possède peu de synonymes. En effet,
prenons l'exemple d'un mot-vedette ne possédant que quelques synonymes répartis en
deux cliques. Lors de la visualisation de l'espace sémantique, les deux cliques
symbolisées par deux points seront très éloignées l'une de l'autre. Cela donne
l'impression d'une très grande discrimination du sens alors que, vraisemblablement, ce
sont des cliques très proches. Ceci est flagrant avec le mot-vedette Le Diable.
Figure 6 : Visualisation de l'espace sémantique de Le Diable.
Cet exemple nous montre que les deux cliques associées à l'entrée Le Diable sont
très éloignées l'une de l'autre sur cette représentation alors qu'elles n'ont qu'un terme de
différence. Cela donne l'impression que ces cliques ont des sens très éloignés
sémantiquement. Mais en raison du peu de cliques présentes sur l'espace sémantique, la
moindre différence de sens se trouve accentuée.
Ainsi, la représentation de l'espace sémantique prend une apparence faussée du fait
43
de l'absence de graduation. Si des graduations étaient présentes dans le cas que nous
venons de mentionner, il serait tout de suite possible de comprendre que ces cliques sont
en réalité très proches. Certes, il ne faut pas oublier que les axes du graphe n'ont pas de
valeur intrinsèque. Il semble donc impossible de leur attribuer une réelle graduation.
Toutefois, la répartition du nuage de points ne s'est pas faite au hasard.
Ce ne sont pas les axes de l'espace sémantique qui déterminent l'échelle puisqu'ils
ne sont pas gradués. Cependant, ces axes ont souvent une légitimité, ils délimitent de
grands ensembles de synonymes. Ils ont plutôt une portée linguistique mais celle-ci
change à chaque nouvelle entrée et à chaque changement d'axe. En revanche, il y a bien
une échelle mathématique et c'est justement cette échelle qui détermine l'éloignement
des points à partir de l'origine et entre eux. Rappelons que les mots du dictionnaire sont
liés par des connexions synonymiques puisque le DES est un réseau. Ainsi, l'échelle est
basée sur le nombre de connexions qu'entretiennent entre eux les mots. Plus ils ont de
synonymes en commun, plus ils seront représentés avec proximité dans l'espace. Un seul
synonyme en commun constitue l'extension maximale entre deux synonymes. C'est là
l'unité de l'échelle en sachant que les autres relations ne peuvent qu'être inférieures à
cette unité. En effet, deux mots ayant en commun deux synonymes auront une relation
de moitié inférieure par rapport à l'unité. De même pour deux mots qui auraient en
commun trois synonymes, la représentation de leur relation équivaudrait à un tiers de
l'unité. Et ainsi de suite. Bien sûr, il ne s'agit là que d'une échelle mathématique (échelle
que l’on pourrait appeler hyperbolique) qui découle de la modélisation des relations
sémantiques par les réseaux connexionnistes. Cependant, cette modélisation a été
justifiée a posteriori puisqu'elle a permis d'éclairer certains mécanismes linguistiques,
notamment la polysémie et la synonymie. Cette justification a posteriori lui confère donc
une légitimité mais il n'en demeure pas moins que des résultats aberrants du point de
vue linguistique subsistent.
3.3.2.4. Les cliques : atomes de sens
L'espace sémantique d'une entrée est un nuage de points d'un espace multidimensionnel
réduit à deux dimensions : « nous considérons que les cliques sont les points de l'espace
multidimensionnel et que les vecteurs unitaires de cet espace sont les synonymes »
(François & Manguin, 2004 : 12).
Chaque clique regroupe plusieurs synonymes de l'entrée en sachant que chacun de
ces synonymes est synonyme avec l'ensemble des synonymes de la clique 54. Cela forme
un groupe de synonymes représentant un sens particulier du mot-vedette. On qualifie
donc les cliques d'atomes de sens. « Cette propriété nous conduit à les assimiler aux
sens élémentaires du mot-vedette » (Ibid. : 6). D'ailleurs, elles permettent une très
grande dissociation du sens de l'unité lexicale. En observant, les listes de cliques
associées à chaque mot-vedette, on peut remarquer que « entre deux cliques la nuance
est parfois extrêmement fine » (Ibid. : 6). En effet, bien souvent, les cliques ne diffèrent
les unes des autres que par un synonyme de différence. Cela renvoie à ce que nous
avons dit plus haut à propos des espaces sémantiques : les régions de l'espace
sémantique associées aux sens peuvent se recouper. Ainsi, on le comprend d'autant
mieux avec les cliques. Les cliques se chevauchent mais ne se recouvrent pas. Elles sont
comme les tuiles d'un toit si bien que François parle du tuilage des cliques pour expliquer
leur disposition dans l'espace sémantique. Une hypothèse découle de cette définition des
cliques : « si un synonyme recouvre beaucoup de sens élémentaire du mot-vedette il est
assez proche de ce dernier au point de vue sémantique » (Ibid. : 6). En effet, « les
synonymes sont des portions de l'espace, la zone d'influence de chaque synonyme
englobant les cliques où celui-ci est représenté » (Manguin, 2004a : 10).
Lors de la visualisation de l'espace sémantique, il est possible d'avoir accès à
l'ensemble des cliques associées à une entrée ou à n'avoir accès qu'aux cliques dans
lesquelles figure un synonyme donné. Il suffit pour cela de cliquer sur le synonyme en
54
L'on pourrait dire qu'il s'agit d'atome de transitivité puisque chaque élément de la clique est synonyme des autres. Ces
cliques pallient donc la propriété algébrique qui manque à la synonymie.
44
question, dans la liste qui est fournie avec la visualisation du nuage de points.
Voici un exemple de liste de cliques. Ce sont les cliques du verbe entendre55 :
1 : admettre, comprendre, concevoir, entendre, voir
2 : admettre, confesser, entendre, reconnaître
3 : admettre, consentir, entendre
4 : apprécier, comprendre, compter, entendre
5 : apprécier, comprendre, concevoir, connaître, entendre, voir
6 : apprécier, comprendre, concevoir, entendre, saisir, voir
7 : apprécier, comprendre, connaître, entendre, sentir
8 : apprécier, connaître, discerner, entendre, juger, voir
9 : apprécier, connaître, discerner, entendre, sentir
10 : apprécier, discerner, entendre, saisir, voir
11 : apprécier, entendre, goûter, sentir
12 : appréhender, comprendre, concevoir, connaître, entendre
13 : appréhender, comprendre, concevoir, entendre, saisir
14 : appréhender, comprendre, connaître, entendre, pénétrer
15 : appréhender, comprendre, entendre, pénétrer, saisir
16 : appréhender, concevoir, connaître, entendre, percevoir
17 : appréhender, concevoir, entendre, percevoir, saisir
18 : appréhender, connaître, entendre, percevoir, pénétrer
19 : appréhender, entendre, percevoir, pénétrer, saisir
20 : assister, entendre, voir
21 : attraper, entendre, pénétrer, saisir
22 : auditionner, entendre
23 : avoir une idée, entendre
24 : bien prendre, entendre
25 : comprendre, concevoir, connaître, embrasser, entendre, voir
26 : comprendre, concevoir, entendre, réaliser, saisir, voir
27 : comprendre, connaître, embrasser, entendre, pénétrer, voir
28 : comprendre, connaître, entendre, pénétrer, sentir
29 : comprendre, entendre, interpréter, pénétrer, saisir
30 : comprendre, entendre, pénétrer, réaliser, saisir, voir
31 : comprendre, entendre, se rendre compte, sentir
32 : compter, entendre, posséder
33 : concevoir, connaître, entendre, percevoir, voir
34 : concevoir, entendre, percevoir, saisir, voir
35 : connaître, discerner, entendre, juger, reconnaître
36 : connaître, discerner, entendre, percevoir, sentir
37 : connaître, discerner, entendre, percevoir, voir
38 : connaître, entendre, percevoir, pénétrer, sentir
39 : connaître, entendre, percevoir, pénétrer, voir
40 : connaître, entendre, posséder, pénétrer
41 : connaître, entendre, pratiquer, voir
42 : cultiver, entendre, pratiquer
43 : discerner, distinguer, entendre, juger, reconnaître
44 : discerner, distinguer, entendre, juger, voir
45 : discerner, distinguer, entendre, percevoir, saisir, voir
46 : distinguer, entendre, préférer
47 : désirer, entendre, exiger, prétendre, souhaiter, vouloir
48 : entendre, exaucer, satisfaire, écouter
49 : entendre, juger, se rendre compte
50 : entendre, ouïr, percevoir, écouter
51 : entendre, percevoir, pénétrer, saisir, voir
52 : entendre, percevoir, se rendre compte, sentir
55
Liste issue de (François & Manguin, 2004 : 7-8).
45
53 : entendre, percevoir, voir, écouter
54 : entendre, pratiquer, réaliser, voir
3.3.2.5. Les composantes connexes
Le nuage de points qu'est l'espace sémantique peut être décomposé en cliques mais
aussi découpé en composantes connexes. Ces dernières regroupent des ensembles de
cliques. Il ne s'agit plus d'avoir des ensembles de synonymes tous synonymes entre eux.
Non, le critère est plus lâche : « chaque membre de ces groupes est synonyme d'au
moins un autre membre » (François & Manguin, 2004 : 6). Ainsi, au sein de ces
composantes connexes, la cohésion est assez faible. Ici, il n'est plus question de
transitivité entre les synonymes.
Cette notion de composante connexe est issue de la théorie des graphes de Berge
(1967) : « les groupes où il existe un chemin de longueur quelconque entre toute paire
de sommets sont appelés "composantes connexes" » (Ibid. : 12). Rappelons seulement
que chaque entrée est un sommet du graphe qu'est le DES et que les arêtes reliant ces
entrées sont les relations synonymiques qui les lient. Ainsi, tant que des sommets
peuvent être reliés par des arêtes, ils font partie de la même composante connexe. Cela
permet de rassembler les synonymes en des ensembles vastes. « Ils correspondent
généralement à des séparations homonymiques du mot-vedette » (Ibid. : 6). En effet,
nous avons dit que les cliques représentaient les sens d'une entrée. Le tuilage des cliques
évoque le glissement progressif de la polysémie, puisque les sens sont toujours reliés les
uns aux autres. En revanche, des homonymes n'ont aucun sens en commun si bien qu'ils
appartiennent à des composantes connexes différentes. Le glissement polysémique est
rompu, c'est alors de l'homonymie. Par conséquent, les composantes connexes servent à
la distinction entre polysémie et homonymie.
Prenons l'exemple de l'entrée baie qui est assez représentatif du point de vue de la
distinction entre polysémie et homonymie :
Figure 7 : Visualisation de l'espace sémantique de baie56.
Comme nous le montre la visualisation de l'espace sémantique suivante, les synonymes
de baie se répartissent en deux ensembles bien distincts. Nous avons donc affaire à deux
ensembles homonymiques.
56
Graphique issu de François & Manguin (2004 : 13).
46
Ceci peut être schématisé de la manière suivante :
Figure 8 : Schéma représentant l'articulation des deux composantes connexes de baie
autour de ses principaux synonymes57.
Sur le schéma, les pointillés rouges symbolisent les relations synonymiques entre
l'entrée et ses synonymes, tandis que les traits pleins noirs représentent les cliques
associant entre eux les synonymes de baie. On remarque donc qu'il n'existe aucun lien
entre les synonymes de baie en tant que fruit et les synonymes de baie en tant que
fenêtre ou crique. Ainsi, il s'agit bien de sens homonymiques n'ayant rien en commun du
point de vue sémantique, le seul point commun étant le signifiant baie. Ceci est déjà
visible dans l'espace sémantique : fruit et crique/fenêtre sont clairement distincts et en
outre, ils sont séparés par l'axe des ordonnées. En revanche, crique et fenêtre sont reliés
entre eux en raison du terme échancrure qui forme des cliques à la fois avec golfe et
ouverture. Tous ces synonymes forment la seconde composante connexe de baie
puisqu'ils sont tous reliés entre eux. Tous ces sens sont polysémiques puisqu'ils forment
une seule composante connexe constituée de plusieurs cliques. Ainsi, plusieurs
composantes connexes témoignent de sens homonymiques. Et une composante connexe
découpée en plusieurs cliques témoignent de sens polysémiques. En outre, la
composante connexe permet d'apprécier le glissement polysémique qui relie entre eux
les différents synonymes de cette composante.
3.3.3. Interface de recherche
Sur Internet, dès lors qu'on a cliqué sur le lien du DES dans un moteur de recherche, l'on
est aussitôt envoyé sur l'interface de recherche qui
se présente sous la forme d'un formulaire contenant un champ unique dans lequel l'utilisateur va taper
le mot dont il recherche les synonymes. En réponse à sa requête, il reçoit une page contenant la liste
des synonymes et un classement fondé sur le nombre de connexions que ces synonymes forment entre
eux » (François & Manguin, 2004 : 5).
Toutefois, la requête est analysée au préalable par un lemmatiseur. C'est un programme
qui redirige les requêtes demandées sous formes fléchies vers le mot-vedette. Le DES
dispose également d'un correcteur orthographique automatique. Cependant, il est
possible que des mots ne figurent pas dans le DES. Dans ce cas, il s'agit soit de mots
57
Schéma issu de François & Manguin (2004 : 12).
47
spécifiques si bien qu'ils n'ont pas de synonymes, soit de lacunes du dictionnaire, auquel
cas un travail lexicographique serait nécessaire pour pallier les manques du DES. Mais
gardons à l'esprit le fait que le travail lexicographique se doit d'être incessant étant
donné que la langue ne cesse de s'enrichir de nouveaux sens et de nouvelles unités
lexicales.
3.3.4. Liste des synonymes
Une fois la requête faite, nous obtenons la liste des synonymes. La page obtenue est
pourvue d’un lien vers le TLFi. En effet, le DES est un dictionnaire des synonymes de
type cumulatif. Il s'agit donc de cumuler la plus grande quantité de données
synonymiques. La liste des synonymes obtenue est dépourvue de commentaires ou
autres indications. En conséquence, un dictionnaire de langue s'impose. L'hyperlien
conduisant au TLFi est donc tout à fait adéquat pour cet usage.
En plus de cette hypernavigation externe, le DES est pourvu d'une hypernavigation
interne. En effet, il suffit de « cliquer sur un terme de la liste pour obtenir ses
synonymes, puisque chaque terme est lui-même un lien vers sa propre liste de
synonymes » (François & Manguin, 2004 : 5). Ainsi, cette hypernavigation aussi appelée
hypertextualité permet aux utilisateurs de voyager d'un mot à un autre. Si les résultats
obtenus à la suite d'une requête ne satisfont pas l'utilisateur, il peut alors cliquer sur un
autre terme qui l'amènera vers ses synonymes, et ainsi de suite jusqu'à obtenir
satisfaction dans ses recherches. De ce fait, l'hypernavigation « permet aux utilisateurs
de trouver rapidement le terme qui leur manque » (Ibid. : 4).
Le DES donne en réalité à voir deux listes de synonymes. L'une, la première apparaît
une fois les résultats de la requête obtenus. On demande les synonymes d'un mot et
ceux-ci apparaissent dans l'ordre alphabétique. L'autre liste apparaît lors de la
visualisation de l'espace sémantique. Cette liste permet de savoir quels sont les
synonymes qui apparaissent dans l'espace sémantique mais aussi, de sélectionner un
synonyme dans cette liste pour qu'il soit signalé sur la visualisation. Toutefois, ces deux
listes ne sont pas équivalentes. Il arrive que la liste de l'espace sémantique soit moins
riche que la liste des résultats de la requête. Cela s'explique ainsi : les cliques de deux
membres ne figurent pas sur l'espace sémantique si bien que les mots qui apparaissent
seulement dans ces cliques binaires ne sont pas représentés dans la liste de synonymes
de l'espace sémantique. En effet, ils forment des cliques de deux mots. Dans l'espace
sémantique, seules les cliques de trois mots et plus apparaissent. Pour reprendre un
exemple déjà cité, comparons les listes de synonymes de Le Diable. La liste qui figure qui
apparaît lors de la requête est la suivante : Le Démon, Le Malin, Le Maudit, Lucifer,
Méphistophélès, Satan. En revanche, cette liste se réduit de moitié lorsqu'elle apparaît
avec l'espace sémantique. En effet, ne subsistent que les mots suivants : Lucifer,
Méphistophélès, Satan. Les trois qui ont disparu ne forment que des cliques binaires avec
l'entrée Le Diable, ils ne peuvent donc figurer dans l'espace sémantique et a fortiori dans
la liste des synonymes de l'espace sémantique.
Sans l'informatique et les possibilités qu'elle offre, le DES n'aurait pu être crée. En
effet, c'est grâce à l'informatique que le modèle mathématique dont le DES est issu a pu
être implémenté et donc testé. Les tests étant satisfaisants, la méthode a pu être
généralisée jusqu'à former un dictionnaire entier. Le DES a cela de particulier qu'il permet
une représentation du sens si bien qu'il sert entre autres à détecter la polysémie des
unités lexicales. Mais n'oublions pas que le DES transforme la conception que l'on avait
du dictionnaire et de la dictionnairique du fait de sa mise en ligne.
48
4. Les Apports de l'informatique à la synonymie
Nous nous intéressons à l'approche instrumentée de la synonymie c'est-à-dire aux
apports informatiques à la synonymie. L'élaboration d'un dictionnaire électronique des
synonymes est un des meilleurs exemples qui soit d'apport de l'informatique, tous les
aspects techniques nous le montrant. Bien sûr, cela modifie la finalité du dictionnaire, son
rapport à la diachronie et à la dictionnairique. Mais il ne faut pas perdre de vue que
l'informatique et plus précisément le traitement automatique des langues ont encore
beaucoup à apporter à la synonymie par l'intermédiaire du DES.
4.1. Les apports techniques
L'informatique transforme les outils de la recherche scientifique. Elle apporte une
révolution quant au traitement des données et aux possibilités qu'elle offre. Elle fournit
des outils rigoureux, automatiques. Elle donne une accessibilité aux ressources et permet
le brassage de grandes quantités de données. Voyons ce qui l'en est dans notre cas :
qu'est-ce que l'informatique a apporté à la synonymie au travers du DES ?
4.1.1. Numérisation des corpus
La numérisation de corpus permet la sauvegarde informatique de nombreux documents
dont, bien sûr, des dictionnaires. Certes, c'est un travail fastidieux. Il a fallu toute une
équipe à l'INLF et de longs mois de travail pour venir à bout de la numérisation des sept
dictionnaires à l'origine du DES. Mais cette numérisation facilite l'utilisation de ces corpus
qu'ils soient lexicographiques ou non. Ils sont plus aisément consultables. De multiples
recherches peuvent être faites dans ces corpus. Une grande quantité de données peut
ainsi être traitée de manière bien plus rapide et systématique. Notamment, ce traitement
considérable des données ouvre des possibilités de compilation, mais aussi de
comparaison ou encore de fusion des corpus. C'est ce qui a été fait pour le DES. Les sept
dictionnaires ont été numérisés, formant ainsi un corpus lexicographique. De la fusion de
ces corpus est né le DES58. « Le travail effectué au laboratoire a consisté à harmoniser
les mots-vedettes de ces sept fichiers puis à fusionner toutes ces données » (François &
Manguin, 2004 : 1). Ainsi, le DES en tant que compilation de dictionnaires des
synonymes n'a pu voir le jour que grâce à l'informatique puisque cette compilation
n'aurait pas été possible sans la numérisation des dictionnaires.
Lors de la confection du DES, l'étape qui a suivi la numérisation a été
l'harmonisation. En
revanche, cette
harmonisation
n'a pu
être effectuée
automatiquement, elle nécessitait une intervention humaine au cas par cas. Comme son
nom l'indique, le but de cette étape était d'harmoniser les entrées des dictionnaires
obtenues suite à la numérisation des corpus. En effet, chaque lexicographe avait élaboré
son dictionnaire en tenant compte d'un certain nombre d'unités lexicales du français.
Mais le choix des unités qui devaient figurer dans son dictionnaire était laissé à son
appréciation. Les lexicographes ne se sont pas concertés avant de faire leur dictionnaire
et chacun découpait le lexique de la langue selon son jugement. Cela a donc donné de
grandes divergences quant au choix des entrées. Certains détaillaient beaucoup les
unités lexicales si bien que l'on pouvait avoir par exemple monter comme entrée mais
aussi monter sur. Des cas de figures de ce type ont été supprimés et tous les synonymes
de monter sur ont été transféré à l'entrée monter.
4.1.2. Symétrisation
De même, la symétrisation, procédé que nous avons expliqué dans la section précédente
58
« Cette idée de fusionner plusieurs dictionnaires se trouve déjà dans la thèse d'André Kahlmann, dans laquelle on
rencontre également des arguments en faveur de la symétrisation de la relation synonymique. » (Manguin, 2004a :
2).
49
et qui fait l'originalité du DES n'a été rendue possible qu'à l'aide de l'informatique et de
logiciels
pouvant
opérer
cette
symétrisation.
La
symétrisation,
effectuée
automatiquement, est un apport considérable à la synonymie. Certes, c'est grâce au
langage formel des mathématiques que cette idée a pu émerger. Mais elle n'a pu être
mise en application que par l'informatique. Un programme a détecté les relations
synonymiques qui n'étaient pas symétriques et les synonymes et entrées manquants ont
été ajoutés. L'informatique a donc permis une recherche rapide de ces mots manquants
et y a remédié tout aussi rapidement. Grâce à cela, le dictionnaire a été enrichi
automatiquement et les oublis des lexicographes ont été comblés, puisque la machine
n'est pas soumise aux aléas des oublis humains. La symétrisation a donc été un moyen
d'apporter des enrichissements fiables et rapides au dictionnaire. Elle n'aurait pu être
sans l'informatique.
4.1.3. Les cliques
Une autre originalité du DES est sa représentation du sens à l'aide des cliques. Cela
permet de représenter le sens des mots. En effet, bien souvent, un problème de
représentation se pose. Comment représenter un sens, autrement dit un signifié à l'aide
d'un signifiant ? Certes, l'association d'un signifié et d'un signifiant forme un signe et
c'est ce dont le langage est fait. Mais nous avons vu que cela n'est pas aussi simple. Un
même signifiant peut posséder plusieurs signifiés : il s'agit de la polysémie. Mais aussi,
un même signifié peut posséder plusieurs signifiants : il s'agit là de la synonymie. Dès
lors, il n'est plus concevable de représenter un signifié à l'aide d'un seul signifiant, cela
impliquerait bien trop d'ambiguïtés. Pour pallier ce problème, la notion de clique a vu le
jour. Ainsi, avec une clique, un sens est représenté à l'aide de l'ensemble des signifiants
qui y sont associés. C'est ce signifié qui fédère tous ses signifiants synonymes. Dès lors,
il n'y a plus de problème de polysémie. L'association sous forme de cliques laisse
entendre que les signifiants ont tous un signifié commun sinon, ils ne seraient pas
regroupés. L'association de ces signifiants évince les autres signifiés qui rendent les mots
polysémiques. Une solution (partielle) au problème de la représentation du sens a été
trouvée avec les cliques. Elles ont pu être implémentées grâce au modèle informatique à
l'origine du DES : les réseaux connexionnistes. En effet, dans une clique tous les mots
sont synonymes entre eux. C'est grâce aux outils informatiques que ces regroupements
ont pu être faits. Les ensembles de mots synonymes entre eux ont été détectés et rangés
sous forme de listes de cliques ce qui donne un aperçu des sens que peut recouvrir une
entrée.
En résumé, grâce à l'informatique, le DES fournit à la fois la liste des sens que peut
prendre un mot et une manière de représenter les signifiés par leurs signifiants grâce aux
cliques.
4.1.4. L'hypertextualité
L'informatique et Internet ont contribué à l'hypernavigation au sein du DES mais aussi
vers le site du TLFi. En effet, nous avons vu que chaque synonyme figurant dans la liste
de synonymes d'une requête est lui-même un lien vers sa propre liste de synonymes et
ainsi de suite indéfiniment. Cela constitue donc une hypertextualité interne. Cependant,
elle est également externe du fait du lien hypertexte disponible vers le TLFi. Ainsi, à
partir du DES, il est possible d'avoir accès à une définition de qualité de l'entrée requise
dans le DES. Cela permet donc de compléter le DES qui en tant que dictionnaire
cumulatif n'est pourvu d'aucune définition. Bien sûr, cela n'en fait pas un dictionnaire
distinctif pour autant puisqu'il n'est pourvu d'aucune distinction. Mais cela a au moins le
mérite de réduire la sécheresse de ses réponses. Ainsi, l'informatique qui avait fait du
DES un dictionnaire des plus épurés pallie quelque peu cet inconvénient.
4.2. Mise en vitrine du travail de recherche
A l'origine, le DES, bien que ce soit un dictionnaire des synonymes, a été conçu comme
50
un outil de recherche linguistique pour représenter la polysémie. Il devait donc être
« comme un support aux travaux du laboratoire » (Manguin, 2004a : 3) et « sa mise en
ligne comme une vitrine de l'activité de l'unité » (Ibid. : 3). Cette mise en ligne a
coïncidé avec la création du site Internet du laboratoire en 1998. Toutefois, « il s'est
rapidement avéré que cet outil répondait à un besoin particulièrement fort » (Ibid., p8).
Les traces laissées par les utilisateurs sur le site permettent d'en déduire de quels types
d'utilisateurs il s'agit et de supposer quel usage est fait du DES.
Tableau 4 : Répartition hebdomadaire du trafic59.
La répartition hebdomadaire nous indique que le trafic s'effectue en majeure partie
durant la semaine, du lundi au vendredi, avec une moyenne de 17,4. La part du trafic
chute au moment du week-end. Ainsi, nous pouvons en déduire une utilisation
principalement professionnelle du DES. Ceci est corroboré par les heures de
fréquentation du DES.
Figure 10 : Répartition horaire du trafic60.
Le DES est surtout fréquenté durant la journée, aux heures d'ouverture des bureaux,
ce qui est confirmé par la période creuse dans l'heure du midi. L'utilisation
professionnelle de la ressource devient patente. Dans ce graphique, il est tenu compte de
l'heure qu'il est chez l'internaute qui consulte le DES. En effet, ce critère importe
beaucoup lorsqu'on se penche sur la provenance des requêtes.
59
60
Tableau issu de Manguin (2005 : 4).
Graphique issu de Manguin (2004a : 4).
51
Tableau 5 : Provenance des requêtes61.
Bien sûr, le pays en tête est la France. Mais le Canada n'arrive pas loin derrière ce
qui se comprend parfaitement si l'on considère la communauté francophone du Québec.
Dès lors, nous comprenons qu'il est important de prendre en compte l'heure à laquelle
l'internaute consulte le DES, étant donné la part des requêtes provenant d'outreAtlantique.
Ce retour de fréquentation a permis de savoir que bien souvent, les utilisateurs
étaient des personnes travaillant dans des bureaux, notamment des administrations
nationales ou internationales. Ainsi, le DES est principalement utilisé à usage
professionnel.
Le développement d'Internet ayant lieu au début des années 2000, nous avons
constaté un impact considérable du DES du fait d’une fréquentation annuelle en
constante progression. Entre le début de l'année 2002 et le début de l'année 2004, la
fréquentation a triplé. Ce succès inattendu révèle un besoin fort chez les internautes
d'une ressource telle que le DES. La figure qui suit va dans le sens d'une utilisation
professionnelle du DES au regard des creux observés durant les mois d'été et à la
période des fêtes de fin d'année.
61
Tableau issu de François & Manguin (2004 : 5).
52
Figure 11 : Progression de la fréquentation de 2002 à 200462.
Cependant, depuis quelques années, Internet est devenu un média commun, si bien
que nous avons remarqué une progression de la fréquentation ralentie, tendant
doucement vers la stabilisation63.
Tableau 6 : Progression du trafic depuis 199964.
62
Graphique issu de François & Manguin (2004 : 5).
Il n'a pas été possible d'obtenir des statistiques de fréquentation plus récentes. Cependant le ralentissement qui
s'amorçait dès 2004 n'a eu de cesse de s'accroître.
64
Tableau issu de Manguin (2005 : 3).
63
53
Les premières années de la mise en ligne sont le théâtre d'une progression
fulgurante, qui s'est doucement essoufflée.
En conséquence, « la mise en ligne nous a ainsi permis d'évaluer notre outil en
termes de satisfaction des utilisateurs » (François & Manguin, 2004 : 4), satisfaction qui
se mesure grâce à la progression de la fréquentation et au nombre de requêtes
satisfaites. Cette satisfaction peut également se mesurer par le biais de l'interface qui
permet aux utilisateurs de laisser des suggestions. Cette interaction utilisateurs /
producteurs est toujours enrichissante et elle peut éventuellement éviter à la ressource
de tomber dans l'obsolescence.
4.3. Les finalités du DES
4.3.1. Finalité scientifique du DES : représentation de la polysémie
La principale finalité du DES, outre la synonymie, était de représenter le sens et donc la
polysémie avec pour arrière-plan théorique la construction dynamique du sens de Victorri
et Fuchs. Elle offre entre autres une méthodologie pour « dégager les différentes valeurs
typiques [d'une expression] en les situant les unes par rapport aux autres de manière à
construire l'espace sémantique sur cette base » (Victorri & Fuchs, 1996 : 83) ce qui
revient à dégager une ossature du comportement de l'expression. Cette théorie se
concrétise en un modèle mathématique et une implémentation informatique mettant en
jeu les réseaux connexionnistes. Mathématiques et informatique apportant formalisation
et simplification à ce problème, il devenait dès lors possible de représenter de manière
graphique le sens et ainsi d'en avoir une représentation matérielle et donc exploitable.
C'est exactement le rôle joué par les espaces sémantiques dont les visualisations sont
proposées dans le DES.
Pour toute unité vedette, il [le DES] offre un mode de représentation de sa polysémie fondé sur le calcul
de la distance sémantique entre tous ses synonymes dans un espace multidimensionnel. Il délivre un jeu
de visualisations de l'espace sémantique de la vedette par plans (François & Manguin, 2004, résumé).
Une visualisation se présentant sous la forme d'un nuage de points, il devient possible de
comprendre comment les sens d'une unité se répartissent. Ainsi, un nuage de points
dense représentera des sens très proches les uns des autres, tandis que des sens très
éloignés peuvent très bien n'avoir en commun aucun sémantisme. Cependant, il faut
demeurer vigilant avec ces visualisations. Étant donné qu'elles représentent des nuages
de points multidimensionnels, certains plans sont écrasés les uns sur les autres donnant
l'illusion que certains points sont très proches graphiquement et donc sémantiquement. Il
est souvent de bon aloi de faire « tourner » les visualisations pour s'assurer de la
proximité sémantique de certains points du nuage.
Les espaces sémantiques représentant la polysémie des unités lexicales touchent
aussi à leur homonymie. En effet, polysémie et homonymie sont deux phénomènes
sémantiques difficilement discernables. Il devient désormais envisageable de trancher la
question de la distinction entre la polysémie et l'homonymie du fait de la rigueur de l'outil
informatique qu'est le DES.
4.3.2. Finalité lexicographique du DES : entre polysémie et homonymie
Il suffit d'ouvrir différents dictionnaires de langue pour constater que les lexicographes ne
sont pas d'accord sur la démarcation entre polysémie et homonymie.
Les espaces sémantiques comme nous les avons définis plus haut sont le propre du
DES. Ainsi, les sens d'un mot sont représentés grâce à ses synonymes, synonymes qui
sont censés balayer l'ensemble des sens de ce mot. Il ne faut pas oublier que le DES,
plus encore que tous les autres dictionnaires, prend en compte la graphie du mot. En
effet, ce sont les mots graphiques qui sont en entrée, leurs sens ne sont pas pris en
compte. Ainsi, tous les sens d'un mot qu'il soit polysémique ou homonymique sont
confondus dans sa liste de synonymes. La séparation entre les différents sens se fait lors
54
de la visualisation de l'espace sémantique. C'est là que réside la principale fonction des
espaces sémantiques : montrer la répartition des sens. Selon cette répartition des sens,
il sera donc possible de déterminer la polysémie ou l'homonymie des mots. Chaque sens
est saisi par une clique qui forme un atome de sens comme nous l'avons dit. Les cliques
peuvent ensuite être regroupées en composantes connexes qui correspondent à des sens
polysémiques. Ce sont des ensembles de cliques qui s'enchaînent les unes aux autres par
l'intermédiaire de termes communs. Chaque composante connexe délimite les
homonymes d'un même mot. Rappelons-nous l'exemple mentionné dans le paragraphe
sur les composantes connexes. Ces dernières nous permettent de discerner que l'entrée
baie possède des sens polysémiques regroupés sous la composante connexe allant de
fenêtre à crique. L'autre composante connexe renferme le sens de baie en tant que fruit.
Chaque composante connexe est associée à des sens clairement homonymiques tandis
qu'au sein d'une composante connexe peuvent se retrouver divers sens polysémiques.
Certes, la différence entre polysémie et homonymie peut demeurer encore ténue dans
certains cas ce qui nécessiterait un travail lexicographique. Il n'en demeure pas moins
que les espaces sémantiques du DES constituent un bon en avant vers la résolution de ce
problème lexicographique majeur.
D'ailleurs, comme disent Victorri et Fuchs,
il est intéressant de noter que, d'une certaine manière, une partie de cette analyse ne fait que formaliser
et systématiser une des méthodes utilisées dans la confection des dictionnaires : en effet, une partie
importante de l'activité du lexicographe consiste à rechercher les valeurs typiques de l'unité étudiée, et à
exhiber des exemples de son utilisation c'est-à-dire des énoncés typiques des cas de figure univoques
associés aux valeurs typiques (Victorri & Fuchs, 1996 : 83).
En effet, le lexicographe cherche à déterminer quels sont les grands ensembles de sens
propres à l'entrée qu'il étudie. Les sens possédant un lien encore assez fort sont dits
polysémiques tandis que des sens très éloignés ou même sans aucun lien sont dits
homonymiques. Le lexicographe pourra distinguer les sens homonymiques en leur
assignant chacun une nouvelle entrée tandis que les sens polysémiques seront regroupés
dans un même article mais distingués les uns des autres par les sous-catégorisations de
l'article. Cette répartition des sens dépend donc du bon vouloir de chaque lexicographe.
En revanche, l'outil informatique systématise cette analyse puisqu'il représente la
distance sémantique existant entre les sens sous forme d'un nuage de point. Le seul biais
de cette représentation est les distorsions apportées par le placage des différentes
dimensions en un espace à deux dimensions. Mais nous savons comment remédier à ce
problème. En résumé, le DES permet d'automatiser les distinctions à faire en polysémie
et homonymie.
4.3.3. Finalité didactique du DES : liste de synonymes
Le DES en tant que dictionnaire des synonymes a nécessairement parmi ses principales
finalités la synonymie. Cependant, celle-ci a longtemps été occultée au profit de la
polysémie et de la représentation qui en était donnée via le DES. Mais voyons comment
Internet et la mise en ligne du dictionnaire ont remis au goût du jour la finalité didactique
du dictionnaire des synonymes.
Comme tout dictionnaire des synonymes, le DES comporte une liste des synonymes
de l'entrée. Rappelons que cette liste est issue des liens synonymiques présents dans les
dictionnaires de synonymes constitutifs du DES. Chacun de ses dictionnaires avait une
visée pédagogique qui leur était commune puisqu'il s'agissait d'offrir à l'utilisateur une
palette de synonymes selon les différentes acceptions du mot-vedette. Cette liste devait
être assez complète pour satisfaire l'utilisateur dans ses recherches. Le DES, étant le fruit
de la compilation de ces sept dictionnaires, a hérité de leur finalité didactique. Cette
finalité consiste principalement en la production de textes qui, pour demeurer fluide, doit
éviter les répétitions et donc faire appel à des synonymes. Ces lexicographes
recherchaient la plus grande exhaustivité qui soit au point de dépasser parfois le cadre de
la stricte synonymie. Certes, le DES avait pour objectif d'atteindre une plus grande
exhaustivité en matière de synonymes par rapport à ce que pouvait offrir les
55
dictionnaires papier de l'époque, puisqu'il se voulait rassembleur de ces dictionnaires.
Bien sûr, cela n'est pas suffisant et d'ailleurs, comme le disait Manguin reprenant
Kahlmann, malgré cette compilation de plusieurs dictionnaires, nous ne sommes pas à
l'abri de lacunes. C'est là qu'interviennent l'informatique et ses apports comme nous le
verrons dans tous les enrichissements qu'elle peut apporter. Quoi qu'il en soit, la liste de
synonymes fournie par le DES au moment de sa mise en ligne est apparue tout à fait
satisfaisante aux internautes au vu de la progression de la fréquentation du DES.
Certes, le DES avait à l'origine une finalité scientifique de représentation de la
polysémie. « Ce dictionnaire ne devait constituer qu'un support réel à une démarche de
modélisation du sens formulée par B. Victorri » (Manguin et alii, 2008b : 28). Mais sa
mise en ligne a révélé qu'il pouvait tout aussi bien servir à des fins didactiques. C'est
même désormais une de ses principales utilisations si l'on regarde le nombre croissant de
personnes qui ont consulté le DES ces dernières années.
4.4. Pour une nouvelle dictionnairique
Le terme de dictionnairique forgé par B. Quemada renvoie aux aspects éditoriaux. Cela
touche aux techniques typographiques et d'impression éditoriales. La différence entre
lexicographie et dictionnairique peut être saisie ainsi :
« Si la notion de dictionnairique, définie par Bernard Quemada, vise à circonscrire
tous les aspects de l’élaboration d’un dictionnaire dans le cadre d’un objectif, elle se
démarque ainsi de la lexicographie, qui se charge alors de « l’analyse des mots et de
leurs significations » (Pruvost, 2002)65 ; néanmoins, comme le rappelle aussi Jean
Pruvost dans le même ouvrage, ces deux notions sont complémentaires et intimement
liées » (Manguin, 2004a : 2).
4.4.1. Évolutivité de la ressource
L'informatique permet une plus grande malléabilité de la ressource. Il y a toujours la
possibilité d'ajouter des entrées ou des liens synonymiques ou d'en supprimer. Bien sûr,
le plus souvent, il s'agit d'ajouter des entrées ou des synonymes plutôt que d'en
supprimer. Cela s'explique par le fait qu'un dictionnaire électronique n'a pas les mêmes
contraintes matérielles qu'un dictionnaire papier. Autant dire qu'il n'a aucune contrainte
concernant la dictionnairique ou de l'édition de l'ouvrage. Il n'y a aucun nombre de pages
imposé, ni même de problème quant à la modification d'un article ou l'ajout d'article qui
occasionnerait des sauts de pages mais surtout des contraintes d'édition. « En effet, dans
ce type de ressource, le problème de disponibilités, de limitation de place ou d'éditions
successives ne se posent plus » (Manguin, 2005 : 1). D'ailleurs, cela permet une plus
grande souplesse d'utilisation. Les personnes désirant consulter un dictionnaire des
synonymes ne se trouvent plus dans l'obligation de se procurer de type d'ouvrages qui
représente un coût. De plus, cette ressource est régulièrement entretenue et améliorée
ce qui est un avantage non négligeable par rapport à un dictionnaire papier qui demeure
forcément figé. Ainsi, l'on passe d'une dictionnairique papier, coercitive, à une
dictionnairique numérique, plus libre.
Le caractère évolutif de cette nouvelle ressource se retrouve également dans son
cahier des charges, qui tient compte avant tout du public visé. « Le processus
dictionnairique habituel qui consiste par exemple à établir la liste des mots vedette d'un
dictionnaire en fonction du public visé » (Ibid. : 2) se trouve renversé. On assiste à une
« réorganisation du processus d'élaboration de la ressource lexicale » (Manguin, 2004a :
13). Ce n'est plus en amont, lors de la confection du dictionnaire, que la recherche se fait
mais en aval, autrement dit « c'est après la mise en ligne du dictionnaire que la
résolution des questions dictionnairiques devra se faire dans un échange le plus souvent
indirect, avec les utilisateurs-lecteurs » (Manguin, 2005 : 1). Effectivement, « dans le cas
65
Pruvost, 2002.
56
d'un dictionnaire en ligne, ce sont les mots demandés par les utilisateurs et absents de la
ressource qui vont former la liste des futures entrées potentielles » (Ibid. : 2). Dès lors,
on peut comprendre l'intérêt que revêt l'étude « des traces laissées sur le serveur par les
internautes, ce qu'on appelle en informatique les « fichiers de logs » » (Manguin, 2004a :
3). En outre, il existe une interface entre le producteur et les utilisateurs permettant à
ces derniers de laisser des suggestions quant à d'éventuels oublis par exemple. Ils
portent un autre regard sur la ressource et donc peuvent être sensibles à des items qui
auraient été oubliés. Mais bien souvent, les remarques faites concernent des unités
lexicales récemment entrées en langue. Cependant, il ne faut pas oublier que les
suggestions faites par les utilisateurs ne doivent être prises qu'à titre indicatif puisque ce
ne sont pas des lexicographes.
Nous pouvons conclure que « l'apparition des dictionnaires consultables sur Internet
a contribué du fait des spécificités de ce média au renouvellement des questions et des
réponses de dictionnairique tout en établissant des propriétés communes aux ressources
en ligne » (Manguin, 2005 : 1).
4.4.2. L'aspect diachronique
« Mais il importe dans ce travail de tenir compte de l'aspect diachronique de la langue,
car, comme le rappelle Jean Pruvost, l'intérêt historique des éditions successives des
dictionnaires est d'avoir fixé l'état d'une langue à la date de leur parution » (Manguin,
2004a : 13). En effet, la dictionnairique papier a cet avantage d'éditer tous les ans un
nouvel ouvrage. Elle permet de rendre compte de l'évolution de la langue de manière
régulière. En revanche, la dictionnairique numérique compile un bon nombre de
dictionnaires papier en éliminant tous les paramètres qui ont trait à l'aspect diachronique
du lexique. On ne peut plus savoir quelle est la date d'entrée d'un terme dans le lexique.
Il ne faut pas oublier qu'un terme sorti de la langue ne figurera plus dans un dictionnaire
papier; en revanche, il sera toujours présent dans un dictionnaire numérique puisqu'il
accumule les synchronies. Ainsi, un dictionnaire numérique compile mais il ne tient pas
autant compte de l'usage de la langue que peut le faire un dictionnaire papier. Par
conséquent, l'aspect historique de la langue ne fait pas l'objet du même traitement selon
le type de dictionnaire. Elle est davantage prise en compte dans un dictionnaire papier
qui ajoute ou supprime des entrées. De son côté, le dictionnaire numérique empile les
différentes strates synchroniques successives. Les distinctions temporelles qui pourrait
être faites s'estompent. Donnons l'exemple du DES : il est constitué de dictionnaires
datant du XIXème siècle. Certes, les liens synonymiques de ces dictionnaires sont peu
nombreux par rapport aux autres dictionnaires, ce qui tend à les noyer dans la masse
mais ils n'en demeurent pas moins présents. Le paramètre temporel n'étant pas présent
aux yeux de l'utilisateur, il en oublie jusqu'à son existence. De ce fait, l'utilisateur
consultera le dictionnaire sans penser que le dictionnaire électronique minimise l'aspect
diachronique de la langue. Cela peut donc l'amener à s'étonner de certaines relations
synonymiques qui lui sont proposées. Mais ce qui est problématique est, avant tout, la
perte du caractère historique de la langue et surtout de son évolution. Certes, le DES
peut se renouveler si on y ajoute des liens synonymiques et des entrées pour tenir
compte des nouvelles unités lexicales qui entrent dans la langue. Cependant, il
conservera des synonymes datant des siècles passés et qui de ce fait risquent d'être
sortis de la langue depuis un certain temps. Cela trouble les utilisateurs tout comme les
recherches scientifiques qui emploient le DES surtout si elles sont synchroniques. Quel
parti doit-être pris face à cet aspect diachronique de la langue ? Les synonymes jugés
désuets doivent-ils être retirés du dictionnaire ? Ou doivent-ils être conservés afin de
garder une vision englobante de la langue et de sa richesse ? Dans ce cas, les
synonymes pourraient-ils être datés ? Un tel étiquetage est-il seulement réalisable ?
L'ajout de précisions chronologiques constituerait un enrichissement du DES.
Toutefois, il faudrait mettre en place une méthode informatique pour obtenir un tel
enrichissement et ceci n'est pas encore à l'ordre du jour. Cependant, nombreuses sont les
méthodes pour enrichir le DES en liens synonymiques et en entrées.
57
4.5. Méthodes d'enrichissement
Manguin classe les méthodes d'enrichissement d'un dictionnaire des synonymes en deux
catégories: les « enrichissements endogènes » (Manguin et alii, 2008b : 29) et les
« enrichissements exogènes » (Ibid. : 30). Les premières méthodes consistent à
effectuer un traitement automatique sur la ressource elle-même afin de l'enrichir en
optimalisant ses propres données. En revanche, les secondes nécessitent l'intervention
d'une ressource externe, qu'il s'agisse d'un autre dictionnaire ou d'un corpus de texte.
Dans le second cas, le traitement automatique opère sur les ressources complémentaires
afin d'en extraire les informations nécessaires à l'enrichissement du dictionnaire des
synonymes. « L'ajout de nouvelles relations synonymiques à un dictionnaire déjà existant
peut non seulement faire appel à des apports extérieurs, mais aussi fonctionner de
manière autarcique » (Ibid., p28). Nous reprendrons les catégories établies par (Manguin
et alii, 2008b) pour exposer différentes méthodes d'enrichissement.
4.5.1. « Enrichissements endogènes »
La première méthode que nous traiterons ici pourrait s'intituler « Transitivité partielle »
d'après le titre de l'article de Manguin qui l'expose (Manguin, 2004b). Cette méthode
d'enrichissement du dictionnaire par l'exploitation de la transitivité d'ordre deux est
partie d'un constat simple : l'existence de « lacunes [dans les dictionnaires de
synonymes] qui se traduisent par l'absence flagrante d'un synonyme dans la liste des
substituts possibles d'un mot-vedette » (Ibid. : 3). Pour illustrer ces lacunes, un exemple
est pris dans le DES : curieux et insolite ne sont pas synonymes entre eux dans le
dictionnaire et pourtant, ils partagent de nombreux synonymes. L'on est porté à croire
que ces deux entrées devraient être synonymes, ce qui fait dire à Manguin :
si un dictionnaire de synonymes présente des lacunes, il est probable qu'elles seront révélées par la
même propriété que celle qui lie insolite et curieux, c'est-à-dire que les deux mots qui devraient être des
synonymes directs sont synonymes d'ordre 2, et que la moitié (ou plus) des synonymes de l'un sont
synonymes directs de l'autre » (Ibid. : 4).
Ainsi, ce qu'il nomme une transitivité partielle est en fait une synonymie d'ordre deux,
c'est-à-dire que des mots ne sont pas directement synonymes mais ils le sont par
l'intermédiaire de leurs propres synonymes. Toutefois, il ne faut pas penser que toutes
les unités lexicales qui possèdent ce lien d'ordre deux sont synonymes. Seulement,
certaines le sont et elles constituent les lacunes des dictionnaires, lacunes que Manguin
se propose de pallier à l'aide d'une méthode automatique.
Pour ce faire, une quantification de « la relation qui lie un mot à un de ses
synonymes d'ordre 2 » (Ibid. : 4) devient nécessaire. On attribue un indice à chaque
relation si bien que l'on peut mesurer l'attraction qui existe entre deux mots. Dans le cas
de la transitivité d'ordre 2, cela permet de savoir si la relation qui lie deux unités
lexicales est assez forte pour être considérée comme une relation de synonymie. Si c'est
le cas, la relation dite de transitivité partielle change de statut pour devenir une relation
de synonymie qui, dès lors, se doit d'être recensée dans le dictionnaire. « Cet indice peut
se définir comme le quotient du cardinal de l'intersection des deux ensembles par le
cardinal de l'union de ces deux mêmes ensembles » (Ibid. : 4). Soient « A et B les deux
mots étudiés » et « SynA (resp. SynB) l'ensemble des synonymes de A (resp. B) »
(Ibid. : 4) alors on a :
Accordons-nous une digression pour revenir sur la propriété de réflexivité de la
synonymie. Manguin justifie cette propriété dans cet article d'après ses calculs sur la
transitivité partielle. Il prend un exemple théorique : deux mots A et B ne possèdent
58
qu'un seul synonyme. C'est-à-dire que A a pour seul synonyme B et B n'a que A comme
synonyme. « Intuitivement, il va de soi que A et B sont parfaitement identiques ;
toutefois, si nous calculons l’indice de Jaccard entre A et B, il est nul puisque A et B n’ont
pas de synonyme commun » (Ibid. : 5). Et pourtant, nous ne pouvons nier le lien de
synonymie qui relie A et B. « Ce résultat absurde se résout si nous postulons que la
relation de synonymie est réflexive : A a alors pour synonymes A et B, et il en est de
même pour B » (Ibid. : 5). Dans ce cas, ils ont en commun deux synonymes : A et B.
« L’indice de communauté vaut alors 1, ce qui est conforme à la logique du graphe »
(Ibid. : 5). De ce fait, Manguin a rétabli la complète validité de sa méthode. Il a par là
même justifié a posteriori la réflexivité de la synonymie de manière mathématique. Donc,
lors des calculs de transitivité partielle, il faut tenir compte de cette propriété en
comptant le mot lui-même parmi ses synonymes.
L'indice ainsi défini met au jour des synonymes d'ordre deux qui possèdent « un
indice de similitude relatif supérieur à 0,5 avec le mot-vedette » (Ibid. : 5). Cette valeur
constitue un seuil au-delà duquel on passe à la transitivité directe c'est-à-dire à la
synonymie. Ainsi, les unités lexicales possédant un indice supérieur à 0,5 sont des
synonymes directs. Ce seuil précis permet donc de mettre en place une méthode de
détection des relations supérieures à cette valeur et ainsi détecter les relations
manquantes. Cependant, pour éviter tout résultat aberrant, « un mot qui pourra être
relié à un autre devra posséder au moins deux synonymes (en plus de lui-même), et que
ceux-ci seront communs aux deux unités à relier » (Ibid. : 5). Cette précision dans les
calculs est nécessaire sinon l'on constate que les résultats de la méthode ne sont pas
pertinents sur de trop petites quantités de synonymes et deviennent même aberrants.
Seconde précision, quant au nombre de synonymes de l'unité lexicale considérée, cette
fois. En effet, si un mot possède beaucoup de synonymes et que son synonyme d'ordre
deux en possède peu alors le seuil de 0,5 ne sera jamais atteint. D'ailleurs, dans
l'exemple donné avec curieux et insolite, ce seuil n'est pas atteint et pourtant, la liaison
est considérée comme acceptable. Cela conduit à modifier la règle : « deux sommets
situés à une distance deux dans le graphe de synonymie pourront être reliés si l'un au
moins de leurs deux indices de similitude relatifs est strictement supérieurs à 0,5 »
(Ibid. : 5). « Le but de notre méthode étant de récupérer des liaisons « manquantes », il
semble plus juste de tenir compte du nombre de synonymes impliqués dans le calcul du
rapport » (Ibid. : 10).
Cette méthode des indices de similitude ainsi précisée a pu ensuite être appliquée à
l'ensemble du dictionnaire selon les étapes suivantes : « repérage pour chaque entrée
des synonymes d'ordre 2 qui satisfont au(x) critère(s), mise en fichier des liaisons à
créer et ajout des nouvelles liaisons au dictionnaire » (Ibid. : 6). « Le nouveau
dictionnaire ainsi créé va subir à son tour le traitement décrit, et ainsi de suite, jusqu'à
ce que le nombre de liaisons à ajouter soit nul » (Ibid. : 6). Cette méthode appliquée au
DES apporte « 37384 nouvelles relations, soit une augmentation de 18,7 % du nombre
de connexions existantes » (Ibid. : 12). La densité de ce dictionnaire permet un
enrichissement conséquent et donc intéressant. Voici quelques exemples de nouveaux
synonymes proposés par la méthode de la transitivité partielle (Ibid. : 12-13):

arrêter, brider

arrêter, coincer

arrêter, obstruer

association, amalgame

attacher, coincer

augmenter, surfaire

bas, ignominieux

bas, immonde

bas, ordurier

chagrin, désespérance

dire, attester

dire, enseigner

dire, faire connaître

dire proclamer
59


















division, dissension
doux, accommodant
désordre, méli-mélo
détruire, détériorer
exciter, inspirer
exciter, réchauffer
extraordinaire, effarant
extraordinaire, monumental
extraordinaire, titanesque
grossier, indécent
marquer, déceler
partir, s'évader
porter, déclencher
porter, faire naître
sot, aberrant
soutenir, affermir
tenir atteler
tomber, expirer
Toutefois, ce procédé n'a été appliqué qu'aux vedettes possédant plus de 100
synonymes. Il pourrait peut-être être intéressant de l'appliquer à des entrées possédant
moins de synonymes. En outre, « ce procédé ne permet pas de raccorder des parties du
graphe global qui ne sont pas connectées entre elles, autrement dit des « composantes
connexes » indépendantes, et dont l'indépendance serait le reflet d'un oubli » (Ibid. :
13).
Cette méthode apporte seulement de nouvelles relations au dictionnaire et non de
nouvelles entrées. Pour cela, il faudrait tenir compte des nouveaux sens et des nouvelles
unités lexicales qui apparaissent en langue. Mais, seul un travail lexicographique pourrait
y remédier. Cela pourrait se traduire par la numérisation d'un dictionnaire des synonymes
récent et de la fusion de celui-ci au dictionnaire déjà existant. Toutefois, cette opération
constitue un travail considérable, dont il faut s'assurer qu'il serait vraiment utile avant de
l'entreprendre. Néanmoins, d'autres possibilités existent qui s'appuient sur des
ressources externes au dictionnaire. C'est ce que Manguin nomment des
« enrichissements exogènes » (Manguin et alii, 2008b : 30).
4.5.2. « Enrichissements exogènes »
4.5.2.1. Bourigault et la contextualisation de la synonymie
Le premier à avoir entrepris une méthode d'enrichissement exogène est Bourigault
dans (Bourigault & Galy, 2005). Cette méthode est moins efficace que celle proposée plus
tard par Manguin dans (Manguin et alii, 2008a). Néanmoins, elle apporte un autre
éclairage sur la synonymie.
Bourigault a mis en place une méthode d'extraction de synonymes à partir de corpus
monolingues de langue générale. Jusqu'à présent, les travaux étaient principalement
effectués sur des corpus de langue spécialisée. En effet, une analyse distributionnelle sur
de tels corpus donne des résultats convaincants puisque dans un même contexte, on
retrouve des mots semblables. Les résultats sont nécessairement moins satisfaisants sur
des corpus de langue générale dont les contextes ne sont plus ciblés. Pourtant,
Bourigault a tenté l'expérience afin d'en mesurer la pertinence réelle.
Il a considéré deux corpus : 10 ans d'articles du journal Le Monde et les romans du
XXème siècle dans la base Frantext. Enfin, pour son analyse, il a pris le DES comme
référence en matière de synonymes. Suite à l'analyse distributionnelle des corpus, il
obtient deux bases lexico-distributionnelles formées de couples d'arguments ou de
couples de prédicats, qu'il nomme voisins, une pour chaque corpus. Après comparaison
de ces bases et du DES, Bourigault obtient un recouvrement très faible entre les couples
de synonymes et les couples de voisins. Seules très peu de relations synonymiques sont
60
extraites grâce à l'analyse distributionnelle. Ainsi, cette méthode d'extraction sur corpus
généraux est peu concluante en termes de relations synonymiques obtenues. Cependant,
son intérêt réside dans d'autres aspects.
Cette méthode offre une contextualisation de la synonymie. « Les mots du couple ne
sont plus des unités lexicales in abstracto comme dans le DES » (Bourigault & Galy,
2005 : 169). En effet, les mots ont été rapprochés par l'analyse distributionnelle car ils
se retrouvaient dans des contextes semblables. Les listes de mots voisins sont
accompagnées de leurs contextes. Si l'on se réfère à un couple de voisins correspondant
à un couple de synonymes, les contextes de ces voisins apportent une contextualisation
aux synonymes en question. Ainsi, des synonymes épurés de toute explication comme
ceux du DES peuvent être complétés par des indications contextuelles, recueillies de
manière automatique à l'aide d'une analyse distributionnelle. « L'usage des voisins peut
ainsi s'avérer complémentaire sinon nécessaire à une recherche dans le DES puisqu'ils
donnent accès à des informations sur les restrictions de sélection de chacun des termes
du couple » (Ibid. : 169). « De cette façon, les voisins nous éclairent sur la notion de
synonymie partielle » (Ibid. : 169). En effet, ils permettent d'expliciter les contextes dans
lesquels deux mots sont synonymes. Les sens varient selon les contextes mais il ne faut
pas oublier que les contextes varient eux-mêmes en fonction des genres. On comprend
dès lors l'intérêt pour une telle étude de s'appuyer sur des corpus aussi différents que les
romans du XXème siècle ou les articles du Monde. Les résultats de Bourigault montrent
bien que « la synonymie est sensible aux genres et aux thèmes abordés » (Ibid. : 170).
61
Tableau 7 : Les différences d'usage dans les corpus à partir de l'exemple abattement66.
Pour le couple [abattement, désespoir], aucune mention ne figurent dans le corpus
du journal Le Monde (LM) tandis que nombre de contextes s'offrent dans les romans du
XXème de la base Frantext (FR). L'abattement dans le sens du désespoir marque
l'évocation des sentiments. Il est donc légitime qu'un tel couple se retrouve dans les
romans et non dans un journal tel que Le Monde. En revanche, ceci s'inverse pour
abattement dans le sens d'exonération. Nous comprenons dès lors qu'il ne soit pas fait
mention d'exonération dans les romans de la base Frantext. Cependant, Le Monde en
tant que journal traitant de l'actualité économique propose de nombreux contextes pour
ces termes. La confrontation de ces différents genres nous montre à quel point les
usages diffèrent d'un genre à l'autre, mais plus encore qu'il faut être vigilant dans une
analyse sur corpus. Ainsi, il est de bon aloi de tenir compte de plusieurs genres dans une
analyse telle que celle-ci afin de la rendre la plus exhaustive possible.
En conclusion, cette méthode d'analyse distributionnelle permet d'enrichir la
description de la synonymie dans ce qu'elle a de partielle puisqu'elle offre une
66
Tableau issu de (Bourigault & Galy, 2005 : 170).
62
contextualisation de la synonymie, avec la possibilité de tenir compte de contextes
provenant de genres textuels différents. Cette méthode n'apporte pas de nouvelles
relations synonymiques puisque le recouvrement est faible mais elle propose un autre
type d'enrichissement et ce, de manière automatique : des informations quant à la
contextualisation des synonymes. Bien sûr, notre propos est d'exposer les méthodes qui
permettent d'enrichir le DES en liens synonymiques ou en entrées. Celle de Bourigault
n'apporte pas ce type d'enrichissements mais elle n'en est pas moins intéressante.
D'ailleurs, elle offre une piste de réflexion quant à la diversité des enrichissements qui
peuvent être apportés au DES. Mais revenons sur les premiers types d'enrichissements
que nous nous étions fixés.
4.5.2.2. Manguin et l'extraction automatique de synonymes à partir de corpus
multilingues alignés
La méthode de Manguin, plus efficiente que celle de Bourigault, apporte des
enrichissements au DES. Voyons comment il procède. Rappelons que Bourigault tentait
d'extraire des relations synonymiques à partir de corpus de langue générale. Sa méthode
différait des travaux effectués jusqu'à ce jour car elle ne portait plus sur des corpus
spécialisés. Toutefois, la méthode de Manguin diffère de celle de Bourigault quant à la
langue des corpus : Bourigault travaillait sur des corpus monolingues en français tandis
que Manguin s'appuie sur des corpus multilingues.
Le postulat de la méthode de Manguin est le suivant : « la similarité ne va plus se
mesurer ici à l'aune du partage de contextes mais à celle du partage de traductions »
(Manguin et alii, 2008a : 152). Ainsi, « l'idée sous-jacente est que si deux mots sont
souvent traduits de la même manière dans de nombreuses langues, il y a une forte
probabilité pour qu'ils soient synonymes » (Ibid. : 152). Ainsi, cette nouvelle méthode
d'extraction est centrée sur le caractère plurilingue du corpus et sur le fait que ce corpus
est constitué d'une somme de traductions. Il est possible de travailler à partir de textes
en version bilingue. Cependant, effectuer des recherches à partir de textes en version
multilingue améliore les résultats.
Le corpus utilisé dans cette étude est constitué d'actes du Parlement européen en 11
langues, corpus autrement nommé Europarl 67. Pour que ce corpus multilingue soit
exploitable, il a dû subir un alignement, d'abord phrase à phrase puis mot à mot. Ainsi,
chaque phrase correspondant à peu près à une unité de sens, l'alignement phrase à
phrase permet d'obtenir des paradigmes multilingues d'une même unité phrastique. Bien
sûr, quelques problèmes ont été rencontrés lorsqu'une phrase était traduite par deux
dans une autre langue ou inversement. Ensuite, l'alignement mot à mot permet d'affiner
le premier alignement. Mais il devient nécessaire lorsque les langues traduites ont des
syntaxes différentes, c'est-à-dire quand l'ordre des mots dans la phrase n'est pas le
même d'une langue à l'autre. Toutefois, il n'est tenu compte que des liens bidirectionnels
entre les traductions, c'est-à-dire lorsqu'un mot A d'une langue source était traduit par
un mot B dans une langue cible et que B était traduit également par A lorsque l'on
inverse les langues source et cible. Cela permet de s'assurer d'une plus grande
pertinence des liens obtenus et ainsi d'une plus grande précision. À chaque mot est
associé un vecteur caractéristique dont les composantes sont les traductions dans les
langues cible et les coordonnées de ce vecteur sont les fréquences de ces traductions.
« Les mots de la langue source sont pourvus d'un certain nombre de mots proches avec
chacun une similarité comprise entre 0 et 1 » (Ibid. : 155). Ainsi, le mot A sera pourvu
d'une liste de ces différentes traductions dans les langues du corpus : B, C, D... Et à
chacune des traductions sera associé un indice de similarité qui attestera de la valeur de
cette similarité. Un seuil peut être ajouté à cet indice afin de ne conserver que des
résultats pertinents. A partir de cet indice, trois types de mesures peuvent être effectués,
mesures qui nécessitent une référence en matière de synonymes. Comme Bourigault,
67
« Ce corpus parallèle librement disponible sur Internet provient des actes du Parlement Européen entre mars 1996 et
septembre 2003, et inclut les versions en 11 langues européennes : français, italien, espagnol, portugais, anglais,
néerlandais, allemand, danois, suédois, grec et finnois » (Manguin et alii, 2008a : 153).
63
Manguin prend le DES comme référence pour ses mesures :

la couverture : « pour une valeur seuil, c'est le nombre de mots pourvus d'une liste
non vide divisé par le nombre de mots de la liste de référence » (Ibid. : 156)

la précision : « est la proportion de synonymes considérés comme « bons » par le
DES parmi les mots proches fournis par le système » (Ibid. : 156)

le rappel : « est ce même nombre de « bons » synonymes fournis, divisé cette fois
par le nombre total de synonymes donnés par le DES pour le même mot » (Ibid. : 156)
Lorsque l'on compare les méthodes de Bourigault et de Manguin, on remarque que,
pour les calculs de la couverture, « le système multilingue est moins « productif » que le
système monolingue, en ce qu'il rapproche moins facilement les mots entre eux » (Ibid. :
156). Mais, cela s'explique par le fait que la couverture a été réduite pour la méthode
multilingue afin d'obtenir des associations de mots pertinentes. En effet, la méthode de
Bourigault rapprochait entre eux non seulement de synonymes mais aussi des
hyperonymes ou des antonymes. Ainsi, la couverture chez Bourigault avait beau être plus
importante, elle était beaucoup moins précise. De cela, découle le fait que la méthode
multilingue est plus « productive » au regard de la précision que la méthode monolingue.
En revanche, pour ce qui est du rappel, les deux méthodes ne sont guère satisfaisantes,
encore que la méthode multilingue le soit un peu plus que la méthode monolingue.
Mentionnons les problèmes rencontrés lors des mesures. L'alignement mot à mot
associe parfois des mots de différentes classes grammaticales ce qui introduit des erreurs
dans les résultats obtenus. Mais l'utilisation d'un lemmatiseur et d'un analyseur
catégoriel permet de pallier les faiblesses de l'alignement. Cependant, des améliorations
peuvent être apportées aux méthodes d'alignement pour les rendre plus efficaces et plus
précises.
Toutefois, il faut tenir compte du biais que représente la référence en matière de
synonymes qu'est le DES. En ce qui concerne le rappel, la faiblesse des résultats obtenus
pour cette mesure s'explique par les différences existant entre les synonymes obtenus à
partir du corpus et ceux proposés par la référence. En effet, le DES, comme beaucoup de
dictionnaires des synonymes, propose dans ses listes de synonymes des mots marqués
ou d'autres niveaux de langue. De tels résultats ne peuvent être obtenus à partir de
corpus multilingues puisque bien souvent les traductions ne s'accompagnent pas de
changements de niveaux de langue. De plus, le corpus Europarl témoigne d'un niveau de
langue plutôt soutenu. Ainsi, la faiblesse du rappel se trouve expliquée par ces
divergences.
Quant à la précision, elle aussi est tributaire de la référence.
L'examen des synonymes proposés par le traitement automatique que nous avons employé nous révèle
la présence de relations souvent pertinentes, mais que le dictionnaire de référence considère comme
« mauvaises » puisqu'elles ne font pas partie des relations synonymiques directes » (Ibid. : 158).
Le manque de fiabilité de la référence s'explique par le fait que le DES n'est constitué que
de relations synonymiques contemporaines des dictionnaires qui ont servi à son
élaboration. Ainsi, ce n'est pas tant la méthode qui n'est pas assez efficace mais c'est la
ressource de référence qui constitue un biais dont il faut avoir conscience. Néanmoins, en
inversant la perspective, nous constatons que « l'extraction automatique pourrait donc
révéler des emplois synonymiques nouveaux, pourvu que le corpus soit assez proche
dans le temps » (Ibid. : 159). L'extraction automatique permettrait donc d'enrichir un
dictionnaire des synonymes en l'occurrence le DES en le prenant comme référence des
mesures. Les relations synonymiques proposées par la méthode qui ne figurent pas dans
le dictionnaire seraient ainsi autant de nouvelles relations à incorporer au DES. Nombre
de relations ou d'entrées omises par les lexicographes pourraient, de ce fait, être
ajoutées automatiquement. Mais plus encore, cette méthode d'extraction automatique de
synonymes pourrait pallier le problème de l'obsolescence de la ressource et ainsi,
l'enrichir de relations synonymiques récentes à l'aide de corpus de langue récents.
En inversant ainsi la finalité de ces travaux, c'est-à-dire en passant du développement d'un instrument à
l'examen de ses résultats, nous pouvons imaginer dans un premier temps apporter à la lexicographie un
outil qui actualiserait objectivement les données des dictionnaires (Ibid. : 160).
64
Nous entrevoyons donc une nouvelle lexicographie, assistée par informatique. Nous
pouvons, dès lors, prendre conscience des multiples possibilités qu'offrent le traitement
automatique des langues à la synonymie.
Voici quelques exemples de nouveaux liens synonymiques ajoutés grâce à ce procédé
automatique avec les indices de similarité correspondants :
Tableau 8 : Les nouveaux liens synonymiques apportés par l'extraction automatique de
synonymes à partir de corpus multilingues alignés 68.
Nous ne pouvons que constater la pertinence des nouveaux liens. Et même, on en
vient à s'interroger sur l'absence de ces liens dans un dictionnaire qui se voulait pourtant
exhaustif. Assurément, nombre de ces liens témoignent d'une évolution récente de la
langue qui accueille régulièrement de nouvelles synonymies. Dès lors, l'intérêt de
l'enrichissement de la ressource à l'aide de corpus multilingues de facture récente
devient patent tant cette méthode est efficiente.
68
Tableau issu de Manguin et alii (2008a : 159).
65
4.5.2.3. Ploux et l'appariement multilingue des Atlas sémantiques
La méthode de Ploux consiste à apparier sémantiquement deux langues : soit une langue
source et une langue cible par le biais d'un dictionnaire bilingue et d'un dictionnaire des
synonymes dans chacune des langues. Cependant, « il est connu que le découpage et le
recouvrement lexical varie d'une langue à l'autre » (Ploux, 2007 : 3). Il n'est donc pas
possible d'apparier des langues avec les unités lexicales telles qu'on les retrouve dans la
langue. Il faut nécessairement passer par les cliques. Comme nous le savons, ce sont des
atomes de sens, pointant seulement les signifiés sans subir aucune influence de la part
des signifiants. De plus, chaque unité lexicale n'est plus représentée comme un vecteur
comme il était courant jusqu'à ce jour, dans les modèles lexicaux computationnels, mais
comme un domaine dans un espace multidimensionnel. Nous retrouvons donc les
espaces sémantiques tels que nous les avons décrits dans le DES. Cela permet de
« représenter la structure interne du sens des mots » (Ibid. : 4) et « rendre compte de la
similarité sémantique entre unités lexicales » (Ibid. : 4). « La similarité sémantique entre
deux unités est mesurée à la fois par le recouvrement entre les aires qui leur sont
associées et par à la distance qui les sépare dans l'espace multidimensionnel » (Ibid. :
5). Une fois que ce travail de représentation du sens est effectué à l'aide des cliques et
des espaces sémantiques, il est possible d'entreprendre l'appariement des langues. « Ce
modèle dispose sur une même carte les valeurs sémantiques des deux langues et figure
ainsi les proximités et les recouvrements » (Ibid. : 12). Le système commence par
calculer l'espace sémantique du mot de la langue source. Puis, en se référant à la base
de traduction, il calcule l'ensemble des cliques de synonymes de la langue cible
sémantiquement liées aux cliques de la langue source. « Ainsi, le modèle d'appariement
permet de projeter un espace sémantique lexical d'une langue source vers un espace
sémantique d'une langue cible en respectant l'appariement des valeurs que les mots
peuvent prendre en contexte » (Ibid. : 14). Toutefois, une étape de validation est
nécessaire pour sélectionner les termes qui pourront être intégrés aux dictionnaires. Cela
consiste à tenir compte « du nombre de cliques qui contiennent le terme candidat à
valider et de la distance de ce terme aux synonymes déjà contenus dans les bases de
synonymes » (Ibid. : 15). Après chaque validation et ajout des mots, le processus est
répété jusqu'à ce que plus aucun mot nouveau ne soit ajouté à la base lexicale.
Ploux part de l'adjectif français insensible. Son modèle propose des termes candidats
à la traduction de cet adjectif en espagnol, ce qui se présente sous forme d'une carte
d'appariement sémantique.
66
Figure 12 : Carte d'appariement sémantique proposant des termes candidats à la
traduction vers l’espagnol du mot insensible en français69.
L'étape de validation consiste à sélectionner parmi les termes appariés les
synonymes. Ainsi, elle obtient la carte du mot insensible en espagnol.
Figure 13 : Synonymes espagnols du mot insensible sélectionnés par l'étape de
validation70.
Les nouveaux synonymes obtenus suite à la validation sont ajoutés à la carte
69
70
Graphe issu de (Ploux, 2007 : 17).
Graphe issu de (Ploux, 2007 : 17).
67
d'appariement sémantique. L'opération est réitérée. Après plusieurs étapes
d'appariement et de validation, la carte d'appariement devient très complète. Nous nous
bornerons à montrer la carte des synonymes proposés puisque c'est là notre propos.
Figure 14 : Synonymes espagnols du mot insensible sélectionnés par l'étape de validation
après plusieurs étapes71.
Ploux obtient donc après plusieurs étapes un nombre significatif de synonymes de la
langue cible, en l'occurrence l'espagnol à partir de cartes d'appariement sémantique
bilingues espagnol / français.
Le modèle est capable de proposer en plus de nouvelles traductions des mots
candidats pour la synonymie de la langue cible. Il permet notamment d'enrichir les bases
de données des dictionnaires de synonymes de la langue cible. Ainsi, la méthode
proposée par Ploux rejoint notre propos concernant l'enrichissement de dictionnaires des
synonymes à partir de bases lexicales externes. Bien sûr, dans ses exemples, Ploux part
du français pour enrichir d'autres langues, il faudrait inverser ce processus pour parvenir
à enrichir le DES à l'aide d'autres langues.
L'informatique permet de mettre en place diverses méthodes d'enrichissement
automatiques d'une ressource synonymique comme le DES. De plus, la dictionnairique
est révolutionnée par la mise en ligne du dictionnaire. Enfin, les points forts du DES n'ont
pu voir le jour que grâce à l'informatique (symétrisation et représentation du sens).
Cependant, cet apport informatique possède des limites. Un problème déjà mentionné
ressurgi : la synonymie est une relation uniquement synchronique, elle n'a plus de
validité en diachronie. En outre, la définition de la synonymie que nous nous sommes
donnée est remise en cause par la réalité du dictionnaire. Celui-ci n'est pas uniquement
constitué de synonymes. Voyons cette remise en cause avec l'exemple de l'hyperonymie.
71
Graphe issu de (Ploux, 2007 : 21).
68
5. Quand l'outil remet en cause la notion : l'exemple de
l'hyperonymie
L'apport de l'informatique à la synonymie n’est pas sans receler quelques limites. Voyons
comment elles se concrétisent au travers d’un exemple : l’hyperonymie.
Nous n'avons pas pris l'exemple de l'hyperonymie au hasard. En effet, avec les
nuances de sens qui tendent à l'analogie, l'hyperonymie est l'autre relation sémantique
connexe à la synonymie et qui la prolonge. En outre, l'hyperonymie se justifie d'autant
plus que dans sa définition première, définition aristotélicienne, la synonymie avait trait à
l'hyperonymie. Pour Aristote, la synonymie était une relation reliant des entités distinctes
que l'on pouvait ranger sous le même terme générique. Aujourd'hui, nous nommerions
cette relation la cohyponymie. Ce qu'Aristote appelait synonymes était des cohyponymes
d'un même hyperonyme. Ainsi, les relations de synonymie et d'hyperonymie semblent
étroitement liées, au moins du point de vue historique. Mais ce qui confère à
l'hyperonymie un surcroît de légitimité pour montrer les limites de l'apport informatique
de la synonymie, c'est bien le fait que l'on retrouve des hyperonymes dans le DES.
5.1. L'hyperonymie : qu'est-ce que c'est ?
5.1.1. Notion sémantique et théorie du prototype
L'hyperonymie est une relation sémantique entre deux termes qui, d'un point de vue
logique, serait de l'ordre de l'inclusion. Ce n'est donc pas une relation de même nature
que la synonymie. En effet, l'hyperonymie possède un pendant : l'hyponymie. Ainsi, c'est
une relation double qui n'est pas réciproque comme la synonymie. L'hyperonyme est le
terme de plus grande généralité tandis que l'hyponyme est le terme de moindre
généralité. L'hyperonyme englobe plusieurs hyponymes qui sont alors dits cohyponymes.
Cela se comprend très bien si l'on considère l'étymologie grecque de ces préfixes. Hyper
vient d’une racine grecque « qui signifie « au-dessus, au plus haut degré » » (ReyDebove, 2004 : 846) voire avec une idée d'excès alors que hypo vient d’une racine
grecque « qui signifie « sous, au-dessous » » (Ibid. : 847) éventuellement avec une idée
d'insuffisance. On décèle donc une hiérarchie verticale dans cette relation d'inclusion
puisque l'un relève de ce qui est supérieur et l'autre de ce qui est inférieur.
Cela nous amène à traiter de la théorie du prototype dans laquelle l'hyperonymie
trouve sa place. En effet, la théorie du prototype traite de la catégorisation. Dans son
dictionnaire des sciences du langage, Neveu nous dit que
le terme de catégorisation désigne, en psychologie cognitive, un acte mental, fondamental dans la
cognition, consistant à structurer les éléments du réel en catégories d'objets, d'événements, d'entités
conceptuelles, à partir de propriétés jugées communes » (Neveu, 2004 : 60).
Ainsi, avec la catégorisation, il s'agit de classifier les entités du réel et a fortiori, de les
hiérarchiser. C'est là que l'hyperonymie entre en jeu. Ainsi, Kleiber fait appel à
l'hyperonymie en sémantique du prototype car par son mécanisme d'inclusion
sémantique, elle permet une certaine forme de hiérarchisation. Kleiber reprend la
classification d’E. Rosch en psychologie cognitive (Kleiber, 1990 : 40) :
E. Rosch propose une classification en trois niveaux :
. niveau superordonné
. niveau de base
. niveau subordonné
Kleiber



donne quelques exemples de cette hiérarchie verticale (Ibid. : 41):
niveau superordonné : animal fruit
meuble
niveau de base :
chien
pomme chaise
niveau subordonné :
boxer
golden chaise pliante
69
Cette théorie du prototype montre, d'après des analyses cognitives, que le terme le
plus souvent utilisé est celui du niveau de base. « Les catégories du niveau basique se
révèlent saillantes » (Ibid. : 44). « Le niveau de base est en conséquence le niveau le
plus élevé (le plus abstrait) où les membres des catégories ont des formes globales
perçues de façon similaire » (Ibid. ; 41-42). De plus, « le niveau de base se trouve donc
être le niveau où les sujets identifient le plus rapidement les membres des catégories »
(Ibid. : 43). Ce sont la plupart du temps des termes contextuellement neutres. Enfin, « le
niveau de base se révèle aussi être le niveau saillant dans l'apprentissage de la
catégorisation » (Ibid. : 44). L'ensemble de ces paramètres fait que les termes du niveau
de base sont les termes les plus faciles d'accès et les plus maniables quant à leur degré
de généralisation. En effet, apprendre et manier les termes du niveau superordonné
oblige à demeurer dans l'abstraction, une abstraction trop importante qui empêche de
saisir le réel et donc d’avoir prise sur lui. Dans ces cas, la désignation et la référenciation
se mettent difficilement en place. A contrario, les termes du niveau subordonné sont trop
particuliers. Ils renvoient à des entités bien précises du réel. Il ne s'agit donc pas ici d'un
problème de désignation mais cette trop grande précision gêne le locuteur dans son
apprentissage. « L'apparition des catégories subordonnées représente ainsi un fardeau
mental de classification qui ne se trouve pas contrebalancé par un gain d'information
significatif » (Ibid. : 45). Le locuteur est obligé de retenir une grande quantité de termes
pour désigner des choses trop semblables. L'effort cognitif à fournir est trop important
pour lui. Le paradigme à apprendre étant trop conséquent, le locuteur préfère s'en tenir
au terme du niveau de base. Les catégories de base « sont les moins coûteuse du point
de vue cognitif puisqu'à une seule mémorisation de catégorie correspond une information
élevée » (Ibid. : 45). Ce sont donc vraisemblablement celles qui sont les plus utilisées.
Cependant, Kleiber termine son exposition des travaux d’E. Rosch et de la sémantique du
prototype en précisant qu'il n'y a pas nécessairement de catégorisation ternaire par les
locuteurs. Ils peuvent très bien adopter d'autres types de hiérarchisations.
Revenons-en à l'hyperonymie. Lorsque Kleiber songe à d'autres types de
hiérarchisation, nous pouvons envisager une hiérarchisation binaire entre hyperonyme et
hyponyme. Néanmoins, la classification de Rosch n'exclut pas l'hyperonymie. Au
contraire, celle-ci est constamment présente, cela dépend seulement du point de vue qui
est adopté. En effet, un terme du niveau superordonné fait figure d'hyperonyme pour un
terme de niveau de base, qui dès lors est un hyponyme. De même, les termes du niveau
basique font figure d'hyperonymes pour les termes du niveau subordonné qui, eux, sont
des hyponymes. Ainsi, l'hyperonymie est omniprésente dans les processus de
hiérarchisation lexicale.
5.1.2. L'hyperonymie, une notion savante
L'hyperonymie, contrairement à la synonymie ne relève pas d'un savoir épilinguistique.
Elle est une catégorie savante, une notion crée par les linguistes pour évoquer une réalité
purement linguistique. À l'école, il n'est jamais appris aux enfants à distinguer des
hyperonymes et des hyponymes. Cela ne fait pas partie du programme scolaire de
l'enseignement secondaire. Ce n'est pas une notion que les élèves sont censés intégrer
contrairement à la synonymie. Pour cela, l'hyperonymie bénéficie d'un statut de notion
scientifique non contaminée par le savoir épilinguistique des locuteurs. Elle ne fait pas
l'objet d'une polysémie d'emplois qui tendent à brouiller son sens premier. Ainsi,
l'hyperonymie et son pendant, l'hyponymie restent des notions clairement définissables
par qui les emploie. Elle fait donc preuve d'une plus grande stabilité et d'une meilleure
assise. Elle est donc plus simple à manier dans le discours scientifique.
5.1.3. L'hyperonymie dans les définitions lexicographiques
De même que la synonymie, l'hyperonymie se retrouve dans les définitions
lexicographiques. Elle est d'ailleurs un procédé tout aussi utilisé que la synonymie. Il faut
dire que c'est une commodité définitoire qui se justifie dans nombre de cas. Bien
souvent, les définitions commencent par le terme hyperonymique et le reste de la
70
définition précise les spécificités du mot vedette par rapport aux autres termes que
recouvre cet hyperonyme. On en revient à la définition aristotélicienne de la synonymie.
Un terme générique sert à mettre de concert des mots plus spécifiques mais qui
possèdent tous les propriétés de ce terme générique. Il s'agit donc d'un travail de
catégorisation. En effet, dans la définition lexicographique, l'hyperonyme en début de
définition permet de restreindre le champ auquel appartient l'entrée. Cela précise dès le
début dans quelle catégorie se situe cette entrée. Ainsi, l'hyperonymie dans les
définitions lexicographiques est une aide à la catégorisation.
A. Collinot évoque le fait qu'il serait intéressant d'importer la notion d'hyponymie
dans le domaine de la définition lexicographique. En effet, selon lui, « la relation
hyponymie est l'un des relations qui suture l'élément en position détachée d'entrée aux
termes de la séquence définitoire » (Collinot, 1990 : 60). Avec des articles pris dans le
Furetière, il montre que ce sont souvent des hyperonymes qui débutent les définitions.
Ils ont une fonction classificatrice comme nous venons de le dire mais ils ont également
une fonction anaphorique. En effet, l'hyperonyme qui initie la définition reprend le motvedette. C'est pour cela que Collinot parle de suture. De plus, il ajoute que les termes
génériques que sont les hyperonymes sont à prendre comme des étiquettes, ce qui
renforce l'idée d'une classification. Cependant, il précise que la représentation de cette
hyperonymie se fait « sur un axe allant d'un type de définition nécessairement
syntagmatique (pas de nom « tête »72 autonome) à une définition de type
paradigmatique (nom « tête » hyperonyme) » (Collinot, 1990 : 62). Selon Collinot,
l'hyperonymie renvoie à ce qu'il nomme « synonymie paradigmatique ». Cette
qualification de « paradigmatique » sous-tend l'idée de substitution d'où l'association
possible de cet adjectif avec la notion de synonymie. Ainsi, l'hyperonymie ressort de la
substitution au même titre que la synonymie dans les définitions lexicographiques. Enfin,
il conclut que « l'hyponymie est une des formes d'écriture de l'énoncé définitoire »
(Ibid. : 68).
5.2. Hyperonymie et synonymie : quelle compatibilité ?
Puisque nous cherchons à comparer l'hyperonymie et la synonymie, il nous faut
déterminer jusqu'à quel point ces deux notions sont compatibles. De cette compatibilité,
découlera à la fois la pertinence de l'exemple de l'hyperonymie pour remettre en cause la
notion de synonymie dans le DES et le degré de cette remise en cause. Plus précisément
: plus elles seront éloignées, moins cet exemple de l'hyperonymie sera pertinent mais
plus la présence de l'hyperonymie dans le DES remettra en cause la synonymie dans ce
dictionnaire. En contrepartie, plus elles seront proches, plus l'exemple de l'hyperonymie
sera pertinent mais moins il y aura de remise en cause de la synonymie dans le DES.
Voyons donc quelle est cette compatibilité.
5.2.1. Catégorie grammaticale et substituabilité
Le critère grammatical importe beaucoup dans la relation de synonymie. Deux
synonymes se doivent d'être de la même catégorie grammaticale sinon la relation de
substituabilité n'est plus envisageable. Le critère grammatical est donc nécessaire pour
que le paradigme ne soit pas modifié ce qui risquerait de modifier aussi le sens.
L'hyperonymie ne déroge pas à ce critère grammatical. Il faut considérer que
l'hyperonymie ressort de la catégorisation. Ne peuvent être catégorisées ensemble que
des entités de même nature. La catégorisation ne touche que des objets concrets du
72
Le nom « tête » est le nom qui initie la définition lexicographique. Voici deux exemples du Furetière dont se servait
A. Collinot pour sa démonstration : « ficelle : petite corde déliée qui sert à lier des paquets » et « fraise : petit fruit
rouge ou blanc ». Ils représentent les deux types de noms « tête » que distingue Collinot. Il opère à l'aide d'un test
qui consiste à créer une phrase définitionnelle avec l'entrée et le nom « tête ». Si la phrase est acceptable, alors le
nom « tête » est autonome et donc hyperonyme, sinon le nom « tête » n'est pas autonome. Ainsi, avec les exemples
cités, nous obtenons : « *la ficelle est une corde » (Collinot, 1990 : 61) et « la fraise est un fruit » (Ibid. : 62).
71
monde. Cela se traduit notamment par une même catégorie grammaticale, qui est
généralement celle des noms communs. Ainsi, l'hyperonymie respecte bien ce critère
grammatical si bien que la substituabilité est possible. En revanche, il ne faut pas oublier
que cette substituabilité requiert également un critère sémantique. Deux synonymes
doivent référer au même référent et avec le même sémantisme. Certes, un mot peut être
remplacé par son hyperonyme, la référence sera toujours la même, en revanche le
sémantisme aura changé. Un mot et son hyperonyme ont en commun différents traits
sémantiques. Cependant, ces traits sont également communs à d'autres hyponymes de
cet hyperonyme. Ainsi, en entrant dans un degré plus élevé de généralité, on perd bon
nombre de spécificités pourtant constitutives du sens du mot en question. De ce fait, un
hyperonyme n'est pas rigoureusement substituable à son hyponyme puisque le sens est
appauvri dans cette substituabilité. Bien sûr, il existe des cas où cette substituabilité
semble possible tant que l'appauvrissement du sens n'a pas un impact trop important sur
le sens de l'énoncé dans lequel se trouve ce mot.
Notons toutefois que l'hyperonymie est la plupart du temps une relation de
substitution dans un contexte plus large que celui d'une simple phrase. En effet, la
synonymie est une substituabilité micro-syntaxique puisqu'elle ne dépasse pas le cadre
de la phrase. En revanche, l'hyperonymie est plutôt une substituabilité macrosyntaxique. En effet, elle est très employée dans les phénomènes d'anaphore. Ainsi, la
substitution se fait à longue distance. Le référent est le même, le sémantisme semble
altéré du fait de la plus grande généralité de l'hyperonyme. Cependant, on peut très bien
enchaîner à nouveau sur l'hyponyme sans que le sémantisme soit dégradé si bien qu'il
semble tout de même conservé. Cependant, cette question de l'anaphore dépasse notre
propos. Nous nous en tiendrons à la substituabilité micro-syntaxique.
5.2.2. Les propriétés algébriques de l'hyperonymie
Réflexivité : considérons le mot A. Est-il son propre hyperonyme ? A priori, oui. De
même, le mot A, est-il son propre hyponyme ? Même réponse. Cependant, ceci est
possible si la relation d'hyperonymie est une relation d'inclusion que l'on pourrait
schématiser avec le symbole mathématique « supérieur ou égal » (≥). En revanche,
l'hyperonymie ne peut plus être dite réflexive si elle est une relation d'inclusion stricte,
c'est-à-dire schématisée par le symbole « supérieur » (>).
Symétrie : un hyperonyme peut se substituer à l'un de ses hyponymes, encore que cela
dépende des contextes. En revanche, un hyponyme est rarement substituable à son
hyperonyme. Un hyperonyme étant un terme de plus grande généralité, il englobe
l'hyponyme ainsi que tous ses cohyponymes, qui, eux, possèdent d'autres particularités.
La substitution par l'hyperonyme généralise, elle appauvrit le sens. En revanche, la
substitution par l'hyponyme spécifie à outrance. Des particularités sont apportées qui
déstabilisent le contexte. Ainsi la relation hyperonymie / hyponymie n'est pas une
relation symétrique puisque la substitution est trop problématique. D'ailleurs, c'est une
relation orientée car c'est généralement la substitution par l'hyperonymie qui prime.
Transitivité : si un terme A est l'hyperonyme de B (qui est donc son hyponyme puisque la
relation est orientée) et B est l'hyperonyme de C (qui est son hyponyme) alors C est
aussi l'hyponyme de A (et donc A l'hyperonyme de C). Nous pouvons en conclure que
l'hyperonymie est bien une relation transitive.
En résumé, l'hyperonymie est une relation d'une toute autre nature que la
synonymie : elle est peut-être réflexive, non symétrique mais transitive, tandis que la
synonymie est réflexive, symétrique mais non transitive. Cela dénote une incompatibilité
du point de vue des propriétés algébriques entre la synonymie et l'hyperonymie, ce qui
aura des répercussions sur le traitement de ces deux notions dans le cadre du DES.
5.2.3. L'hyperonymie sous l'angle temporel
Quel est le comportement de la relation d'hyperonymie en diachronie ? L'hyperonymie a
un rapport direct avec le monde du fait que c'est une relation sémantique qui relève de la
catégorisation. Il s'agit de hiérarchiser les unités lexicales en fonction de leurs référents
72
dans le monde. L'hyperonymie / hyponymie est un rapport de chose à chose bien plus
que la synonymie qui est un rapport de contenu à contenu. Les contenus sémantiques
changent bien plus vite que les choses (les référents). Certes, les référents changent au
cours du temps mais il demeure une certaine immuabilité dans le monde qui permet aux
catégories classificatoires de perdurer et donc d'être valides sur le long terme. Même si
les référents changent, le principe de la catégorisation et de la hiérarchisation demeure, il
s'adapte aux nouveaux référents. De son côté, la synonymie ayant bien plus rapport au
contenu qu'au référent, elle est bien plus sujette à changement. Les contenus
sémantiques changent rapidement du fait des aléas de l'usage. La langue en discours est
sans cesse remodeler par les locuteurs. Dès lors, on comprend que le monde paraisse
immuable à côté de cela.
C'est ainsi que l'on constate que l'hyperonymie et la synonymie ne sont pas égales
devant la diachronie. La première perdure tandis que la seconde implose.
5.2.4. Quelle compatibilité entre la synonymie et l'hyperonymie / l'hyponymie ?
Nous cherchons à déterminer dans quelle mesure la synonymie et l'hyperonymie sont des
notions compatibles, c'est-à-dire quelles sont leurs propriétés communes ? Peut-on les
traiter de la même manière, avec les mêmes outils ? Mais il faut garder à l'esprit que
l'hyperonymie est une relation double dont l'autre versant est l'hyponymie. Ainsi, c'est
non seulement la compatibilité entre la synonymie et l'hyperonymie qu'il faut déterminer
mais également celle entre la synonymie et l'hyponymie qui doit être exposée. En outre,
il faut juger laquelle de l'hyponymie ou de l'hyperonymie est la plus compatible avec la
synonymie.
Si nous reprenons la classification établie par E. Rosch et que nous situons un
synonyme au niveau de base, alors son hyperonyme se situant au niveau superordonné
possède moins de traits communs avec ce synonyme que l'hyponyme qui se situerait au
niveau subordonné. En effet, la Gestalt du niveau de base est très proche de celle du
niveau subordonné mais éloignée de celle du niveau superordonné. Ceci laisse à penser
que l'hyponyme en tant qu'appartenant au niveau subordonné a plus de légitimité que
l'hyperonyme pour être substitué au synonyme. Cependant, nous avons placé le
synonyme au niveau de base. Mais il peut être placé ailleurs. Par exemple, un synonyme
au niveau superordonné recevra pour hyponymes les mots des niveaux basique et
subordonné. Toutefois, d'après les propriétés de la Gestalt, le niveau superordonné est
très éloigné des deux autres. Ceux-là ont peu de légitimité à se substituer au synonyme
du niveau superordonné. Ainsi, tout dépend du point de vue à partir duquel on se place
pour considérer la relation d'hyperonymie. Néanmoins, il ne faut pas oublier une des
propriétés principales de l'hyperonymie : c'est une relation d'inclusion, et en tant que
telle, les niveaux inférieurs sont inclus dans les niveaux supérieurs. La relation va donc
du particulier au général, de l'hyponyme à l'hyperonyme, dans un mouvement englobant.
Ainsi, l'hyperonyme avec son degré de plus grande généralité recouvre les entités
désignées par ces hyponymes, et d'une certaine manière, il peut se substituer à elles. En
revanche, un hyponyme en tant que terme de moindre généralité est trop particulier pour
pouvoir se substituer commodément à un hyperonyme. Un hyponyme semblerait donc
trop restrictif par rapport à un hyperonyme, qui, lui, semble englobant. Cependant,
l'hyperonyme n'est-il pas trop englobant, trop général dans certains cas. Bien souvent,
c'est le contexte qui détermine les possibilités de substitution.
Du fait de la propriété d'inclusion de la relation d'hyperonymie, c'est cette dernière
qui semble plus légitimée à figurer au côté de la synonymie, dans un dictionnaire des
synonymes par exemple, plutôt que l'hyponymie.
En comparant les propriétés inhérentes à la synonymie et à l'hyperonymie, nous
remarquons que ces deux notions ne se comportent pas de la même manière. Ainsi, estil toujours légitime de les comparer ? On a tendance à le croire si l'hyperonymie se
retrouve au même titre que la synonymie dans le DES. Car, dans ce cas, elle remet en
cause un certain nombre de fondement du dictionnaire, comme par exemple la
symétrisation ou la définition de la synonymie du dictionnaire.
73
5.3. L'hyperonymie dans le DES
5.3.1. Quelques exemples
En cherchant quelque peu dans le DES, nous rencontrons aisément des hyperonymes et
des hyponymes. Cependant, il n'est pas aisé de savoir s'ils sont issus des liens
synonymiques proposés par les lexicographes ou s'ils sont le fruit de la symétrisation.
Nous sommes partis d'entrées à caractère hyperonymique pour voir si elles possédaient
des hyponymes dans leurs synonymes. Du fait de la symétrisation, ces mêmes
hyponymes ont forcément parmi leurs synonymes l'hyperonyme duquel nous sommes
partis.
Voici l'exemple de fruit au sens propre c'est-à-dire en tant que végétal :
synonymes
Lafaye
Guizot
Bailly
Bénac
Larousse
Robert
Du
Chazaud
agrume
akène
baie
faine
grain
graine
pomme
Tableau 9 : Répartition des synonymes de fruit en tant que végétal dans les dictionnaires
constitutifs du DES.
Nous y remarquons des hyponymes tels qu’agrume ou baie qui sont chacun des
termes regroupant une certaine classe de fruits. Mais l'on trouve également pomme qui
lui est un terme particulier de fruit. Ainsi, l'on remarque divers degrés d'hyponymie. Si
l'on reprend la classification de la sémantique du prototype, on pourrait considérer fruit
comme un terme du niveau superordonné, agrume ou baie comme des termes du niveau
de base et enfin pomme comme un terme subordonné. Cependant, les termes agrume et
baie ne sont pas forcément les termes les plus saillants à l'esprit puisqu'on emploierait
plus aisément fruit. Ainsi, la hiérarchie de la sémantique du prototype n'est pas
systématiquement efficiente.
En revanche, l'exemple suivant concernant pain en tant qu'aliment nous offre une
illustration d'un schéma de catégorisation proche de celui proposé par la théorie du
prototype. Il articule ensemble trois termes, le premier correspondant à l'hyperonyme, le
suivant au terme du niveau de base et enfin le dernier correspondant à l'hyponyme :
aliment
–
pain
–
baguette
Nous avons choisi le terme baguette dans cet exemple mais d'autres cohyponymes
étaient possibles, comme nous le montre le tableau suivant, tels que boule ou miche.
74
synonymes
Lafaye
Guizot
Bailly
Bénac
Larousse
Robert
Du
Chazaud
aliment
baguette
boule
bricheton
briffe
briffeton
brignolet
couronne
flûte
miche
nourriture
pitance
subsistance
Tableau 10 : Répartition des synonymes de pain en tant qu'aliment dans les dictionnaires
constitutifs du DES.
Ainsi, dans cet exemple sont représentés les trois niveaux de catégorisation de la
théorie du prototype, puisque sous une même entrée sont réunis des hyperonymes et
des hyponymes. Toutefois, si l'on s'intéresse à la visualisation de l'espace sémantique du
mot pain, on constate que les termes les plus hyponymiques tels que flûte, couronne ou
baguette ne figurent plus dans l'espace sémantique puisqu'ils ne forment que des cliques
de deux termes avec l'entrée pain.
Toutefois, l'exemple suivant de transport en tant que moyen de transport témoigne
du fait que les hyponymes ne sont pas systématiquement évincés de l'espace
sémantique.
synonymes
Lafaye
Guizot
Bailly
Bénac
Larousse
Robert
Du
Chazaud
aviation
avion
bateau
train
voiture
Tableau 11 : Répartition des synonymes de transport en tant que moyen de transport
dans les dictionnaires constitutifs du DES.
Parmi ces cinq synonymes hyponymiques de transport, les trois premiers ne figurent
pas dans l'espace sémantique tandis que les deux derniers y sont. Les cliques dans
lesquelles ils se trouvent en témoignent :
75
43 : aviation, transport
44 : avion, transport
45 : bateau, transport
50 : charroi, train, transport
113 : train, transport, voiture
Ainsi le dictionnaire des synonymes ne comporte pas seulement des synonymes
comme annoncé dans la définition. Cela oblige à s'interroger à nouveau sur la définition
de la synonymie adoptée dans le DES et à la confronter aux définitions données par les
dictionnaires qui ont servi à son élaboration. De plus, il faut s'intéresser à la manière
dont réagissent l'hyponymie et l'hyperonymie face à la symétrisation des relations
synonymiques.
5.3.2. Causes de la présence d'hyperonymes
Le DES comporte des hyperonymes comme nous venons de le montrer. Interrogeonsnous sur la provenance de ces hyperonymes. Il n'est pas nécessaire de rappeler
comment a été conçu le DES. Dès lors, nous comprenons d'où sont issus ces
hyperonymes. Ils émanent des choix synonymiques effectués par les lexicographes dont
les dictionnaires ont servi à l'élaboration du DES (Bénac, Bailly, Bertaud du Chazaud, …).
Certes, un traitement préalable a été effectué lors de la fusion des corpus
lexicographiques si bien que l'ensemble des liens synonymiques n'a pas été retenu. De
plus, des liens synonymiques ont été ajoutés automatiquement ou par des lexicographes
directement sur le DES. Cependant, ces liens sont minoritaires, ils ne constituent qu'une
partie infime des relations synonymiques présentes dans le DES si bien qu'ils sont
négligeables. Ainsi, les hyperonymes proviennent à n'en pas douter des sept
dictionnaires originels.
Néanmoins, il faut s'interroger sur la raison de la présence de ces hyperonymes dans
les dictionnaires des synonymes. Pour cela, il faut garder à l'esprit quel était le but de ces
lexicographes. Leur finalité était principalement pédagogique. Il s'agissait de fournir un
outil linguistique d'accompagnement à la production de texte. Les utilisateurs puisent les
informations qui leur manquent temporairement dans les dictionnaires car ceux-ci leur
fournissent
des mots qu'ils connaissent en "compréhension" mais qu'ils ont à l'instant même du mal à retrouver en
"production" » (Manguin, 2004a : 5).
On comprend donc que ce soutien à la production nécessite non seulement des
synonymes mais aussi des hyperonymes, et ce, afin d'offrir à l'utilisateur un plus grand
choix possible de mots. Cependant, nous avons vu que le DES comportait tout autant des
hyperonymes que des hyponymes. Nous avons expliqué que l'hyponymie avait moins de
légitimité que l'hyperonymie à se retrouver dans le DES et pourtant, elle est bien
présente. Il nous faut donc également expliquer sa présence. Certes, elle semble moins
substituable en contexte qu'un hyperonyme. Toutefois, si l'on se place dans la visée
pédagogique adoptée par les lexicographes alors elle peut avoir sa justification. Les
hyponymes ont lieu d'être si nous considérons le problème de la production de texte. En
effet, le rédacteur pourra manquer temporairement du lexème adéquat nécessaire à sa
production. Par exemple, ne lui vient à l'esprit qu'un terme général, autrement dit de
l'ordre de l'hyperonymie. Cependant, il recherche un mot plus précis qui explicitera
exactement son idée. Dès lors, ce n'est plus un hyperonyme qu'il lui faut mais plutôt un
hyponyme. Les hyponymes en tant que termes de moindre généralité ressortissent d'une
plus grande précision, utile à la production de texte lorsque l'on veut s'exprimer avec
exactitude. Ainsi, pour combler ses lacunes passagères, le rédacteur appréciera l'aide
d'un dictionnaire des synonymes à l'exhaustivité élargie par les hyperonymes et les
hyponymes.
Cette perspective de la production de textes justifie également la présence
d'hyperonymes dans un dictionnaire des synonymes au regard de la substitution. Ce
principe de la substitution se rapproche donc de la définition de la synonymie donnée
76
dans le DES. Cependant, la synonymie relève d'une substitution en contexte que l'on
peut aussi appeler substitution paradigmatique. En revanche, la substitution par
l'hyperonymie témoigne d'une volonté d'éviter les répétitions dans un texte, problème
auquel se heurte souvent le rédacteur. Ainsi, dans cette perspective, ce n'est plus le seul
contexte phrastique qui est pris en compte mais un contexte plus large pouvant aller
jusqu'au texte. Dès lors, il ne s'agit plus d'une substitution paradigmatique comme pour
la synonymie mais d'une substitution que nous pourrions appeler anaphorique. En effet, il
s'agit de désigner la même entité mais avec des dénominations différentes pour éviter la
lourdeur des répétitions dans la production textuelle. Ainsi, la synonymie et
l'hyperonymie relèvent toutes deux de la substitution mais cette substitution n'entre pas
dans le même cadre. Par conséquent, la présence d'hyperonymes dans un dictionnaire
des synonymes élargit le contexte de substitution dont il est question dans la définition.
Nous comprenons donc qu'une incompatibilité se profile du point de vue définitionnel
entre synonymie et hyperonymie en ce qui concerne les dictionnaires.
En nous intéressant à quelques exemples de relations synonymiques touchant à
l'hyperonymie, nous avons pu constater que les hyperonymes et hyponymes étaient la
plupart du temps le fait d'un ou deux dictionnaires : le Bertaud du Chazaud secondé par
le Robert. Par exemple, parmi les 30 synonymes de siège en tant que meuble pour
s'asseoir, 29 sont mentionnés par le Bertaud du Chazaud dont 20 uniquement
mentionnés par ce dictionnaire. Le Robert arrive en second avec 8 synonymes
mentionnés.
synonymes
Lafaye
Guizot
Bailly
Bénac
banc
banquette
berceuse
bergère
boudeuse
canapé
causeuse
chaire
chaise
coin-de-feu
divan
escabeau
escabelle
fauteuil
lunette
miséricorde
place
pliant
pouf
prie-Dieu
77
Larousse
Robert
Du
Chazaud
récamier
selle
sellette
sofa
stalle
strapontin
tabouret
trépied
trône
vis-à-vis
Tableau 12 : Répartition des synonymes de siège en tant que meuble dans les
dictionnaires constitutifs du DES.
Cela s'explique par la nature du Bertaud du Chazaud : c'est un dictionnaire cumulatif
(un grand nombre de synonymes est regroupé sous une même entrée dans un souci
d'exhaustivité). Ainsi, il n'est pas étonnant de rencontrer parmi ces synonymes des
hyponymes ou des hyperonymes. Quant à lui, le Robert est un dictionnaire général à
visée encyclopédique. Ces renvois témoignent de relations sémantiques plus larges que
la synonymie comme par exemple l'hyponymie. Dans notre exemple, siège est pris
comme un hyperonyme et nous constatons donc que ces synonymes sont pour la plupart
ces hyponymes. Nombre de sièges spécifiques sont mentionnés mais certains
n'apparaissent même pas sur la visualisation de l'espace sémantique car ils ne forment
qu'une clique à deux éléments avec l'entrée.
D'ailleurs, la totalité des liens synonymiques touchant plutôt à l'hyperonymie n'a pas
été conservée. En effet, dans les pages internes du site du CRISCO, il y a possibilité
d'avoir accès aux listes de synonymes en fonction du dictionnaire dont ils sont issus. Sont
également mentionnés les synonymes qui ont été enlevés suite à l'harmonisation ou qui
ont été ajoutés grâce à l'enrichissement du DES. Par exemple, si l'on demande la requête
chien, on remarque qu'une très longue liste a été supprimée : il s'agissait pour la plupart
de races de chiens provenant du Bertaud du Chazaud et du Robert. De même, pour
cheval, parmi les mots enlevés, une majorité écrasante provenait du Robert: il s'agissait
de races de chevaux mais surtout des couleurs des pelages. Dans les deux cas que nous
venons de citer, cette surabondance d'hyponymes ne peut se justifier que par une visée
encyclopédique et exhaustive.
5.3.3. Problème de la symétrisation
L'hyperonymie est une relation orientée puisqu'elle n'est pas symétrique. En effet, cette
relation est orientée de l'hyperonyme vers son ou ses hyponymes, c'est-à-dire que
l'hyperonyme, terme de plus grande généralité inclut le ou les hyponymes, terme(s) de
moindre généralité. On comprend dès lors que la symétrisation d'une telle propriété pose
problème. Et pourtant, les hyperonymes et certains de leurs hyponymes étaient présents
dans les fichiers qui ont servis à l'élaboration du DES, ce qui signifie qu'ils étaient
présents avant l'étape de la symétrisation. Ainsi, ces relations ont été symétrisées au
même titre que les autres liens synonymiques du DES. Qu'un hyponyme reçoive à la
suite de la symétrisation un hyperonyme parmi ses synonymes n'est pas encore le
problème le plus marquant de la symétrisation, puisque l'hyperonyme en tant que terme
plus englobant a plus de chance d'être synonyme avec l'entrée. En revanche, l'inverse
comporte davantage d'inconvénients. En effet, qu'à la suite de la symétrisation, un
hyperonyme reçoive nombre de ces hyponymes parmi ses synonymes devient plus
78
gênant. Un hyponyme en tant que terme de moindre généralité a moins de chance de
satisfaire au contexte de substitution si bien que le processus de substituabilité
nécessaire à la synonymie se trouve enrayé.
Reprenons les exemples déjà cités. Un mot comme siège hyperonyme possède
nombre d'hyponymes. Avec la symétrisation, ce sont ces hyponymes qui se retrouvent
avec siège, leur hyperonyme comme synonyme. Le processus inverse se produit
également : lorsqu'un mot possède comme synonyme son hyperonyme alors, suite à la
symétrisation, cet hyperonyme se retrouve avec un hyponyme comme synonyme.
D'ailleurs, si l'on tenait compte des synonymes supprimés lors de l'harmonisation, on en
viendrait à d'importantes aberrations comme par exemple, avec les synonymes de chien
ou cheval.
Voici un exemple encore plus frappant que les autres : linguistique pris comme
hyperonyme des autres disciplines des sciences du langage :
synonymes
Lafaye
Guizot
Bailly
Bénac
Larousse
Robert
Du
Chazaud
dialectologie
grammaire
grammaire
comparée
langagier
lexicographie
lexicologie
littérature
morphologie
métalangage
onomastique
philologie
phonologie
phonétique
science du
langage
stylistique
syntaxe
sémantique
sémistique
toponymie
étymologie
Tableau 13 : Répartition des synonymes de linguistique dans les dictionnaires constitutifs
du DES.
La majeure partie des synonymes de linguistique, qui d'ailleurs sont des hyponymes
proviennent du Bertaud du Chazaud, ce qui a tendance à biaiser les résultats. Lorsqu'on
79
feuillète le Bertaud du Chazaud, nous remarquons que ces hyponymes figurent dans la
liste de synonymes de l'entrée linguistique. Toutefois, parmi ces hyponymes, certains ne
se retrouvent pas en entrée dans le Bertaud du Chazaud, comme c'est le cas par
exemple de dialectologie ou toponymie. C'est la symétrisation qui a donc introduit ces
hyponymes comme nouvelles entrées du DES avec bien souvent pour seul synonyme le
mot linguistique. Cependant, très peu de ces hyponymes se retrouvent dans l'espace
sémantique de linguistique, puisqu'ils ne forment que des cliques binaires, ce qui ne
déforme pas sa visualisation.
Ainsi, la symétrisation se trouve faussée par les hyperonymes car elle n'était valable
qu'avec des liens synonymiques. La symétrisation qui était pourtant une perspective
enrichissante en vient à donner des résultats aberrants quant aux liens synonymiques
qu'elle produit.
5.3.4. L'hyperonymie remet-elle en cause la définition de la synonymie et la
finalité du DES ?
La présence d'hyperonymes trouble les résultats de la symétrisation du dictionnaire.
Nous avons montré qu'il s'agissait d'une étape importante dans la réalisation du
dictionnaire. Le nombre de ces liens d'hyperonymes à hyponymes ne sont pas
négligeables. Cela pourrait tendre à influer sur les représentations sémantiques et ainsi
introduire un biais dans les résultats obtenus pour l'étude de la polysémie. Cependant, si
l'on observe la place que prennent les hyponymes dans les cliques, on se rend compte
que, bien souvent, ils forment seulement des cliques binaires avec l'entrée où ils figurent.
De ce fait, ces hyponymes figurent rarement sur les visualisations d'espaces
sémantiques. La plupart du temps, ils sont donc le fait de cliques isolées et ils biaisent
peu les travaux qui peuvent être faits sur la polysémie. Bien sûr, si l'on reprend les
exemples déjà cités, nous remarquons qu'il y a, tout de même, quelques exceptions
comme par exemple transport. Le cas de siège est quelque peu différent. Nous
retrouvons beaucoup d'hyponymes de siège parmi ces synonymes, mais certains forment
entre eux des sous-catégories de sièges qu'il est donc tout à fait légitime de retrouver
sous forme de cliques.
En
11
12
13
14
23
voici quelques exemples :
: canapé, causeuse, siège, sofa
: canapé, divan, siège, sofa
: canapé, fauteuil, siège, sofa
: canapé, récamier, siège, sofa
: escabeau, escabelle, siège, tabouret
Les chercheurs du CRISCO avaient conçu le DES dans une perspective scientifique,
c'est-à-dire comme un outil rigoureux permettant de représenter la polysémie des unités
lexicales à l'aide de leurs synonymes, voire pour départager les polysèmes des
homonymes. La présence d'hyperonymes a tendance à fausser les résultats.
L'hyperonyme dénature la cartographie sémantique de l'unité lexicale si bien que la
représentation de la polysémie s'en trouve perturbée. L'outil perd de sa rigueur et, par là
même, de sa pertinence.
Ainsi, la finalité scientifique diffère de la finalité didactique comme nous l'avons
explicité précédemment. Qu'en est-il alors de la finalité propre du DES ? Elle était
purement scientifique, elle est devenue pédagogique avec la mise en ligne du
dictionnaire. Où se situe-t-elle désormais ? Nous voyons que l'hyperonymie remet en
partie en cause cette finalité scientifique. Dès lors, quelle devient la pertinence des
travaux scientifiques s'appuyant sur le DES ? Certes, l'impact réel de l'hyperonymie
semble négligeable du point de vue des recherches scientifiques. Toutefois, il ne l'est plus
dès lors qu'on se penche sur la définition de la synonymie dans le DES et sur la finalité
de ce dictionnaire. En effet, les hyperonymes sont principalement issus du Bertaud du
Chazaud et du Robert, le premier étant cumulatif, le second encyclopédique. Certes, ils
80
traitent de la synonymie mais ils en ont une définition large et étendue jusqu'à
l'hyperonymie. En revanche, le DES restreint son champ d'investigation à la substitution
en contexte. Bien sûr, c'est un dictionnaire cumulatif mais il hérite de nombres de liens
synonymiques du Bertaud du Chazaud. Néanmoins, il n'est pas question d'une visée
encyclopédique dans le DES. Et pourtant, au travers du Larousse et surtout du Robert, il
hérite de cette perspective. Ainsi, la définition de la synonymie dans le DES et sa finalité
se trouvent guidées par celles des dictionnaires constitutifs du DES. Ce problème de
l'hyperonymie semble mettre au jour l'incompatibilité présente dès l'origine entre les
définitions du DES et celles des lexicographes. Au final, ce sont celles des lexicographes
qui priment sur celle du DES.
81
6. Conclusion
Nous avions pour but de traiter une approche instrumentée de la synonymie. Il
s'agissait donc d'une perspective de linguistique informatique puisqu'il était question de
l'utilisation d'un outil informatique au service de recherches sur la langue. Nous prenions
l'exemple du DES comme outil de recherche en sémantique permettant de représenter le
sens et donc la polysémie grâce à la synonymie.
Pour comprendre quel est l'objet du DES, il nous a fallu auparavant définir avec
précision ce qu'est la synonymie. Pour cela, nous avons, au préalable, défini ce qu'était le
sens et la référence, selon nous. De là, nous avons adopté la conception dynamique du
sens théorisée par B. Victorri et C. Fuchs : le sens est un va-et-vient entre le noyau
sémantique de l'unité lexicale et le contexte dans lequel se situe cette unité. Ainsi, le
sens se construit de manière dynamique, se réinventant dans chaque nouveau contexte.
Victorri et Ploux ont mis au jour deux synonymies : une synonymie pure et une
synonymie partielle. La première étant purement théorique, seule la seconde pouvait
faire l'objet d'une étude. Voici d'ailleurs la définition de cette synonymie partielle,
deux unités lexicales sont en relation de synonymie si toute occurrence de l'une peut-être remplacée par
une occurrence de l'autre dans un certain nombre d'environnement sans modifier notablement le sens
de l'énoncé dans lequel elle se trouve » (Ploux & Victorri, 1998 : 162).
Nous avons vu que la catégorie grammaticale jouait un rôle crucial dans la relation de
substitution qu'est la synonymie. En effet, la synonymie en tant que relation de
substitution en contexte ne doit pas modifier le sens de ce contexte si bien que la
catégorie grammaticale des unités substituées ne doit pas changer afin de conserver le
paradigme. Sous l'angle temporel, la synonymie perd sa consistance : c'est une relation
synchronique qui implose en diachronie. Enfin, la synonymie ne peut être définie sans
qu'il ne soit fait mention de la polysémie. Elles sont comme les deux faces d'une même
réalité. Victorri et Fuchs définissent la polysémie à l'aide de la paraphrase, terme plus
générique que la synonymie mais qui conserve l'idée de substitution. Quant à la
polysémie, étant inhérente à la langue, elle touche à la synonymie et c'est même elle qui
la rend partielle. En effet, un mot ne peut être substitué par tous ses synonymes, car
selon les contextes, il change de sens, il est polysémique. Ainsi, la substituabilité n'est
que partielle. Ce caractère partiel ainsi que le fait qu'elle soit une relation synchronique
rendent la synonymie instable et difficilement maîtrisable. Et pourtant, il existe bel et
bien des dictionnaires des synonymes.
Parmi tous les dictionnaires des synonymes qui existent, nous nous sommes
intéressée plus particulièrement au Dictionnaire Electronique des Synonymes du CRISCO.
Le DES est un dictionnaire compilatoire et cumulatif mais aussi symétrisé. Les auteurs du
DES ne pouvaient faire abstraction des précédents dictionnaires de synonymes si bien
qu'il est un dictionnaire compilatoire. De plus, son traitement informatique nécessitait
qu'il soit des plus épurés, puisqu'il n'était pas possible de conserver toutes les
distinctions faites par les lexicographes : seul le type cumulatif répondait à une telle
exigence. Enfin, c'est un dictionnaire symétrisé du fait de la propriété de symétrie de la
synonymie. Pour comprendre ce dictionnaire, il faut considérer les dictionnaires des
synonymes qui ont servi à l'élaboration du DES. Il s'agit de sept dictionnaires du XIXème
siècle et du XXème siècle, chacun ayant sa manière de concevoir la synonymie et ce qui
doit figurer dans un dictionnaire des synonymes. Toutefois, le point qui ne doit pas être
omis est la prise en compte du caractère diachronique de la langue en lexicographie. En
effet, les lexicographes en compilant les dictionnaires de leurs prédécesseurs pour créer
le leur tiennent compte d'états plus anciens de la langue si bien que leurs dictionnaires
sont constitués de strates synchroniques successives et non d'une seule synchronie. Le
DES comprenant des dictionnaires dont les dates de publication s'étendent sur un siècle
et demi est d'autant plus sujet à ce phénomène. Notons que la définition de la synonymie
du DES correspond à celle énoncée par Ploux et Victorri mais elle diffère de celles
82
proposées par les autres lexicographes. Nous saisissons là une des principales limites du
DES. Les synonymes donnés par les lexicographes des sept dictionnaires originels sont
en accord avec leur définition de la synonymie mais nous ne pouvons pas en dire autant
de celle du DES. Ces divergences constituent la faille de cette ressource que nous avons
exploitée dans notre dernière section.
Atout majeur du DES, la symétrisation découle du fait qu’il est issu d'un modèle
mathématique ce qui permet de systématiser la principale propriété algébrique dont jouit
la synonymie : la symétrie. La DES est donc un dictionnaire électronique constitué de
relations synonymiques symétrisées qui s'organisent en un réseau de connexions. Les
entrées du dictionnaire ont plusieurs synonymes qui, à leur tour, ont des synonymes.
Ainsi, de proche en proche, la majeure partie des entrées sont connectées entre elles,
formant un immense réseau. Chaque entrée associée à ses synonymes forme un espace
sémantique qui peut être visualisé sur le site du DES. Sur cette visualisation apparaissent
les cliques, atomes de sens de l'entrée en question, qui, selon leur répartition, indiquent
les proximités des sens d'une unité lexicale. Cette répartition des sens donne une idée de
la polysémie et de l'homonymie de l'entrée car les cliques peuvent être regroupées en
ensembles plus vastes nommés composantes connexes qui sont un bon indicateur pour
trancher entre polysémie et homonymie.
Le DES apporte donc des outils pour la recherche linguistique puisqu'il permet de
représenter le sens grâce aux cliques et d'étudier la polysémie des mots. Bien sûr, le DES
était à l'origine un outil de recherche scientifique mais sa mise en ligne a révélé qu'il
pouvait tout aussi bien avoir une utilité didactique comme les autres dictionnaires papier.
Le serveur Internet recueille les informations laissées par les internautes lorsqu'ils se
connectent au site ce qui permet de connaître la provenance des requêtes et ainsi de
déterminer l'usage qui est fait du DES. Il est principalement utilisé à des fins
professionnelles. De ce fait, la finalité du DES de scientifique est devenue plutôt
didactique, ce qui modifie la manière de le considérer. En cela, il se rapproche des
dictionnaires dont il est la somme. Cela laisse donc entrevoir une incompatibilité entre la
finalité que s'étaient fixés les auteurs des dictionnaires originels et la finalité première du
DES. En outre, le DES change la vision que l'on a de la dictionnairique. D'une
dictionnairique papier, l'on passe à une dictionnairique numérique débarrassée de
nombreuses contraintes et qui, d'ailleurs, a trouvé un remède à l'obsolescence des
éditions papier. Le dictionnaire électronique peut régulièrement être augmenté sans
qu'une quelconque contrainte dictionnairique pèse sur lui, si bien qu'il se départit de la
fixité des éditions papier. Cependant, cette nouvelle dictionnairique bouleverse l'aspect
diachronique de la langue : il n'y a plus d'éditions successives des dictionnaires pour
montrer l'évolution de la langue, celles-ci sont toutes fondues ensemble dans une même
« édition » en perpétuelle régénération. L'outil informatique apporte donc beaucoup à la
linguistique et a fortiori à la synonymie mais il n'est pas sans receler quelques limites.
Elles touchent à la diachronie mais pas seulement. De plus, cet outil n'est pas exhaustif,
il peut être enrichi encore et encore. D'ailleurs, ce problème de l'enrichissement rejoint
celui de la diachronie puisque le DES se doit de s'enrichir de nouvelles unités lexicales
entrant en langue. Diverses méthodes informatiques sont développées pour trouver des
solutions au problème de l'enrichissement. Ces méthodes peuvent s'appuyer sur le DES
lui-même en optimisant ses propres relations synonymiques ou « recourir à un matériau
externe à la ressource que l'on bâtit, qu'il soit un corpus de textes ou un dictionnaire
complémentaire » (Manguin et alii, 2008b : 28). Les méthodes les plus concluantes c'està-dire qui apportent des liens synonymiques récemment entrés en langue sont les
méthodes exogènes. Elles couplent enrichissement quantitatif et diachronique, et ce de
manière automatique. L'obsolescence de la ressource est ainsi contrôlée.
Le DES a glissé vers de nouvelles finalités depuis sa mise en ligne comme nous
l'avons déjà signalé. Il reste à savoir quelle attitude adopter face à ce changement ? La
question se pose d'autant plus lorsqu'on étudie le cas de l'hyperonymie. Les
hyperonymes proviennent des dictionnaires fondateurs du DES et sont en accord avec les
définitions de la synonymie que se sont donnés les lexicographes. En revanche, leur
présence ne semble plus concorder avec la définition de la synonymie à l'origine du DES.
D'ailleurs, l'hyperonymie ne semble pas compatible avec la symétrisation des relations
83
synonymiques. En effet, l'hyperonymie n'étant pas une relation symétrique. La
symétrisation de cette notion a apporté des aberrations. De ce fait, le DES se retrouve
fourni en hyperonymes et en hyponymes encore plus qu'avant cette étape. La présence
de ces hyperonymes issus des dictionnaires originels remet en cause la définition de la
synonymie et la finalité que le DES s'était donné au départ : de scientifique, elle est
devenue didactique. Dans quelles mesures peut-on encore prétendre faire des recherches
scientifiques avec le DES ? Nous ne disons pas que toute recherche avec le DES est
désormais impossible. Nous interrogeons seulement le degré de scientificité de cette
ressource. Il n'en demeure pas moins que le DES restera un outil très apprécié dans un
usage didactique.
Un problème récurrent dans notre sujet concerne la diachronie. Rappelons que cette
notion intervient à quatre niveaux dans notre sujet. Tout d'abord, la diachronie par
rapport à la notion de synonymie : cette notion a subi des changements sémantiques au
cours du temps et principalement de la conception aristotélicienne de la synonymie à
notre conception moderne de cette notion. Puis, la diachronie par rapport à la relation de
synonymie : les mots changent de sens avec le temps, ils changent donc nécessairement
de synonymes. Ainsi, la synonymie perd de sa consistance avec le temps, c'est une
notion purement synchronique. Ensuite, la diachronie par rapport au DES : les
dictionnaires à l'origine du DES ont été publiés à des dates passées, si bien que le DES
est une collection de strates temporelles successives, il ne tient pas compte d'une seule
synchronie. Cette remarque est à mettre en lien avec ce qui a été dit juste avant : la
synonymie est une relation purement synchronique. Ainsi, la conception d'un dictionnaire
de synonymes pose forcément problème vis-à-vis du caractère synchronique de la
synonymie. La synonymie est synchronique mais les dictionnaires de synonymes ont
nécessairement une vision large de cette synchronie, vision tendant à la diachronie d'où
une incompatibilité au prime abord. Cet inconvénient est accentué dans le DES étant
donné son rapport à la dictionnairique. En effet, le DES en tant que dictionnaire
électronique ne peut pas tenir compte des éditions successives qui montrent l'évolution
de la langue, lui encore moins qu'un autre. Ainsi, le caractère diachronique de la langue
est perdu mais l'on en vient aussi à oublier que la synonymie est synchronique.
Mais comment pallier les diverses interrogations soulevées par la diachronie ? Il
faudrait pouvoir apporter quantités d'indications temporelles aux entrées du DES et leurs
synonymes. Mais est-ce seulement possible ? De même, un autre point touchant à la
diachronie concerne l'enrichissement du DES avec les nouveaux lexèmes que compte la
langue. Cela mettrait le DES en accord avec les dernières évolutions de la langue. Mais il
ne faut pas oublier que cela ne ferait qu'ajouter des strates synchroniques à toutes celles
déjà présentes dans le DES. Et pourtant, un des atouts du DES en tant que ressource
électronique est justement de pouvoir combattre sa propre obsolescence à moindre coût.
Il n'en demeure pas moins que le but de ce travail est de mettre au jour ce que
l'informatique et plus précisément le traitement automatique des langues peuvent
apporter à la synonymie. L'apport majeur à développer est l'enrichissement du
dictionnaire ce qui se traduit par l'ajout de nouvelles relations synonymiques que ce
soient de nouveaux synonymes ou de nouvelles entrées pourvues de synonymes. Ainsi,
pour notre sujet, le but de la linguistique informatique est de mettre en place des
méthodes automatiques d'enrichissement du dictionnaire. Une des principales
techniques est : l'extraction automatique de synonymes à partir de corpus multilingues
alignés. Lorsque le DES est pris comme référence en matière de synonymes pour les
mesures, ce sont, dès lors, les mesures qui suggèrent de nouveaux synonymes au DES.
En outre, les corpus utilisés pour ces mesures sont des corpus récents, en tout cas plus
récents que les dictionnaires qui ont servi à élaborer le DES. Ainsi, cette méthode à partir
de corpus multilingues permet d'enrichir le DES en synonymes et en entrées récemment
entrés en langue. De ce fait, le DES est enrichi sur deux plans : quant à son exhaustivité
et quant à la diachronie. Une telle méthode serait donc à réitérer sur d'autres corpus à la
fois récents et multilingues. Mais il faut pouvoir réunir de tels corpus. Les auteurs
Manguin, Tiedemann et Van der Plas ont poursuivi leurs recherches en extraction
automatique de synonymes. Leurs premiers travaux portaient sur les actes du Parlement
84
européen. Leurs résultats étaient satisfaisants mais ils n'obtenaient que des synonymes
du registre courant voire soutenu, et ce, sur des thèmes « parlementaires » dirons-nous.
Ils aspiraient à pouvoir appliquer leur méthode à d'autres corpus afin de recueillir des
synonymes dans d'autres thèmes et d'autres registres, notamment des registres plus
familiers. Ceci est tout à fait concevable puisque le DES, pris en tant que base
synonymique de référence de ces travaux, comporte également des synonymes de
registres familier et populaire. « We acquire domain-dependent synonyms from a corpus
that is very different in nature from Europarl corpus: a multilingual corpus of subtitles »
(Manguin et alii, 2010 : 11). On peut donc rapidement prendre la mesure de la différence
de genre qui existe entre ces deux types de corpus : les actes parlementaires débattent
sur les problèmes de société dans un langage courant voire soutenu tandis que les soustitres de films peuvent renvoyer à toutes sortes de sujets, du très sérieux ou très familier
et ce, bien souvent à l'aide de dialogues, donc pour la majeure partie dans une langue
parlée. « Above all, movie subtitles consist mainly of transcribed speech » (Ibid. : 11).
Bien que les actes du Parlement européen soient à l'origine des débats oraux, ceux-ci
sont retranscrits à l'écrit lors de leur publication si bien qu’ils perdent leurs traits d'oralité
pour prendre les tours de la scripturalité. « These proceedings are edited and far less
spontaneous than the speech data from the movies » (Ibid. : 11). Cette différence
générique et langagière est donc essentielle pour acquérir de nouveaux synonymes dans
des registres totalement différents. En plus de récolter des termes familiers, un corpus
de sous-titres assure aux chercheurs la possibilité d'appliquer leur méthode à un grand
nombre de langue afin que les résultats soient plus satisfaisants. En effet, le corpus
Europarl était constitué d'une dizaine de langues, nombre suffisamment important pour
que les résultats deviennent intéressants. « The complete corpus contains about 21
million aligned sentence fragments in 29 languages. We used all language pairs that
include French, 23 language pairs in total » (Ibid. : 11). Un tel corpus laisse espérer des
mesures aussi concluantes qu'avec le corpus Europarl. « In future work, we plan to run a
quantitative evaluation on these synonyms that were acquired from a corpus of
subtitles » (Ibid. : 12).
85
Références
ARISTOTE, Catégories, I, Présentation, traduction et commentaires de F. Ildefonse et J.
Lallot, 2002, Paris, Editions du Seuil.
ARRIVÉ M., GADET F. & GALMICHE M., 1986, La grammaire d'aujourd'hui, Paris :
Flammarion.
ARUTA STAMPACCHIA A., 2006, Introduction à la théorie des synonymes de PierreBenjamin Lafaye, Paris : Editions Lanore.
AUROUX S., 1998, La raison, le langage et les normes, Paris : PUF.
BOURIGAULT D. & GALY E., 2005, « Analyse distributionnelle de corpus de langue
générale et synonymie », in Williams G. (éd), Actes des 4èmes Journées de la
Linguistique de Corpus, pp. 163-174.
BRÉAL M., 1897, Essai de sémantique (sciences des significations), Paris : Hachette.
CHEVALIER J.-C., 1997, « La synonymie dans les manuels pédagogiques du début de la
Renaissance », in Langages, 31e année, n°128, 1997, pp. 8-24.
COLLINOT A., 1990, « L'hyponymie dans un discours lexicographique », in Langages, 25e
année, n°98, 1990, pp. 60-69.
DARMESTETER, A., 1887/1979, La vie des mots étudiée dans leurs significations, Paris :
Delagrave [1887], Champ Libre [1979].
DUBOIS J. (dir.), 2007, Grand Dictionnaire, Linguistique et sciences du langage, Paris :
Larousse.
FERRARA A., 2010, « Les dictionnaires des synonymes : une typologie évoluant avec le
temps », Congrès Mondial de Linguistique Française, pp. 927-944.
FRANÇOIS J. & MANGUIN J.-L., 2004, « Le dictionnaire électronique des synonymes du
CRISCO », Cahier du CRISCO n°17.
GARCÍA-HERNÁNDEZ B., 1997, « La sinonimia, relación onomasiológica en la antesala de
la semántica », Revista Española de Lingüística, 27, 2, págs. 381-407.
GUILLAUME P., 1979, La psychologie de la forme, Paris : Flammarion.
KAHLMANN
A.,
1975,
Traitement
automatique
d'un
dictionnaire
de
synonymes,
Stockholm : Université de Stockholm.
KLEIBER G., 1990, « Hiérarchie lexicale : catégorisation verticale et termes de base »,
Sémiotiques, vol. 1, n°1, pp. 35-57.
KLEIBER G., 1997, « Sens, référence et existence : que faire de l'extra-linguistique ? » in
Langages, 31e année, n° 127, pp. 9-37.
LAFOURCADE M. & PRINCE V., 2001, « Synonymie et vecteurs conceptuels », TALN 2001,
Tours.
MANGUIN J.-L., 2004a, « La dictionnairique Internet : l'exemple du dictionnaire des
synonymes du CRISCO », Corela – Cognition, Représentation, Langage, Numéro
spécial, pp. 1-14.
86
MANGUIN J.-L., 2004b, « Transitivité partielle de la synonymie : application aux
dictionnaires de synonymes », Corela, Volume 2, Numéro2.
MANGUIN J.-L., 2005, « Les dictionnaires en ligne : nouvelles diffusions, nouveaux
objectifs », colloque SIF 2005, Paris, 12-13 décembre 2005.
MANGUIN J.-L., TIEDEMANN J. & VAN DER PLAS L., 2008a, « Extraction de synonymes à
partir d’un corpus multilingue aligné », revue électronique Texte et corpus, n°3/ août
2008, Actes des Journées de la linguistique de Corpus 2007, pp. 151-161.
MANGUIN J.-L., TIEDEMANN J. & VAN DER PLAS L., 2008b, « Le traitement automatique :
un moteur pour l'évolution des dictionnaires de synonymes », Lexicographie et
informatique : bilan et perspectives, Nancy, 23-25 janvier 2008.
MANGUIN J.-L., TIEDEMANN J. & VAN DER PLAS L., 2010, « Automatic acquisition of
synonyms for French using parallel corpora », in Proceedings of the 4th International
Workshop on Distributed Agent-based Retrieval Tools, Geneva, Switzerland.
NEVEU F., 2004, Dictionnaire des sciences du langage, Paris : Armand Colin.
NYCKEES V., 1998, La Sémantique, Paris : Belin.
PLOUX S., 1997, « Modélisation et traitement informatique de la synonymie »,
Linguisticae Investigationes, XXI (1), Amsterdam, John Benjamins.
PLOUX S. & VICTORRI B., 1998, « Construction d'espaces sémantiques à l'aide de
dictionnaires de synonymes », Traitement Automatique des Langues, Vol 39/1, pp.
161-182.
PLOUX S., 2007,
« Enrichir automatiquement
des dictionnaires
électroniques de
synonymes et de traduction : une application du modèle d’appariement multilingue
des Atlas sémantiques », in Actes des 2es journées d'animation scientifique régionales
« Elaborer des dictionnaires en contexte multilingue », Tunis.
PRUVOST J., 2002, Les dictionnaires de langue française, Paris : PUF, « Que sais-je ? ».
REY-DEBOVE J., 1997, « La synonymie ou les échanges de signes comme fondement de
la sémantique », in Langages, 31e année, n° 128, La synonymie, pp. 91-104.
RIEGEL M., PELLAT C. & RIOUL R., 1994 / 2009, Grammaire méthodique du français,
Paris : PUF.
SAUSSURE F., 1916 / 1986, Cours de linguistique générale, Paris : Payot.
VENANT F., 2009, « Géométriser le sens lexical », Quatrième conférence internationale
sur la Théorie Sens-Texte (MTT'09), Montréal, Canada.
VICTORRI B., 1994, « La construction dynamique du sens », in Passions des formes — à
René Thom, M. Porte (Ed.), pp. 733-747.
VICTORRI B. & FUCHS C., 1996, La polysémie : construction dynamique du sens, Paris :
Hermès.
87
Dictionnaires
AUGÉ P. (dir.), 1933, Larousse du XXème en six volumes, tome 1, Paris : Larousse.
BERTAUD DU CHAZAUD H., 1971, Dictionnaire des synonymes, Paris : Editions Le Robert.
BERTAUD DU CHAZAUD H., 2003, Dictionnaire de synonymes et mots de sens voisin,
Paris : Gallimard.
BOUSSINOT R., 2007, Synonymes, analogies, antonymes, Réédition sous la direction de
Pruvost J., Paris : Bordas.
DUBOIS J. (dir.), 2009, Le Lexis Le Dictionnaire érudit de la langue française, Paris :
Larousse.
FURETIÈRE A., 1690 / 1978, Le Dictionnaire universel d'Antoine Furetière, La Haye :
Leers [1690], Paris : Editions Le Robert [1978].
GIRARD G., 1718,
La Justesse de la langue françoise, Édition annotée par Maria
Gabriella Adamo, 1999, Fasano : Schena Editore.
LITTRÉ E., 1968, Dictionnaire de la langue française, tome 1, Paris : Gallimard/Hachette.
REY A. (dir.), 1992, Dictionnaire historique de la langue française, Paris : Editions Le
Robert.
REY A. (dir.), 2005, Dictionnaire culturel en langue française, Paris : Editions Le Robert.
REY-DEBOVE J. (dir.), 2004, Le Robert Brio, Paris : Editions Le Robert.
ROUBAUD P., 1785, Nouveaux synonimes français, Paris : Moutard.
Sources du D.E.S.
BAILLY R., 1947, Dictionnaire des synonymes, Paris : Larousse.
BÉNAC H., 1956, Dictionnaire des synonymes, Paris : Hachette.
BERTAUD DU CHAZAUD
H., 1979, Dictionnaire des synonymes, Paris : Editions Le
Robert.
GUILBERT L. et alii., 1971, Grand Larousse de la langue française, Paris : Larousse.
GUIZOT F., 1864, Dictionnaire Universel des synonymes de la Langue Française, Paris :
Didier, (7ème édition).
LAFAYE P.-B., 1858, Dictionnaire des synonymes de la Langue Française, Paris : Hachette.
REY A. et alii., 1985, Le Grand Robert de la langue française, Dictionnaire alphabétique
et analogique de la langue française, Paris : Editions Le Robert (2ème édition).
Internet
Dictionnaire électronique des synonymes du CRISCO : < http://www.crisco.unicaen.fr>
88
Annexe
Annexe 1 : Exemple de pages de dictionnaire des synonymes de Guizot73.
73
Exemple issu de Ferrara (2010 : 942).
89
Annexe 2 : Exemple de page du Genouvrier (NDS Larousse)74.
74
Exemple issu de Ferrara (2010 : 943).
90
Annexe 3 : Exemple de pages (pp. 324-325) du dictionnaire de Bertaud du Chazaud
(1971).
91
Annexe 4 : Figures circulaires avec lesquelles Lafaye symbolisait la manière dont les mots
étaient synonymes entre eux75.
75
Figures issues d’Aruta Stampacchia (2006 : 51)
92
Table des matières
0.Introduction ............................................................................................................................................. 3
0.1. La synonymie : une notion épilinguistique ......................................................................... 4
0.2. Analogie et renvois ...................................................................................................................... 5
0.2.1. Synonymie et analogie ....................................................................................................... 5
0.2.2. Les renvois synonymiques ................................................................................................ 6
0.3. La définition synonymique : problème de lexicographie ................................................ 6
0.4. L'étymologie de la synonymie.................................................................................................. 7
0.4.1. Étymologie aristotélicienne ............................................................................................... 7
0.4.2. Changement de sens ........................................................................................................... 8
0.5. La synonymie dans les ouvrages de linguistique et de grammaire ........................... 9
0.5.1. La synonymie dans les grammaires .............................................................................. 9
0.5.2. La synonymie dans les ouvrages de linguistique : l'exemple de Saussure ... 10
1. La synonymie : qu'est-ce que c'est ?.......................................................................................... 12
1.1. La synonymie : une relation de sens .................................................................................. 12
1.1.1. Définitions du sens et de la référence ........................................................................ 12
1.1.2. Conception dynamique du sens..................................................................................... 13
1.1.3. Théories de la désignation et de la signification ..................................................... 15
1.2. Définition de la synonymie ...................................................................................................... 16
1.2.1. La synonymie : une notion onomasiologique ........................................................... 16
1.2.2. Synonymie totale / synonymie partielle ..................................................................... 16
1.2.3. Les propriétés algébriques de la synonymie............................................................. 17
1.2.4. La place de la catégorie grammaticale dans la synonymie ................................. 18
1.2.5. La synonymie : une relation synchronique ............................................................... 18
1.3. Une réalité à deux faces : imbrication de la synonymie et de la polysémie ......... 19
1.3.1. Définition de la polysémie ............................................................................................... 19
1.3.2. Quand la synonymie aide à définir la polysémie ..................................................... 20
1.3.3. Quand la polysémie participe de la définition de la synonymie ......................... 20
1.4. La synonymie : un paradoxe entre idéal de monosémie et principe d'économie
................................................................................................................................................................... 21
2. Le Dictionnaire Électronique des Synonymes : aspects lexicographiques .................... 23
2.1. Historique lexicographique de la synonymie .................................................................... 23
2.2. Typologie des dictionnaires des synonymes ..................................................................... 24
93
2.3. Les dictionnaires des synonymes dans le DES ................................................................ 26
2.3.1. Description métalexicographique de ces dictionnaires ......................................... 26
2.3.2. Lexicographie et synchronie ........................................................................................... 29
2.4. Le Dictionnaire Électronique des Synonymes .................................................................. 33
2.4.1. La définition de la synonymie dans le DES ............................................................... 33
2.4.2. Un dictionnaire compilatoire et cumulatif … ............................................................. 34
2.4.3. … mais symétrisé ................................................................................................................ 35
3. Description du DES: aspects techniques ................................................................................... 37
3.1. Protocole expérimental ............................................................................................................. 37
3.2. La symétrisation ......................................................................................................................... 37
3.3. Description de la ressource ..................................................................................................... 38
3.3.1. Le DES : un immense réseau ou un graphe multidimensionnel ....................... 38
3.3.2. Les espaces sémantiques ................................................................................................ 39
3.3.2.1. L'espace sémantique d'après la construction dynamique du sens ............... 39
3.3.2.3. Remarque sur les graduations ................................................................................... 43
3.3.2.4. Les cliques : atomes de sens ..................................................................................... 44
3.3.2.5. Les composantes connexes ......................................................................................... 46
3.3.3. Interface de recherche ..................................................................................................... 47
3.3.4. Liste des synonymes ......................................................................................................... 48
4. Les Apports de l'informatique à la synonymie ......................................................................... 49
4.1. Les apports techniques............................................................................................................. 49
4.1.1. Numérisation des corpus ................................................................................................. 49
4.1.2. Symétrisation ....................................................................................................................... 49
4.1.3. Les cliques ............................................................................................................................. 50
4.1.4. L'hypertextualité ................................................................................................................. 50
4.2. Mise en vitrine du travail de recherche .............................................................................. 50
4.3. Les finalités du DES ................................................................................................................... 54
4.3.1. Finalité scientifique du DES : représentation de la polysémie ........................... 54
4.3.2. Finalité lexicographique du DES : entre polysémie et homonymie .................. 54
4.3.3. Finalité didactique du DES : liste de synonymes .................................................... 55
4.4. Pour une nouvelle dictionnairique ........................................................................................ 56
4.4.1. Évolutivité de la ressource .............................................................................................. 56
4.4.2. L'aspect diachronique........................................................................................................ 57
94
4.5. Méthodes d'enrichissement ................................................................................................... 58
4.5.1. « Enrichissements endogènes » .................................................................................... 58
4.5.2. « Enrichissements exogènes » ...................................................................................... 60
4.5.2.1. Bourigault et la contextualisation de la synonymie ........................................... 60
4.5.2.2. Manguin et l'extraction automatique de synonymes à partir de corpus
multilingues alignés ........................................................................................................................ 63
4.5.2.3. Ploux et l'appariement multilingue des Atlas sémantiques ............................. 66
5. Quand l'outil remet en cause la notion : l'exemple de l'hyperonymie ............................ 69
5.1. L'hyperonymie : qu'est-ce que c'est ? ................................................................................ 69
5.1.1. Notion sémantique et théorie du prototype .............................................................. 69
5.1.2. L'hyperonymie, une notion savante............................................................................. 70
5.1.3. L'hyperonymie dans les définitions lexicographiques ............................................ 70
5.2. Hyperonymie et synonymie : quelle compatibilité ?...................................................... 71
5.2.1. Catégorie grammaticale et substituabilité ................................................................. 71
5.2.2. Les propriétés algébriques de l'hyperonymie ........................................................... 72
5.2.3. L'hyperonymie sous l'angle temporel .......................................................................... 72
5.2.4. Quelle compatibilité entre la synonymie et l'hyperonymie / l'hyponymie ? .. 73
5.3. L'hyperonymie dans le DES .................................................................................................... 74
5.3.1. Quelques exemples ............................................................................................................ 74
5.3.2. Causes de la présence d'hyperonymes ....................................................................... 76
5.3.3. Problème de la symétrisation ......................................................................................... 78
5.3.4. L'hyperonymie remet-elle en cause la définition de la synonymie et la
finalité du DES ? ............................................................................................................................... 80
6. Conclusion ............................................................................................................................................. 82
Références.................................................................................................................................................. 86
Annexe......................................................................................................................................................... 89
95
Was this manual useful for you? yes no
Thank you for your participation!

* Your assessment is very important for improving the work of artificial intelligence, which forms the content of this project

Download PDF

advertising