Planification de textes d`instructions

Planification de textes d`instructions
Universite de Montreal
PLANIFICATION DE TEXTES D'INSTRUCTIONS:
SE LECTION DU CONTENU ET
DE LA STRUCTURE RHE TORIQUE
par
Leila Kosseim
Departement d'informatique et de recherche operationnelle
Faculte des arts et des sciences
These presentee a la Faculte des etudes superieures
en vue de l'obtention du grade de PhilosophiDoctor (Ph.D.)
en informatique
ao^ut 1995
c Leila Kosseim, MCMXCV
ii
Universite de Montreal
Faculte des etudes superieures
Cette these intitulee
PLANIFICATION DE TEXTES D'INSTRUCTIONS:
SE LECTION DU CONTENU ET
DE LA STRUCTURE RHE TORIQUE
presentee par
Leila Kosseim
a ete evaluee par un jury compose des personnes suivantes :
Paul Bratley
(president-rapporteur)
Guy Lapalme
(directeur de recherche)
Richard Kittredge
(co-directeur)
Jacques Malenfant
(membre du jury)
Cecile Paris
(examinateur externe)
These acceptee le :
iii
SOMMAIRE
Cette these traite d'un probleme fondamental en generation automatique de texte: comment
selectionner l'information a communiquer et comment la presenter en un texte coherent.
Tout redacteur, humain ou automatique, selectionne parmi toute l'information disponible
ce qu'il communiquera dans son texte, puis choisit, parmi toutes les possibilites rhetoriques,
comment il presentera l'information en un texte coherent. Ces deux questions dependent d'un
grand nombre de facteurs, par exemple: l'audience visee, l'habilete linguistique du redacteur, le
domaine de discours et le genre textuel. Malgre leur importance, ces questions n'ont pas recu
toute l'attention qu'elles meritent en generation automatique de texte. En eet les travaux
anterieurs en planication textuelle traitent globalement de ces deux questions soit par un
m^eme processus de decision ou en liant directement les deux niveaux, reduisant d'autant la
diversite rhetorique. Or, la langue naturelle fournit un eventail de possibilites rhetoriques pour
presenter une m^eme information. Il s'avere donc interessant, de considerer les questions de
selection de contenu et de choix rhetorique separement tout en motivant linguistiquement les
liens entre eux.
La methodologie suivie dans cette these est empirique. Nous avons d'abord eectue
l'analyse d'un corpus de textes pour bien capturer les phenomenes linguistiques naturels. Pour
restreindre le projet, nous nous sommes concentree sur un genre textuel particulier: les textes
d'instructions. L'analyse de corpus nous a permis d'identier 9 elements de sens (ou elements
semantiques) typiquement communiques dans les textes d'instructions et 7 relations rhetoriques
utilisees pour presenter ces elements semantiques. L'analyse de corpus nous a aussi permis de
developper des heuristiques regissant la selection des elements semantiques a communiquer et
des relations rhetoriques a utiliser pour creer un texte coherent et naturel. Ces heuristiques
sont basees sur des contraintes conceptuelles, semantiques et rhetoriques, sur la nature de la
t^ache a accomplir et sur les connaissances et intentions du lecteur.
Pour verier les resultats de l'etude de corpus, le systeme informatique spin a ete concu.
Ce systeme eectue toutes les etapes de la generation automatique de texte, mais l'emphase a
iv
ete mise sur la determination du contenu et de la structure rhetorique. Les textes generes par
spin ont ainsi ete utilises pour raner et valider les heuristiques de selection et de presentation.
Cette these a permis d'explorer le domaine de la planication textuelle en denissant les
entites retrouvees au niveau semantique et au niveau rhetorique et les liens entre ces niveaux
dans un genre textuel particulier. De plus, les heuristiques developpees ont permis la construction du systeme spin, qui, nous l'esperons, ouvrira la voie vers la redaction et la mise a jour
automatique de manuels techniques.
v
TABLE DES MATIE RES
SOMMAIRE
iii
LISTE DES FIGURES
xii
LISTE DES TABLES
xiv
TERMINOLOGIE ET NOTATION
xvi
REMERCIEMENTS
xvii
CHAPITRE 1. Introduction
1
1. But de la these
1
2. La generation de texte
4
3. Contributions
6
4. Structure de la these
7
CHAPITRE 2. Travaux anterieurs et domaines connexes
9
1. Redaction technique
9
2.1. Applications
2.2. Architecture
1.1. Travaux generaux
1.2. Travaux en documentation informatique
2. Psychologie
2.1. Revision textuelle
2.2. Representation conceptuelle et contenu structurel
2.2.1. Le travail de Dixon
2.2.2. Les travaux de Smith et Goodman et de Konoske et Ellis
2.2.3. Le travail de Donin, Bracewell, Frederiksen et Dillinger
4
5
9
10
10
11
12
vi
3. Linguistique-informatique
3.1. Interpretation d'instructions
3.1.1. L'etude de Goldman
3.1.2. L'etude de Balkanski
3.1.3. L'etude de Di Eugenio
3.2. Generation d'instructions
3.2.1. Systemes multimedia
3.2.2. Systemes de generation de textes
16
16
21
4. Resume
29
CHAPITRE 3. Planication d'instructions
31
1. Les textes d'instructions en tant que genre textuel
31
2. La theorie de structure rhetorique (RST)
33
2.1. La RST en tant que theorie descriptive
2.2. La RST en tant que theorie constructive
2.2.1. Planication entiere par la RST
2.2.2. Organisation textuelle par la RST
34
34
3. Notre approche a la planification textuelle
37
4. Resume
42
CHAPITRE 4. Selection du contenu
43
1. Analyse semantique des instructions
43
2. Contraintes des heuristiques
50
3.1. Modele general
3.2. Analyse de corpus
1.1. Les elements semantiques
1.2. Problemes lies a l'analyse semantique
2.1.
2.2.
2.3.
2.4.
2.5.
2.6.
Les operations de base
Le contenu et la structure de la representation conceptuelle
Les cooccurrences d'elements semantiques
Les connaissances et intentions du lecteur
La nature de la t^ache
Le but communicatif
37
39
43
48
50
53
54
54
55
55
vii
3. Heuristiques de selection
56
4. Resume
70
CHAPITRE 5. Selection de la structure rhetorique
74
1. Les relations rhetoriques dans les instructions
74
2. Criteres des heuristiques
78
3. Heuristiques de presentation
81
3.1.
3.2.
3.3.
3.4.
3.5.
3.6.
3.7.
3.8.
3.9.
Les operations sequentielles
Les attributs d'objets
Les conditions materielles
Les eets
Les inuences
Les operations co-temporelles
Les options
Les preventions
Les operations eventuelles
1.1. La sequence
1.2. La c-condition
1.3. Le but
1.4. Le resultat
1.5. La concurrence
1.6. La limite
1.7. L'alternative
1.8. La sequence enumeree
1.9. La maniere
1.10. L'elaboration
2.1.
2.2.
2.3.
2.4.
2.5.
Le contenu et la structure de la representation semantique
Les cooccurrences de relations rhetoriques
Les connaissances et intentions du lecteur
La nature de la t^ache
Le but communicatif
3.1. Les operations sequentielles
3.2. Les attributs d'objets
3.3. Les conditions materielles
57
58
59
61
63
66
67
68
69
75
75
75
75
75
76
76
76
77
77
78
80
80
80
80
81
84
85
viii
3.4.
3.5.
3.6.
3.7.
3.8.
3.9.
Les eets
Les inuences
Les operations co-temporelles
Les options
Les preventions
Les operations eventuelles
86
89
92
92
92
93
4. Resume
94
CHAPITRE 6. Implantation: le systeme SPIN
96
1. Description generale de SPIN
96
2. La planification de ta^che
99
2.1. L'entree du planicateur de t^ache
2.2. La sortie du planicateur de t^ache
2.3. Le processus de planication de t^ache
3. La planification de texte
3.1. Le choix des elements semantiques
3.2. La structuration semantique
3.2.1. Le re-ordonnancement des elements semantiques
3.2.2. La resolution des contraintes de cooccurrence
3.3. Le choix des relations rhetoriques
3.4. La structuration rhetorique
3.4.1. La resolution des contraintes de cooccurrence
3.4.2. Le positionnement des satellites
3.4.3. La ponctuation
4. La realisation linguistique
4.1. La realisation grammaticale
4.1.1. Le titre
4.1.2. La sequence d'actions
4.1.3. La c-condition
4.1.4. L'elaboration
4.1.5. Le but
4.1.6. Le resultat
4.1.7. La maniere
101
103
105
106
106
111
114
115
117
118
ix
4.1.8. La concurrence
4.1.9. Resume
4.2. La realisation lexico-morphologique
125
5. La realisation motrice
126
6. Resume
126
CHAPITRE 7. E valuation
127
valuation des heuristiques
1. E
127
1.1. L'evaluation en generation de texte
1.2. Comparaison aux methodes precedentes
1.2.1. Le systeme de Mellish
1.2.2. EPICURE de Dale
1.3. Comparaison avec des textes naturels hors du corpus d'analyse
valuation du projet
2. E
2.1. Points forts
2.1.1. La distinction entre le contenu et la structure rhetorique
2.1.2. Un systeme motive linguistiquement
2.1.3. Un systeme complet
2.2. Points faibles
2.2.1. Les structures semantiques et rhetoriques de SPIN
2.2.2. La longueur des textes
127
129
133
137
137
140
3. Resume
141
CHAPITRE 8. Conclusion
143
1. Avenues de recherche
143
1.1. Extensions a l'implantation
1.2. Extensions au modele theorique
1.2.1. Les repetitions et les alternatives
1.2.2. Une representation conceptuelle de la t^ache plus elaboree
1.2.3. La selection de contenu comme question non binaire
1.2.4. L'inuence du domaine de discours
1.3. Extensions generales
1.3.1. L'application des heuristiques a d'autres langues
1.3.2. L'application des heuristiques a d'autres genres textuels
144
144
145
x
1.3.3. Validation par des methodes psychologiques
2. Discussion et Motivation
147
APPENDICE A. Corpus
149
1. Bibliographie
149
1.1. Corpus d'analyse
1.1.1. Textes d'execution
1.1.2. Textes hybrides
1.1.3. Textes de comprehension
1.2. Corpus test
149
150
2. Caracteristiques des types de textes
150
3. Reference des exemples
151
APPENDICE B. Exemple d'analyse de corpus
152
1. Texte source
152
2. Analyse textuelle
153
APPENDICE C. Resultats complets de l'analyse de corpus
154
1. Frequence des elements semantiques
154
2. Frequence des relations rhetoriques
155
3. Correspondances element semantique { relation rhetorique
155
3.1. Resume
3.2. Resultats detailles
155
156
APPENDICE D. Entree de SPIN
160
1. Representation conceptuelle du domaine
160
1.1. Schemas d'operations
1.2. Nature de la t^ache
161
163
2. Modele du lecteur novice
165
2.1. Schemas d'operations
2.2. Nature de la t^ache
166
167
APPENDICE E. Textes generes par SPIN
169
xi
1. Textes du corpus d'analyse
1.1. Programmation d'un enregistrement
1.1.1. Version originale, vcr, p.16]
1.1.2. Versions de SPIN
1.2. Souage de verre
1.2.1. Version originale, verre, p.73]
1.2.2. Versions de SPIN
1.3. Desserrage d'une roue de voiture
1.3.1. Version originale, auto, p.8]
1.3.2. Versions de SPIN
2. Textes du corpus test
2.1. Friture d'oignons
2.1.1. Version originale, recette, p.360]
2.1.2. Versions de SPIN
2.2. Finition d'un patchwork
2.2.1. Version originale, patchwork, p.276]
2.2.2. Versions de SPIN
2.3. Utilisation d'un lecteur de disques audio-numeriques
2.3.1. Version originale, JVC, p.10]
2.3.2. Versions de SPIN
2.4. Soupe aux feves de Dale
2.4.1. Version originale, Dal92]
2.4.2. Versions de SPIN
2.5. Prise electrique de Mellish
2.5.1. Version originale
2.5.2. Versions de SPIN
RE FE RENCES
169
169
171
173
174
174
177
177
178
180
181
xii
LISTE DES FIGURES
1.1 Exemple simplie de la representation conceptuelle d'une t^ache
1.2 Architecture lineaire de la generation de texte
2
5
2.3 Strategies rhetoriques forwards et backwards de Mellish
26
3.4 Exemple d'analyse textuelle par la RST
3.5 Notre approche a la planication de textes d'instructions
34
40
4.6
4.7
4.8
49
72
73
Classication des elements semantiques
E lements semantiques non-inuences par le but communicatif
E lements semantiques inuences par le but communicatif
5.9 Presentation des elements semantiques par rapport au but communicatif
6.10
6.11
6.12
6.13
6.14
6.15
6.16
6.17
6.18
6.19
6.20
6.21
Processus de generation de spin
Modules hierarchiques de spin
Modules non-hierarchiques de spin
Le texte vcr de spin
Exemple de schema d'operation pour le texte vcr
Representation conceptuelle de la t^ache pour le texte vcr
Exemple de schema d'operations du modele du lecteur pour le texte vcr
Liste des elements semantiques du texte vcr
Structure semantique du texte vcr
Liste des relations rhetoriques du texte vcr
Structure rhetorique du texte vcr
Liste des structures grammaticales pour le texte vcr
7.22 Comparaison mot a mot en generation de texte
7.23 Fonctionnement de la prise: versions de Mellish et de spin
82
97
98
99
100
102
104
108
110
113
114
117
125
128
131
xiii
7.24
7.25
7.26
7.27
7.28
7.29
7.30
Representation conceptuelle de t^ache de la soupe aux feves de Dale
Soupe aux f
eves: versions de epicure et de spin
Texte jvc: versions originale et de spin
Representation conceptuelle de la t^ache pour le texte jvc
Notre approche a la planication de textes d'instructions
Structure rhetorique du texte vcr par la RST
Structure rhetorique du texte vcr tel que considere par spin
132
134
135
136
139
140
141
xiv
LISTE DES TABLES
2.1 Types de generation de Goldman
18
4.2
4.3
4.4
4.5
4.6
4.7
4.8
4.9
4.10
4.11
4.12
4.13
E lements semantiques du corpus
Caracteristiques des dierents types de textes du corpus
Heuristiques de selection: l'operation sequentielle
Heuristiques de selection: l'attribut d'objet
Heuristiques de selection: la condition materielle
Types d'eets par rapport au type de texte
Heuristiques de selection: l'eet
Heuristiques de selection: l'inuence
Heuristiques de selection: l'operation co-temporelle
Heuristiques de selection: l'option
Heuristiques de selection: la prevention
Heuristiques de selection: l'operation eventuelle
44
56
58
59
61
63
64
66
67
68
69
70
5.14
5.15
5.16
5.17
5.18
5.19
5.20
5.21
5.22
5.23
5.24
Relations rhetoriques du corpus
Presentation des elements semantiques
Heuristiques de presentation: l'operation sequentielle
Heuristiques de presentation: l'attribut d'objet
Heuristiques de presentation: la condition materielle
Heuristiques de presentation: l'eet
Heuristiques de presentation: l'inuence
Heuristiques de presentation: l'operation co-temporelle
Heuristiques de presentation: l'option
Heuristiques de presentation: la prevention
Heuristiques de presentation: l'operation eventuelle
77
79
84
85
87
89
91
92
93
93
94
xv
6.25
6.26
6.27
6.28
6.29
6.30
6.31
6.32
6.33
6.34
Predicats de la representation de la t^ache
Predicats du modele du lecteur
Positions des satellites par rapport a leur noyau
Formes des titres
Formes des actions
Formes des c-conditions
Formes des buts
Formes des resultats
Formes des manieres
Formes des concurrences
109
110
115
118
120
120
121
122
123
124
xvi
TERMINOLOGIE ET NOTATION
operation:
action:
acte physique aux niveaux conceptuels et semantiques
acte physique aux niveaux rhetoriques et linguistiques
ssi:
RST:
si et seulement si
Rhetorical Structure Theory
O ou Oi :
Op :
Oe :
E:
OB:
operation
operation-parent
operation-enfant
etat
objet
les petites capitales indiquent les systemes informatiques
code
la police courrier est utilisee pour les entrees, les sorties et les segments de
programmes
citation
la police sans serif est utilisee pour les citations
anglais
la police oblique est utilisee pour les termes en langue etrangere
exemple en italique la police italique dans les exemples indiquent les expressions portant un
inter^et particulier
exemple en italique la police italique est aussi utilisee pour les exemples cites dans le texte
* expression
les expressions incorrectes sont precedees du symbole *
systeme
xvii
REMERCIEMENTS
Sans le support intellectuel, moral et nancier de certaines personnes et organismes, cette these
n'aurait jamais vu le jour.
Je tiens d'abord a remercier mon directeur de recherche, Guy Lapalme, qui m'a enseigne
mon premier cours d'intelligence articielle et m'a pris sous sa tutelle depuis ce moment la. Sa
disponibilite, sa generosite, ses conseils et sa conance en moi m'ont ete d'un grand secours
durant ces annees. Son sens de l'humour, ses connaissances et ses accomplissements ont fait de
lui un professeur remarquable et tant apprecie.
Merci a Richard Kittredge qui a bien voulu co-diriger cette these et dont l'expertise et les
conseils judicieux ont grandement ameliore ce travail.
Merci a Paul Bratley et Jacques Malenfant qui ont pris le temps de lire et commenter cette
these et a Cecile Paris qui m'a fait l'honneur d'en ^etre l'examinatrice externe.
Pour leur support nancier, je tiens a remercier le CRSNG et l'Universite de Montreal.
Merci a la \gagne" du laboratoire Incognito pour un environnement de travail tres (trop ?)
amical et pour les vendredis{g^ateaux. Un gros merci a Nicolas Anquetil, le co-administrateur
du laboratoire, pour les nombreuses consultations techniques.
Je prote aussi de l'occasion pour remercier mes parents qui ne m'ont jamais permis
d'arr^eter. Merci a ma mere pour l'utilisation de son bureau.
Enn, merci a Massimo pour sa patience, ses encouragements, ses conseils techniques et
surtout pour m'avoir supporte toutes ces annees.
xviii
A Massimo,
CHAPITRE 1
Introduction
1. But de la these
Lorsqu'un agent communique, il doit d'abord determiner ce qu'il va dire, puis comment il
va le presenter. Bien que de nombreux travaux en generation de texte se soient penches sur la
planication textuelle, peu ont directement traite de ces questions fondamentales. Dans cette
these, nous tentons de repondre explicitement a ces deux questions:
Quelle information doit ^etre communiquee dans le texte et quelle information doit ^etre
laissee implicite ? Par exemple dans la phrase:
(1) Appuyer sur la touche de reglage de canal (channel set) pour regler le canal
de reception.1
Le redacteur a choisi de specier deux operations, bien qu'une seule aurait ete susante
pour executer correctement l'instruction. Par exemple,
(2) Appuyer sur la touche de reglage de canal (channel set).
ou
(3) Regler le canal de reception.
Comment structurer l'information pour obtenir un texte coherent ? En eet, une m^eme
information est parfois presentee selon un certain point de vue, et parfois selon un
autre. C'est le cas dans:
(4) a. Appuyer sur la touche de reglage de canal (channel set) pour regler le canal
de reception.
b. Regler le canal de reception en appuyant sur la touche de reglage de canal
(channel set).
Semantiquement, ces phrases representent le m^eme phenomene: l'operation regler est a
un niveau d'abstraction superieur a l'operation appuyer. Cependant, la premiere phrase
1
Les references exactes de tous les exemples se trouvent a l'appendice A.3.
2
PPPP
;@
;
@@ PPPPPP
;
n1
n2
n1:
n2:
n3:
n4:
n5:
n3
n4
n6
H HH
n8
n9
n10
programmer(obj: enregistrement,
qual: d'1 heure 30)
r
egler(obj: s
electeur de vitesse de
bande, dest: SP)
allum
e(SP)
s
electionner(obj: canal 4)
s
electionn
e(obj: canal 4)
sp
ecifier(obj: heure d'enregistrement)
sp
ecifi
e(obj: heure d'enregistrement)
presser(obj: touche TIMER, qual: dans
un d
elai de 9 secondes)
allum
e(obj: lumi
ere TIMER)
)
)
)
)
n5
n7
n6:
n7:
n8:
n9:
n10:
appuyer(obj: touche de canal)
chang
e(obj: canal)
presser(obj: touche OTR, qual: 3 fois)
+ 1 h 30 min
enfoncer(obj: touche OTR, qual: 1 fois)
+ 30 min
enfoncer(obj: touche OTR, qual: 2 fois)
+ 30 min
enfoncer(obj: touche OTR, qual: 3 fois)
+ 30 min
)
)
)
)
)
Figure 1.1. Exemple simplie de la representation conceptuelle d'une t^ache
presente la relation hierarchique comme un but (pourquoi appuyer ) en considerant la
relation en amont, tandis que la seconde presente l'information comme une maniere
(comment regler ) en considerant la relation en aval.
En oubliant ces questions, un systeme de generation automatique pourrait choisir de communiquer dans le texte toute l'information disponible et presenter l'information toujours de
la m^eme facon. Par exemple, la representation conceptuelle de la gure 1.1 indique comment
utiliser un magnetoscope pour enregistrer un programme d'une heure et demi sur le canal 4
a partir de maintenant (jeudi, 10:05 PM) en mode SP (slow play)2. Pour atteindre le but n1,
les operations n2, n3, n4 et n5 doivent ^etre executees de la m^eme facon, pour executer n3, n6
doit ^etre executee et ainsi de suite. Aussi, la gure indique l'eet, precede du symbole ), de
certaines operations. A partir de cette representation, un systeme non-intelligent produirait le
texte suivant:
2 Nous sommes consciente que cet exemple comporte quelques d
efauts (entre autres, le calcul des heures
d'enregistrement a partir de l'heure actuelle). Nous l'avons cependant presente ici, car, parmi les textes de notre
corpus, il illustre le mieux la diversite rhetorique de textes naturels.
3
Pour enregistrer un programme d'1 heure 30
R
eglez le s
electeur de vitesse de bande sur SP, `SP' s'allumera.
S
electionnez le canal 4, le canal 4 sera s
electionn
e.
Sp
ecifiez l'heure d'enregistrement. L'heure d'enregistrement sera sp
ecifi
e.
Pressez la touche TIMER dans un d
elai de 9 secondes, la lumi
ere TIMER s'allumera.
Pour s
electionner le canal 4, appuyez sur la touche de canal. Le canal changera.
Pour sp
ecifier l'heure d'enregistrement, pressez la touche OTR 3 fois,
`PM 11:35 (1 h 30 min)' sera affich
e.
Pour pressez la touche OTR 3 fois, enfoncez-la une fois, `PM 10:35 (30min)' sera affich
e
enfoncez-la une seconde fois, `PM 11:05 (1 h)' sera affich
e
enfoncez-la une troisi
eme fois, `PM 11:35 (1 h 30 min)' sera affich
e.
Ce texte est evidemment inacceptable. Par contre, le texte suivant3 est bien plus comprehensible et coherent:
Pour programmer un enregistrement d'1 heure 30
(1)
R
eglez le s
electeur de vitesse sur SP, `SP' s'allumera.
S
electionnez le canal 4 en appuyant sur la touche de canal.
Pressez la touche OTR 3 fois pour sp
ecifier l'heure d'enregistrement.
Lorsqu'elle est press
ee une fois, `PM 10:35 (30 min)' sera affich
e.
Lorsqu'elle est press
ee une seconde fois, `PM 11:05 (1 h)' sera affich
e.
Lorsqu'elle est press
ee une troisi
eme fois, `PM 11:35 (1 h 30 min)' sera affich
e.
Presser la touche TIMER dans un d
elai de 9 secondes.
(2)
(3)
(4)
(5)
(6)
(7)
(8)
Dans ce dernier texte, certaines informations presentes dans la representation conceptuelle
ne sont pas explicitees. Par exemple, les eets selectionne(obj: canal 4) et specifie(obj:
heure d'enregistrement) ne sont pas communiqu
es. De plus, le m^eme genre d'information
n'est pas toujours presente de la m^eme facon par exemple, la relation hierarchique entre les
operations selectionner et appuyer de la phrase (3) est presentee par une maniere, tandis
que la m^eme relation entre specifier et presser est presentee par une relation de but dans
la phrase (4).
La planication textuelle est inuencee par un grand nombre de facteurs: la nature et la relation entre interlocuteurs, le contexte de la communication, le domaine de discours, : : :Cependant,
certains types de situations ou contextes communicatifs donnent lieu de facon consistante a des
genres textuels particuliers possedant des caracteristiques rhetoriques et lexico-grammaticales
particulieres. On pensera par exemple a des recettes de cuisine, des textes publicitaires ou des
articles de journaux. Ce phenomene linguistique a ete mis en evidence par les travaux sur les
sous-langages KL82] et sur la theorie des registres (register theory) GC78, ZZ82]. Toutefois,
notre these s'est limitee a un genre particulier: les textes d'instructions. Ces textes consistent
3
Une variante de ce texte a ete generee automatiquement par le systeme spin decrit au chapitre 6.
4
principalement en une sequence ordonnee d'etapes a executer sur un objet unique ou une situation specique pour atteindre un etat desire. Ils peuvent decrire des t^aches simples, incluant
peu de points de choix et generalement executees chaque fois de la m^eme facon, ou des t^aches
plus complexes, possedant plusieurs options KE91]. Ces textes exhibent les caracteristiques
interessantes suivantes:
Ils possedent une uniformite de structure les rendant facilement formalisables RS94,
VLM95].
Ils sont couramment utilises et sont facilement comprehensibles par une grande communaute de lecteurs Tut92b]. On pensera par exemple a des instructions d'assemblage
(recettes de cuisine, assemblage d'un meuble), d'installation, d'utilisation, de reparation
ou d'entretien.
Par rapport a des textes plus narratifs, ils peuvent ^etre representes objectivement a
l'aide de relations entre operations et etats. De plus, bien que cet outil ne soit pas
susant, une grande partie d'une telle representation conceptuelle peut ^etre construite
de facon automatique a l'aide d'un planicateur de t^ache Sac77, AKPT91].
2. La generation de texte
La generation de texte tente de produire de facon automatique des textes bien formes a
partir d'une representation conceptuelle brute. L'emphase est mise sur la production de phrases
en contexte plut^ot que des phrases isolees.
2.1. Applications
La generation de texte a de nombreuses applications. D'abord, dans un grand nombre
de domaines de l'industrie, dierents types de textes tels que des documents techniques et
commerciaux, des rapports ou des memos doivent ^etre produits, traduits et mis a jour Car92].
Les travaux en generation de texte orent la possibilite d'automatiser certaines manipulations
de documents par exemple l'interface pour des bases de donnees McK85], l'enseignement assiste
par ordinateur Zoc90a, Zoc91a, Zoc91b, ZL91], la production de rapports resumant de grandes
quantites de donnees Kay92], la generation multilingue comme alternative a la traduction
automatique R$os93, Sco93] et l'assistance a la redaction technique PVLF+ 95].
En linguistique-informatique, la generation de texte permet de developper des theories
formelles sur la production humaine de la langue et d'etendre, clarier et verier des theories
5
représentation conceptuelle
planification textuelle: quoi dire
détermination du contenu et
de l’organisation textuelle
réalisation linguistique: comment le dire
détermination des structures
grammaticales et choix lexical
réalisation motrice: le dire
opérations phono-acoustiques ou
graphiques
texte en langue naturelle
Figure 1.2. Architecture lineaire de la generation de texte
developpees en linguistique, en psychologie et en sociologie sur la communication humaine
PSM91].
2.2. Architecture
Thompson a formalise le processus de generation de texte en deux etapes sequentielles:
la planication du texte 4 qui determine quoi dire et la realisation linguistique 5, qui determine
comment le dire Tho77]. Plus recemment, Zock a introduit une troisieme etape, la realisation
motrice qui s'occupe de le dire Zoc90b]. Ce processus est illustre a la gure 1.2.
La planication du texte determine le contenu semantique et la structure textuelle. A partir
d'une representation conceptuelle de la situation a decrire, par exemple, un graphe conceptuel
ou des formules logiques, ce processus selectionne l'information a communiquer et l'information
a laisser implicite et decide jusqu'a quel niveau de detail developper un aspect particulier. Durant cette etape, le contenu est organise de facon a former un texte coherent. En utilisant des
criteres de rhetorique, on decide par exemple dans quel ordre l'information doit ^etre communiquee et quels aspects doivent ^etre mis en valeur. La planication de texte construit ainsi une
representation semantique du texte annotee par des relations rhetoriques.
Cette representation est ensuite utilisee par un module de realisation linguistique qui selectionne les structures grammaticales, les procedes referentiels, les lexemes et les transformations
morphologiques pour former un texte linguistiquement correct.
4
5
aussi nommee generation strategique , profonde ou conceptuelle
aussi nommee generation tactique ou de surface
6
Aux deux composantes citees ci-dessus, Zock ajoute une derniere etape a la generation de
texte: la realisation motrice qui prend des decisions sur la mise en action de la communication:
les operations graphiques tel que la mise en page ou en generation de parole, les operations
phono-acoustiques.
L'approche de Thompson a ete acceptee par un grand nombre de chercheurs. Ainsi, le
systeme text McK85] s'occupe de planication textuelle, tandis que mumble McD84] se
concentre sur la realisation linguistique. L'approche prescrit un processus lineaire de production de texte, aussi dit pipeline 6 . Cette architecture ore de nombreux avantages du point de
vue informatique car la t^ache de chaque composante est bien separee, orant ainsi une modularisation naturelle, et la communication entre n modules est restreinte a n ; 1 interfaces
unidirectionnelles. C'est pourquoi la majorite des systemes de generation7 ont adopte cette
approche qui permet de se concentrer sur un aspect particulier de la generation et faire abstraction des autres questions. Cependant, elle suppose que (1) l'information est traitee de facon
unidirectionnelle, les decisions prises en aval n'inuencent pas les decisions prises en amont, (2)
le contenu textuel est determine d'un seul coup et (3) la formulation linguistique ne commence
que lorsque le contenu est entierement specie Zoc93]. Ces hypotheses n'etant pas motivees
psycho-linguistiquement8, l'approche sequentielle reste souvent contestee App85]. Parmi les
approches alternatives, on retrouve:
l'architecture integree de Appelt App85] qui considere la planication textuelle et la
realisation linguistique au m^eme niveau
l'architecture entrelacee Hov90a] ou il existe une communication bidirectionnelle entre
les modules strategique et tactique
la generation incrementielle, par exemple KH82, Kem87, DSK91, Rei92], qui initie la
realisation linguistique d'une partie du discours immediatement apres sa planication,
et non apres que toute la representation semantique ait ete construite. Dans ce modele, dierentes etapes de la production de texte sont eectuees en parallele, de facon
pipeline , en utilisant ce terme dans sa denition informatique traditionnelle.
Pour les raisons enumerees plus haut, dans cette these, comme dans la majorite des systemes de generation, nous avons opte pour une architecture sequentielle.
Le terme pipeline signie ici un cheminement lineaire et non que la realisation linguistique d'un element
de discours n s'eectue en m^eme temps que la planication textuelle de l'element n + 1.
7 Zoc92] pr
esente une synthese des systemes de generation de texte developpes jusqu'en 1992.
8 Pourtant Rei94] pense que l'approche s
equentielle serait plus proche du systeme de la productionhumaine
de la langue que d'autres architectures moins modulaires.
6
7
3. Contributions
Notre recherche apporte plusieurs contributions:
Du point de vue linguistique-informatique, cette recherche apporte une approche motivee linguistiquement aux modeles existants de planication de textes d'instructions.
Aussi, l'etude de corpus eectuee ore une meilleure comprehension des textes d'instructions. Il s'agit d'une analyse moins approfondie, mais dans la m^eme ligne que les
travaux de Balkanski Bal92a, Bal92b] et de Di Eugenio DE93b].
Du point de vue pratique, cette recherche permet d'initier une automatisation de la
redaction de textes d'instructions ou du moins d'assister les redacteurs techniques dans
leur travail, tout en assurant que les textes soient comprehensibles et coherents (comme
le travail de Vander Linden VL93b]).
4. Structure de la these
Cette these developpe des heuristiques guidant la selection du contenu et du statut rhetorique d'elements de discours. Pour presenter nos resultats, nous procedons ainsi:
Au chapitre 2, nous nous familiarisons avec les travaux les plus pertinents en psychologie, en redaction technique et en linguistique-informatique traitant de textes d'instructions.
Au chapitre 3, la question de planication de textes d'instructions est abordee de facon generale. Ce chapitre presente la theorie de structure rhetorique (RST, MT88]),
explique comment la RST est utilisee en linguistique-informatique et presente notre
approche a la planication de textes d'instructions.
Les chapitres 4 et 5 detaillent l'analyse de corpus9 . Au chapitre 4, nous identions
quels elements semantiques se retrouvent dans les textes d'instructions et quels criteres
semblent contraindre leur introduction dans le texte. Finalement, les heuristiques de
selection sont explicitees. Au chapitre 5, un travail semblable est eectue pour les
heuristiques de presentation.
Le chapitre 6, decrit l'implantation du systeme spin. spin10 est un systeme de generation de textes d'instructions developpe exclusivement pour demontrer la validite des
heuristiques d'introduction et de presentation.
Le chapitre 7 evalue les heuristiques et la recherche. La validite des heuristiques est
evaluee en comparant les resultats de spin aux resultats d'autres systemes de generation
KL94] ore un apercu des ces chapitres.
Systeme de Planication d'INstructions
9
10
8
de texte et a des textes naturels hors du corpus d'analyse. La recherche est ensuite
evaluee globalement en demontrant ses points forts et ses points faibles.
Finalement, le chapitre 8 resume les idees ma^%tresses de la these et presente des avenues
de recherche future.
CHAPITRE 2
Travaux anterieurs et domaines connexes
Plusieurs domaines de recherche ont aborde l'etude des textes d'instructions, en particulier,
la redaction technique, la psychologie et la linguistique-informatique. Nous verrons dans ce
chapitre quelques uns de ces travaux en nous attardant plus particulierement a la linguistiqueinformatique.
1. Redaction technique
A l'inverse de la redaction creative, la redaction technique presente des faits, donne des
instructions et interprete de l'information. La redaction technique fait reference a la conception,
la mise a jour et l'utilisation de documentation d'appareils ou systemes RML95] dans le but
d'informer ou d'instruire le lecteur Bin86, TD90].
Voyons un peu les travaux generaux en redaction technique, puis en documentation informatique, application de plus en plus repandue.
1.1. Travaux generaux
D'apres Pus89] la documentation technique est generalement consideree mauvaise et difcile a utiliser par les lecteurs, principalement parce que les redacteurs connaissent peu l'organisation textuelle que les lecteurs preferent. En eet, la majorite des travaux generaux en
redaction technique denissent des principes sur la realisation linguistique (par exemple, eviter
l'utilisation de mots longs ou a la mode, de trop de mots, de pas assez de mots, de verbes
ous, de la forme passive, de la troisieme personne Wei91]) et les choix typographiques. Les
travaux de ce domaine ne sont pas directement utilisables dans notre projet car les conseils
donnes ne guident pas le redacteur sur le contenu textuel et sont souvent contradictoires, ous
ou subjectifs.
Toutefois, certains chercheurs proposent des principes de redaction guidant non seulement
la realisation linguistique, mais aussi l'organisation textuelle. En particulier, Bingham Bin86]
10
ore des conseils sur la redaction d'explications de procedes . Bingham denit trois classes de
procedes en fonction de l'agent qui l'execute:
(a) les procedes eectues par des agents humains: par exemple, une recette de
cuisine
(b) les procedes executes par un mecanisme: par exemple, le fonctionnement d'une
voiture
(c) les procedes naturels sur lesquels personne n'a de contr^ole: par exemple,
une eruption volcanique.
La classe (a), qui nous interesse plus particulierement, est divisee en explications de procedures , ou le lecteur tente seulement de comprendre le procede, et en instructions , ou le lecteur
agit selon les directives du texte. Les explications de procedure sont generalement formees
de plusieurs paragraphes, tandis que les instructions utilisent des etapes numerotees. Dans la
plupart des travaux en linguistique-informatique (cf. la section 3 de ce chapitre), seules les instructions sont considerees. Dans notre projet, les deux types de textes de la classe (a) ont ete
consideres. Nous y faisons reference par le terme texte d'instructions .
1.2. Travaux en documentation informatique
Une application tres repandue en redaction technique est celle de la redaction de documentation informatique. Ce type de documentation inclue les textes d'instructions, mais aussi
les tutoriels, les cartes d'aide-memoire et l'aide interactive. Ici aussi, la majorite des conseils
donnes se situent aux niveaux linguistique et typographique et quelques uns au niveau structurel. Par exemple, pour les textes d'instructions, Price et Korman PK93] donnent des conseils
au niveau de la structure textuelle (ex. sectionner la procedure en groupes de 7 2 etapes), au
niveau de la realisation linguistique (ex. eviter la forme passive) et au niveau de la typographie
(ex. numeroter les etapes de la procedure). Ces conseils ont ete retenus lors des realisations
linguistique et motrice de spin, mais ces travaux discutent tres peu de la selection du contenu
et de la structure discursive.
2. Psychologie
En psychologie, un texte d'instructions n'est pas restreint aux textes de procedures, mais
designe plut^ot tout texte d'enseignement. Un tel texte est donc redige par un expert et demande
au lecteur une comprehension et une memorisation du contenu. Ces textes peuvent prendre la
forme de livres de cours, de manuels, de journaux, de revues ou de brochures GAB86].
11
Nous n'avons considere que les travaux sur des textes decrivant une procedure. Ces travaux
peuvent ^etre classies en deux groupes: les travaux en revision de texte et les travaux portant sur
la representation conceptuelle de procedures et sur le contenu structurel de textes d'instructions.
2.1. Revision textuelle
De nombreux travaux en psychologie tentent de developper ou d'evaluer des methodes
de revision visant a augmenter la comprehension ou la memorisation des lecteurs. Dans cette
voie, plusieurs aspects ont ete abordes Saw91]. Les plus pertinents pour notre travail sont les
mesures de lisibilite et le developpement de strategies expertes de revision.
Les mesures de lisibilite sont des formules, initialement developpes par Thorndike
Tho21], mesurant le degre de diculte de lecture d'un texte. Ces mesures tiennent compte
de phenomenes comme la frequence de mots, la forme active ou passive et la complexite syntaxique. Ces formules, reprises et beaucoup developpees depuis1 , orent une facon simple et
pratique d'evaluer la diculte de lecture d'un texte, mais leur validite a ete serieusement remise en question car elles ne prennent en consideration que des caracteristiques de surface et
ignorent un bon nombre de facteurs critiques Saw91]. Ces formules peuvent identier des textes
diciles a lire, mais n'assurent pas que les textes ayant un index de lisibilite satisfaisant sont
faciles a lire.
Nous n'avons pas explore cet axe de recherche, car notre these s'interroge sur le contenu
du texte, plut^ot que sa forme de surface.
Les strategies expertes de revision visent a ameliorer des textes d'enseignement en
formalisant l'expertise des redacteurs professionnels et son eet sur la comprehension du texte.
Cependant, selon Bri86]:
Les experts dierent d'opinion sur ce qui constitue une \bonne facon" de rediger: par
exemple, certains experts preferent repeter l'information essentielle alors que d'autres
preferent eviter les redondances certains n'expliquent pas les phenomenes en detail
mais d'autres evitent d'^etre trop brefs de peur de n'^etre pas assez clairs, : : :
Les experts semblent se er a des trucs relevant presque de la superstition pour rediger
des textes de bonne qualite.
Les travaux en strategies expertes de revision ne semblant pas orir des conseils judicieux
pour la redaction automatique d'instructions, cette methode d'acquisition de connaissance n'a
donc pas ete suivie dans notre projet.
1
voir Kla63] pour une revue des travaux
12
2.2. Representation conceptuelle et contenu structurel
Certains chercheurs en psychologie se sont penches sur la representation mentale d'instructions construite par le lecteur ou utilisee par le redacteur.
2.2.1. Le travail de Dixon
Un travail tres important en psychologie est celui de Dixon sur les textes d'instructions ou
directives procedurales .
Dans Dix87a, DFG88] , Dixon propose qu'un lecteur interprete des instructions en construisant une representation mentale, ou un plan, pour eectuer la t^ache decrite. Ces plans sont
organises en une hierarchie ou chaque n&ud correspond a une operation representee par un
schema. Le sommet de la hierarchie indique la description generale de ce qu'il faut accomplir
le niveau inferieur specie les etapes composantes majeures le niveau inferieur decompose ces
etapes en operations plus speciques et ainsi de suite. Un schema d'operation est une description prototypique de l'operation contenant des variables qui permettent d'adapter le schema a
dierentes situations. La construction d'un plan consiste a:
(i) trouver de l'information dans le texte concernant les composantes principales de la
t^ache,
(ii) utiliser cette information, en parallele avec d'autres processus de lecture, pour activer
des schemas dans la memoire du lecteur,
(iii) adapter ces schemas a la t^ache courante en instanciant les variables.
Ce processus est repete a chaque niveau de la hierarchie.
E tant donne ce processus mental de lecture, Dixon remarque que pour un lecteur inexperimente dans la procedure decrite, l'interpretation d'instructions depend du niveau de parallelisme
entre le texte et la structure de la representation mentale a developper. Dixon a observe experimentalement que les instructions sont plus faciles a interpreter2 quand l'information de plus
haut niveau d'abstraction precede l'information de plus bas niveau. Par exemple, dans:
(5) a. Pour monter l'indicateur gamma au dessus de 20, tenez le bouton gauche enfonce.
b. Tenez le bouton gauche enfonce pour monter l'indicateur gamma au dessus de 20.
La phrase (5a) est plus facile a interpreter que (5b), car l'information de plus haut niveau
d'abstraction, en italique, y est placee avant. Dixon remarque aussi que les actions de plus haut
niveau sont generalement exprimees explicitement comme dans (6a), tandis que les actions plus
precises sont exprimees implicitement comme dans (6b).
(6) a. Demarrer le moteur.
2
notion mesuree par le temps de lecture
13
b. Le moteur doit tourner.
Cette strategie serait utilisee par les redacteurs pour indiquer aux lecteurs le niveau des
actions dans la hierarchie.
Aussi, dans Dix87b], le chercheur fait la distinction entre deux types d'information:
(i) les etapes composantes (component steps) qui enumerent les actions requises pour
eectuer la t^ache
(ii) l'information organisationnelle (organizational information) qui indique comment
les etapes composantes sont reliees ensemble.
Par exemple, dans:
(7) Vous pouvez faire un wagon en dessinant un long rectangle avec deux cercles en dessous.
L'information en italique est organisationnelle, tandis que l'autre indique une etape composante.
Dixon a remarque que les instructions sont plus facilement interpretees lorsqu'elles commencent par de l'information organisationnelle plut^ot que par des etapes composantes. Ceci
conrme l'hypothese que le r^ole de l'information organisationnelle est d'aider la construction
du plan mental pour y inserer les etapes composantes. Dans le cas ou les etapes composantes
sont placees avant l'information organisationnelle, Dixon propose deux strategies de lecture:
la strategie de supposition (guessing strategy ): Le lecteur essaie de deviner comment les etapes composantes sont organisees avant de lire l'information organisationnelle. Ces suppositions, sont corrigees lorsque l'information organisationnelle est lue
et qu'elle diere des suppositions.
la strategie de tampon (buering strategy ) : Les etapes composantes sont conservees dans un tampon de facon relativement non interpretees en attendant l'information
organisationnelle.
Dans la strategie de supposition, le lecteur a besoin de temps supplementaire lors de la
lecture des etapes composantes car c'est a ce moment que le processus de supposition est effectue. Dans la strategie de tampon, un temps supplementaire est necessaire lors de la lecture
de l'information compositionnelle, car c'est a ce moment que les etapes composantes sont organisees. En partant de ces remarques, Dixon a eectue trois experiences ou il demandait a des
sujets de dessiner des objets en utilisant des instructions comme:
(8) Ceci sera un dessin d'un verre a vin. Dessinez un triangle sur un T a l'envers.
14
Apres avoir compare le temps de lecture pour chaque type d'information,Dixon conclue que
les lecteurs utilisent la strategie de supposition et non la strategie de tampon pour interpreter
une instruction ou l'etape composante est situee avant l'information organisationnelle.
Les travaux de Dixon conrment l'hypothese d'une representation conceptuelle constituee
de schemas d'operations, et nous aide a mieux comprendre, de facon generale, les textes d'instructions. Du point de vue de la realisation linguistique, le travail de Dixon est important car il
nous indique comment exprimer et positionner les dierents types d'information de facon plus
facile a interpreter.
2.2.2. Les travaux de Smith et Goodman et de Konoske et Ellis
Smith et Goodman ont etudie comment le contenu des textes d'instructions en inuence
la comprehension SG82]. Ils ont developpe la taxonomie qualitative suivante pour classier ces
textes:
l'explication lineaire: decrit quoi faire avec le systeme ou dans la situation. Ce type
de texte d'instructions contient un but de haut niveau suivi d'une sequence d'actions
a executer. Les buts peuvent eventuellement ^etre divises en sous-procedures. Ce type
de texte semble correspondre aux instructions de Bingham Bin86] et aux etapes
composantes de Dixon Dix87a].
l'explication structurelle: decrit comment et pourquoi le systeme est construit et
comment ses composantes sont inter-connectees. Ces textes presentent un phenomene
statique et semblent inclure l'information organisationnelle de Dixon Dix87a].
l'explication fonctionnelle: decrit comment et pourquoi le systeme fonctionne et
quelles sont les relations de cause et d'eet de la t^ache. Ces textes presentent un
phenomene dynamique.
Smith et Goodman ont verie l'hypothese qu'un texte d'instructions est mieux interprete,
et donc execute, si le texte inclut de l'information de plus haut niveau et est organise hierarchiquement. Ils ont teste leur hypothese avec un texte d'assemblage de circuit electrique de chacun
des genres ci-haut. Les resultats de leur experience indiquent que:
Les sujets interpretent plus facilement les explications structurelles et fonctionnelles
que les explications lineaires. Il semble donc que l'information hierarchique facilite le
developpement de representations mentales et l'integration de l'information dans ces
representations, ce qui corrobore les resultats de Dixon Dix87a, DFG88].
15
Les sujets ayant de l'information structurelle et fonctionnelle font moins d'erreurs d'execution. En eet, l'information hierarchique indique comment executer les etapes, ce qui
evite des instructions vagues et reduit les risques d'erreurs Dixon Dix87b] aussi, remarque que l'information organisationnelle reduit les risques d'erreurs.
Les sujets ayant de l'information fonctionnelle executent l'assemblage mieux que ceux
qui se basent sur une explication lineaire ou structurelle.
La recherche de Smith et Goodman n'a pas directement inuence notre projet, mais elle
nous permet de mieux comprendre les dierents types d'instructions et l'eet du choix du
contenu sur l'interpretation et l'execution de la t^ache.
Dans KE91], Konoske et Ellis ont ensuite repris des travaux de Smith et Goodman et ont
teste l'eet des dierents types d'explications sur l'apprentissage, l'execution et la memorisation
de la t^ache. Les resultats de leurs experiences indiquent que l'avantage des dierents types
d'explications depend de l'expertise de l'agent et de sa connaissance du systeme. En eet, avec
des etudiants de premier cycle, une premiere experience indiquait que l'informationfonctionnelle
facilite l'apprentissage, la memorisation et l'execution de la procedure. Cependant, une seconde
experience eectuee sur du personnel de la marine, plus experimente, n'arrivait pas a la m^eme
conclusion. L'explication retenue est que, d^u a leur niveau de connaissances dierent, ces deux
groupes de sujets utilisent des strategies d'interpretation dierentes. Les etudiants tentaient
de se souvenir de l'information, tandis que le personnel de la marine tentait de reconstruire la
procedure en determinant les contraintes a satisfaire pour atteindre le but.
Du travail de Konoske et Ellis, il faut retenir qu'un redacteur d'instructions doit tenir
compte de la structure des connaissances du lecteur et de la structure de la t^ache pour determiner la structure du contenu textuel.
2.2.3. Le travail de Donin, Bracewell, Frederiksen et Dillinger
Donin et ses collaborateurs ont tente de determiner comment la representation conceptuelle
d'une procedure est utilisee lors de la redaction d'instructions pour structurer le texte. Ils
supposent, tout comme de nombreux chercheurs en psychologie Dix87a, BVDGH90], que les
procedures sont organisees conceptuellement de facon hierarchique et non lineaire:
: : : ] m^eme si l'on peut organiser la sequence d'actions requises de facon
temporelle, conceptuellement les procedures sont organisees hierarchiquement.
DBFD92] p. 215
16
Leurs experiences montrent que le contenu d'un texte d'instructions est inadequat pour
permettre a une autre personne d'executer la procedure, c'est-a-dire d'en construire une representation conceptuelle, lorsque le contenu ne porte que sur de l'information de haut niveau
et que l'organisation textuelle n'est pas reliee a la structure hierarchique de la procedure. Les
chercheurs concluent alors qu'une \bonne redaction" de textes d'instructions exige de:
(i) produire et utiliser la representation hierarchique de la procedure,
(ii) utiliser des strategies ecaces pour selectionner et organiser ces connaissances pour un
lecteur particulier,
(iii) les exprimer en des structures textuelles adequates.
Ces trois etapes resument bien le but de notre these: automatiser ces trois types de strategies pour rediger des textes d'instructions de qualite.
3. Linguistique-informatique
En linguistique-informatique, le terme texte d'instructions est generalement limite a des
manuels d'appareils ou le lecteur est l'agent de la procedure. Nous decrivons ici quelques travaux
portant sur l'interpretation et la generation de texte, l'analyse de texte etant moins pertinente
a notre these.
3.1. Interpretation d'instructions
Nous passerons en revue deux travaux importants en interpretation d'instructions, celui
de Balkanski et celui de Di Eugenio. Ces deux travaux se basent sur le travail de Goldman sur
la theorie des actions.
3.1.1. L'etude de Goldman
Goldman a etudie les actions sous un aspect philosophique. Dans Gol70], il denit deux
concepts importants: la relation de generation entre deux actions, et la notion d'action de base .
La relation de generation est tres importante dans l'etude des textes d'instructions, car elle
y est tres frequente. La notion d'action de base est utilisee dans cette these pour expliquer
l'introduction de certaines operations de la procedure dans le texte (cf. chapitre 4, section 3.1).
Pour denir la relation de generation, Goldman commence par refuser ce qu'il nomme
la theorie d'identite , qui veut que certaines actions comme lever l'interrupteur et allumer la
lumiere ne fassent reference qu'a une seule et m^eme action, mais sous dierents points de vue.
D'apres Goldman, la premiere action a la propriete de causer la seconde, tandis que la seconde
17
ne cause pas la premiere. Les 2 actions n'ayant pas les m^emes proprietes, elles ne peuvent donc
pas ^etre identiques. Goldman denit ensuite un type d'action (act-type) et une instance d'action
(act-token). Un type d'action est simplement une propriete comme tondre le gazon ou donner
une conference tandis qu'une instance d'action est une exemplarisation d'un type d'action ou
l'agent et le moment d'execution sont instancies (par exemple, Julie a tondu le gazon hier ).
Executer une action consiste donc a exemplariser un type d'action.
Pour denir la relation de generation entre deux instances d'action3, Goldman denit des
type d'actions et des instances d'action de base . Une propriete A est un type d'action de base
pour l'agent G au temps T si et seulement si, dans des conditions normales,
G peut exemplariser A a T , gr^ace a sa volonte et
le fait exprime au point precedent ne depend pas des connaissances de G sur la generation ni sur les relations de cause a eet, a l'exception de sa connaissance que
l'exemplarisation de A est causee par sa volonte.
Plus simplement, cette denition accepte comme niveau de base, les types d'action les plus
detailles que l'agent peut executer de facon volontaire c'est-a-dire que l'agent peut exemplariser
s'il le desire, mais cette exemplarisation ne depend pas des connaissances de l'agent. Par exemple
le type d'action eternuer (A) n'est pas de base car normalement aucun agent (G) ne peut
eternuer de facon volontaire la premiere contrainte n'est donc pas satisfaite. Aussi, voir double
n'est pas non plus un type d'action de base car, dans des conditions normales, l'agent doit
utiliser ses connaissances de cause a eet pour savoir, par exemple, que s'il appuie sur ses
yeux , il verra double la seconde contrainte n'est donc pas satisfaite. Les types d'action de base
incluent des actions physiques de tres bas niveau comme bouger son bras , bouger son doigt
ou plier son genou car m^eme s'il existe certains mecanismes biologiques qui entra^%ne le lever
d'un bras, dans des conditions normales (l'agent n'est pas paralyse ou handicape) tout agent
peut volontairement exemplariser ce type d'action (premiere contrainte), sans en conna^%tre les
mecanismes biologiques sous-jacents (seconde contrainte).
Toute instance d'action est soit une instance d'action de base soit une instance d'action
reliee a une instance d'action de base. La relation la plus importante entre deux instances
d'action est la generation . Par exemple, Jean bouge son bras est une instance d'action de base
qui genere l'instance d'action Jean leve l'interrupteur qui a son tour genere l'instance d'action
Jean allume la lumiere qui a son tour genere Jean reveille Marie . Intuitivement, la generation
de Goldman est souvent reliee a la locution en . Par exemple, Jean reveille Marie en allumant
3
DHP+ 94] soulignent cependant que la generation peut ^etre generalisee aux types d'actions.
18
generation
Exemple
causale
Julie bouge son bras.
par convention
Julie sort son bras de la fen^etre de la
voiture.
simple
Julie court le 100 metres en 11 secondes.
par augmentation Julie sort son bras.
Julie ferme la porte.
Julie signale un virage.
Julie gagne la course.
Julie sort son bras de la fen^etre de la
voiture.
Table 2.1. Types de generation de Goldman
la lumiere , il allume la lumiere en levant l'interrupteur , il leve l'interrupteur en bougeant son
bras . Plus formellement:
une action genere une action ssi:
{ et sont executees par le m^eme agent,
{ et sont executees en m^eme temps, mais ne sont pas co-temporelles (voir plus
loin),
{ il existe un ensemble de conditions contextuelles C (par exemple, l'ampoule est
vissee), tel que:
la conjonction de et C implique l'occurrence de , et
si C n'etait pas vrai, alors l'execution de n'aurait pas cause .
De plus, ne doit pas faire partie d'une sequence d'instances d'actions S qui genere .
Par contre, il peut y avoir generation entre toute la sequence S et , et si l'agent n'avait pas
execute , alors il n'aurait pas execute .
Deux instances d'actions sont co-temporelles si elles sont independantes et executees en
m^eme temps. Pour identier la co-temporalite, Goldman propose d'essayer de relier les 2 instances par la locution et en m^eme temps . Par exemple, dans Jean allume la lumiere en parlant
a Marie les 2 instances sont co-temporelles, mais dans Jean allume la lumiere en levant l'interrupteur , les 2 instances ne sont pas co-temporelles.
Goldman distingue 4 types de generation, illustres a la table 2.1: (1) la generation causale
(2) la generation par convention (3) la generation simple et (4) la generation par augmentation .
Comme proprietes interessantes, notons que la relation de generation est:
asymetrique: si genere , alors ne peut generer non reexive: ne genere pas transitive: si genere et genere , alors genere .
19
L'etude de Goldman est a la base de celles de Balkanski et de Di Eugenio presentees plus
loin. Nous retenons de son etude la notion de generation et la notion d'action de base (utilisee
au chapitre 4).
3.1.2. L'etude de Balkanski
Balkanski a etudie ce qu'elle appelle les propositions de raison (rationale clause ou RC)
et de moyen (means clause ou MC) frequentes dans les textes d'instructions Bal92a, Bal92b].
Elle a developpe un modele d'interpretation pour ces propositions en denissant des regles qui
permettent de deduire un ensemble de croyances et d'intentions associees a chaque construction.
Par exemple, les phrases suivantes ont des interpretations tres dierentes.
(9) a. Jean a sali le tapis en traversant la piece.
b. Jean a traverse la piece pour salir le tapis.
Dans (9a), le redacteur implique que le tapis est maintenant sale, mais n'implique pas que
Jean a fait expres de le salir. Dans (9b), on interprete que Jean avait l'intention de salir le tapis,
mais on ne sait pas si cet etat a ete atteint. La phrase (9a) est en fait une proposition de moyen
car elle indique comment une action est eectuee, et (9b) est une proposition de raison, car elle
indique le but de l'action.
Les RC et les MC entre deux actions expriment generalement la relation de generation
de Goldman4, mais le redacteur et le lecteur en deduisent dierentes croyances et intentions.
En eet, soient R, le redacteur G, l'agent , l'action generante (ex. traverser la piece ) et ,
l'action generee (ex. salir le tapis ), on a:
croyance
MC
RC
R croit que s'est produit
oui
oui
R croit que s'est produit
oui
pas necessairement
R croit qu'il existe une relation de generation entre et oui
pas necessairement
R croit que G souhaitait la realisation de pas necessairement
oui
R croit que G souhaitait la realisation de comme une facon de pas necessairement
oui
generer Par exemple, dans les deux phrases (9a) et (9b) le redacteur croit que Jean a traverse la
piece. Par contre dans (9a) il croit que Jean a reussi a salir de tapis, mais dans (9b), il n'est
pas clair si le tapis a ete sali ou non.
4
Balkanski note que ce n'est pas toujours dans le cas des phrases RC.
20
Generalement, une RC est introduite par la preposition pour et une MC par en . Balkanski utilise la relation de generation de Goldman (quelque peu modiee) et les relations de
permission5 (enablement) et contribution pour expliquer les MC et les RC.
une action permet une action ssi:
{ le temps d'execution de precede le temps d'execution de ,
{ il existe un ensemble de conditions contextuelles C, et une troisieme action ,
tels que:
une des conditions de C, devient vraie apres l'execution de , et
le type d'action de genere conditionnellement le type d'action de sous
C.
Par exemple, si = remplacer l'ampoule defectueuse , = lever l'interrupteur et =
allumer la lumiere alors permet .
une action contribue a une action ssi:
{ est un element de la fermeture transitive des relations de generation et de
permission de et des constructeurs d'actions complexes, par exemple la sequence Pol86].
Nous utiliserons les notions de RC et de MC et les relations de generation, permission et
contribution lors de l'analyse de corpus aux chapitres 4 et 5.
3.1.3. L'etude de Di Eugenio
Di Eugenio a etudie a fond l'interpretation des propositions de but (purpose clauses) et
s'est aussi attardee sur les imperatifs negatifs dans les textes d'instructions DEW92, DE92,
DE93a, DE93b] .
Di Eugenio a classie les imperatifs negatifs en 2 categories:
DONT : les negations propres caracterisees par l'auxiliaire ne pas (don't, en anglais)
ou des elements a polarite negative comme jamais . Par exemple:
(10) Ne jamais melanger des nettoyants contenant de l'acide ou de l'ammoniaque avec
un javellisant au chlore.
Les imperatifs negatifs DONT indiquent un mauvais choix que l'agent risque d'eectuer
dans une situation particuliere. Dans ce cas, un avertissement direct est donne.
neg-TC : les negations de la forme prenez garde (take care). Par exemple,
5 Pol90] aussi discute de la di
erence d'intention et de croyance entre les relations de permission et de
generation.
21
(11) Pour nettoyer, charger les v^etements dans le bassin en s'assurant de ne pas trop
le remplir.
Les negations neg-TC identient un point de choix que l'agent ne va probablement pas
remarquer. Souvent, le point de choix est identie par le resultat qu'une mauvaise decision entra^%ne. Les neg-TC restreignent le degre de liberte de l'agent lors de l'execution
de l'instruction.
La notion de DONTs et de neg-TC est assez importante dans notre etude. En eet, comme
nous le verrons au chapitre 5, elle permet de determiner quelle relation rhetorique est plus
appropriee pour presenter une action negative.
En ce qui concerne les propositions de but (PC), Di Eugenio les classie en 3 categories:
les evenements de creation : Les PC de creation indiquent un but qui entra^%ne la reali-
sation d'un evenement. Par exemple, la creation d'un objet comme dans:
(12) Joignez les bouts de la bande du chapeau pour former un cercle.
La majorite des PC du corpus de Di Eugenio font partie de cette classe.
les evenements de prevention : Les PC indiquant un evenement de prevention, informent
le lecteur que le monde ne devrait pas changer, c'est-a-dire que le lecteur devrait eviter
qu'un evenement se produise. Ces PC sont relies aux imperatifs negatifs. Par exemple,
(13) Coller les cotes rudes du tissu pour eviter que des ls s'elochent pendant que
vous travaillez .
la modication des connaissances du lecteur : Ces PCs indiquent un changement qui
aectera les connaissances du lecteur, plut^ot que le monde. Comme dans:
(14) Pour determiner la quantite de bordure , mesurez la largeur (en pieds) de tous les
murs a couvrir et divisez par 3.
Les PCs de Di Eugenio s'expliquent generalement par les relations de generation et de
permission. Dans une PC, (l'action generante) contribue toujours6 a (l'action generee).
Dans le cas ou et soient simplement reliees par la relation est un alors on aurait aaire a
une abstraction .
On peut donc classier les relations d'abstraction, contribution, generation et permission
de la facon suivante:
Si l'execution de contribue a l'execution de :
{ genere si seulement doit ^etre executee.
6
Elle signale cependant quelques exceptions dans le cas d'actions mentales.
22
{ permet si apres le debut de l'execution de 7 , les conditions C sont vraies
et
peut maintenant ^etre executee sous C ou
une autre action peut maintenant ^etre executee sous C et genere .
Il existe une relation d'abstraction entre et , si ne contribue pas a l'execution
de .
Ces quatre relations ont ete tres utiles pour interpreter les instructions du corpus.
3.2. Generation d'instructions
Les travaux en generation d'instructions ne considerent generalement que les textes ou
le lecteur agit selon les directives du texte le lecteur du texte est donc aussi l'agent de la
procedure. Nous passons en revue sept systemes de generation s'interessant aux instructions:
deux systemes multimedia et cinq systemes se concentrant sur le texte.
3.2.1. Systemes multimedia
comet de McKeown et al.
comet8 MEF+ 90] est un systeme multimedia, integrant textes et graphiques, qui genere
des explications pour l'entretien et la reparation d'equipement militaire. Dans comet, la de-
termination du contenu de la presentation est basee sur les schemas rhetoriques de McKeown
McK85]. Ces schemas pre-compiles indiquent quelle information se retrouve typiquement dans
un texte pour atteindre un but communicatif particulier. Si un schema echoue, le systeme peut
en utiliser un autre, mais ne peut modier ou etendre le premier. Une fois determine, le contenu
de la presentation est passe au coordinateur de media qui selectionne ce qui sera presente par
un graphique et/ou par du texte et redirige cette information au generateur de graphiques ou
de texte.
7 Di Eugenio modie la premi
ere condition de permission de Balkanski, car celle-ci suppose que l'execution
de doit nir avant le debut de l'execution de une contrainte trop restreignante.
8 CoOrdinated Multimedia Explanation Testbed
23
L'approche par schemas rhetoriques ne fait pas de distinction entre le contenu semantique
et la presentation rhetorique du texte, car ces schemas determinent le contenu et l'organisation
en m^eme temps.
wip de
Wahlster et al.
Tout comme comet, wip WAF+ 93, AR95] est un systeme de presentation multimedia
(textes et graphiques) qui produit des instructions a partir d'une representation unique. wip est
un projet de taille dont le prototype a pris 30 annees-personnes a construire. Ses resultats sont
assez impressionnants. Le systeme est sensible aux facteurs contextuels comme l'expertise du
lecteur, la langue cible (anglais ou allemand), le format physique (papier ou ecran) et le mode
de production (incrementiel ou non). Les caracteristiques les plus importantes de wip incluent:
(i) La division de la t^ache entre les dierents medias est determinee dynamiquement a
partir d'information contextuelle comme le lecteur et la situation a decrire.
(ii) Tous les processus de generation (determination du contenu, selection du media et realisation du contenu) peuvent ^etre incrementiels, et peuvent donc s'adapter aux changements de l'environnement de presentation.
Pour determiner le contenu de la presentation dans le texte et dans le graphique, wip
utilise la RST MT88] de facon constructive. Le systeme utilise un ensemble de strategies de
presentation : des connaissances generales ou speciques sur la meilleure facon de presenter un
sujet particulier. Ces strategies sont representees par des relations et des plans RST contenant
plusieurs champs comme le nom de la relation, ses eets, ses conditions et un champ additionnel
pour le mode de presentation. Le planicateur prend en entree un but de presentation de haut
niveau et recherche une strategie dont l'eet ou le nom s'unie avec le but. Recursivement,
ce processus est applique et genere un graphe dirige acyclique ou les feuilles representent des
actes de presentation (textuels ou graphiques). Ces actes, sont ensuite passes aux concepteurs
graphique et textuel qui se chargent de produire un dessin ou un texte correspondant.
Compare a l'approche par schemas de comet, l'approche de wip prote des avantages de la
planication textuelle par la RST. Entre autres, elle represente explicitement les eets de chaque
portion de la presentation, ainsi permettant des revisions locales. Aussi, la selection du media
s'eectue en m^eme temps que la selection du contenu. Cependant, tout comme dans comet,
la determination du contenu et la determination de l'organisation textuelle sont eectuees en
m^eme temps, cette fois-ci via les relations et plans de la RST.
24
Comme nous verrons au chapitre 3, nous n'avons pas utilise la RST de facon constructive
comme dans wip, mais plut^ot de facon descriptive lors de l'analyse de corpus.
3.2.2. Systemes de generation de textes
Dans les travaux en generation automatique de texte, plusieurs projets se sont penches
sur les textes d'instructions: epicure, le systeme de Mellish et Evans, techdoc, imagene,
drafter et gist.
epicure de Dale
Le systeme epicure de Dale est un systeme de generation de texte axe sur la production
d'expressions referentielles pour communiquer des entites complexes Dal88, Dal89a, Dal89b,
Dal92]. epicure est compose d'une composante strategique et d'une composante tactique pour
generer des recettes de cuisine, un type particulier de textes d'instructions.
Pour notre these, la composante strategique de epicure nous interesse particulierement.
Ce planicateur de discours est en fait un planicateur hierarchique de t^ache ayant comme but
initial la production d'une recette particuliere. Le planicateur determine quelles operations sont
necessaires pour atteindre ce but. Les operations sont decrites par des listes de preconditions et
d'eets suivant le format des schemas d'operations de strips FN71]. Ces schemas d'operations
sont emmagasines dans la bibliotheque de plans et sont utilises a deux ns:
La liste d'eets des schemas d'operation sert a modeliser la recette en cours et les
changements d'etat des ingredients.
Le fait de decomposer ou non une operation en sous{operations determine le niveau
de detail contenu dans le plan et par consequent le niveau de detail du texte genere.
La decision de decomposer ou non une operation est realisee en consultant un modele
du lecteur. Ce modele contient principalement une liste d'operations que le lecteur sait
eectuer. Une operation, n'est pas decomposee si le lecteur sait l'eectuer.
Le resultat du planicateur de discours est une specication hierarchique du texte. Une
operation d'optimisation est ensuite eectuee sur cette specication pour agreger les operations
consecutives manipulant un m^eme objet ou faisant reference a une m^eme action. Cette etape
permet de creer un texte moins lourd. Par exemple, les trois operations tremper les pois , rincer
les pois et egoutter les pois sont regroupees en un seul n&ud tremper, rincer et egoutter les pois .
La hierarchie optimisee est ensuite passee au generateur de discours (la composante tactique)
qui parcourt ses feuilles de gauche a droite et genere le texte correspondant. Rappelons que l'
25
inter^et de Dale etait de produire des expressions referentielles et non de planier des textes.
Cependant, sur ce sujet, nous retenons les points suivants:
La representation conceptuelle de la procedure ne contient que l'information sur la
decomposition de la t^ache (operation{sous-operation). De ce fait, aucun imperatif negatif DE93b], option ou autres types d'information retrouves dans des textes naturels
n'est inclus dans le texte. Aussi, toutes les operations du plus bas niveau de la hierarchie conceptuelle, et seulement ces operations, sont incluses dans le texte. Celui-ci ne
contient donc que des operations a eectuer (les etapes composantes de Dix87b])) et
aucun resultat, information organisationnelle, etc.
Les operations sont toujours presentees par une sequence d'actions. Le texte est donc
structure en une explication lineaire SG82].
Dans le contexte des recettes de cuisine, la majorite du contenu est forme de sequences
d'actions VL93b]. Comme la plupart du temps, seules les operations sont presentees par des
sequences d'actions, ces strategies semblent appropriees dans ce domaine de discours. Cependant elles ne peuvent ^etre appliquees directement dans d'autres domaines ou la proportion de
sequences d'actions est plus faible.
Notre travail s'eorce d'elaborer des strategies plus justiees linguistiquement dans plusieurs domaines d'application. De plus, comme nous verrons au chapitre 6, nous utilisons une
representation conceptuelle contenant bien plus que la decomposition de la t^ache permettant
ainsi de generer un contenu textuel plus varie. Nous comparerons le travail de Dale et le n^otre
plus en detail au chapitre 7.
Le systeme de Mellish et Evans
Mellish et Evans ont construit un systeme de generation de texte qui accepte en entree une
representation conceptuelle d'une procedure generee par un planicateur de t^ache et produit
un texte en langue naturelle expliquant comment executer la procedure Mel88, ME89, Mel90].
Le systeme a ete teste sur plusieurs domaines comme la cuisine, la construction d'une maison
et la reparation d'une voiture et d'une prise electrique.
Le systeme de Mellish prend en entree des structures Prolog correspondant a celles produites par le planicateur de t^ache nonlin Tat76], et procede en quatre etapes:
1. La planication du message: organise l'information de la representation conceptuelle en morceaux qui seront realises par des parties independantes du texte. La
26
B
Une fois avoir fait A,
A
vous pouvez faire B et C.
C
forwards
B
Avant de faire A,
A
vous devez faire B et C.
C
backwards
Plan de la procédure
Texte correspondant
Figure 2.3. Strategies rhetoriques forwards et backwards de Mellish
strategie generale d'organisation est de construire une structure introduction{corps{
conclusion . L'introduction indique comment une t^ache est decomposee en sous{t^aches,
le corps explique comment executer ces sous{t^aches et la conclusion rappelle qu'en
executant les sous{t^aches, la t^ache de plus haut niveau est executee.
Pour accomplir cette strategie, Mellish se base sur la structure hierarchique de la
procedure produite par nonlin pour d'abord expliquer le plan de facon tres abstraite,
ensuite expliquer l'expansion des t^aches de ce niveau, puis du niveau inferieur. Une
fois le niveau le plus bas atteint, des strategies rhetoriques determinent comment
cette partie du plan sera presentee. Mellish a developpe trois strategies rhetoriques:
forwards, backwards et lump qui se basent directement sur la structure du plan. Les
strategies rhetoriques forwards et backwards et les textes correspondants (produits
plus tard) sont illustres a la gure 2.3.
2. La simplication du message: elimine les redondances qui creeraient un texte
lourd. Cette etape correspond a l'operation d'optimisation de Dale. Elle est eectuee
d'abord par des regles de reecriture generales a tous les domaines puis par des regles
speciques au domaine.
3. La construction d'une structure compositionnelle: developpe une structure
linguistique du message sous forme de description fonctionnelle de la grammaire.
4. La linearisation et la sortie: ordonne les constituants syntaxiques et choisit les
mots a utiliser. Cette derniere etape est responsable d'introduire des pronoms suivant
le modele de Dale Dal88].
En ce qui concerne le choix du contenu et de la structure rhetorique, il faut retenir que:
27
Le but de ce travail est d'expliquer des plans et non de generer des textes d'instructions.
Malheureusement, les textes generes sont peu \naturels" car:
{ Toutes les operations et toutes les relations hierarchiques sont presentees alors
que dans les textes naturels certaines informations sont laissees implicites.
{ Tout comme dans epicure, aucun resultat, condition ou imperatif negatif n'est
inclus dans le texte.
Les strategies rhetoriques de Mellish ne sont pas motivees linguistiquement. Les operations sont generalement reliees par une relation de sequence, et les relations hierarchiques sont toujours presentees par un but. Comme nous verrons au chapitre 5, ces
strategies sont une simplication des phenomenes que l'on retrouve dans des textes
naturels. De plus, les strategies rhetoriques forwards, backwards et lump sont basees
sur la structure du plan, et non sur des phenomenes linguistiques.
Tout comme pour le travail de Dale, notre approche utilise une representation conceptuelle
plus detaillee permettant ainsi de generer des resultats, des imperatifs negatifs, etc. Nous
comparerons le systeme de Mellish au n^otre de facon plus detaillee au chapitre 7.
techdoc de Rosner et
Stede
Dans le cadre du projet techdoc, R$osner et Stede ont analyse l'applicabilite de la RST a
la production multilingue de manuels d'automobiles pour construire un systeme de generation
multilingue RS92, RS94, PR94]. R$osner et Stede utilisent aussi la RST de facon constructive.
L'aspect le plus interessant de leur projet est l'ensemble de nouvelles relations rhetoriques qu'ils
developpent pour l'analyse des textes d'instructions. Ils denissent les relations de:
precondition, aussi denie par VL93b], qui est une combinaison de la circonstance et
de la condition { ex. Dans ce cas , faites O.
limite (until) { ex. Faites O jusqu'a ce que E arrive .
alternative { ex. E1 est vrai ou E2 est vrai.
sequence enumeree (step-sequence), qu'ils distinguent de la sequence standard nonenumeree { ex. 1. Faites O1. 2. Faites O2. 3. Faites O3 .
28
Ces nouvelles relations nous ont ete tres utiles lors de l'analyse de corpus. Le chapitre 5
discute de leur utilisation dans notre projet.
imagene de Vander Linden
Le travail de Vander Linden VL92, VLCM92a, VLCM92b, VL93a, VL93b, VL94] nous
interesse particulierement, car nos deux travaux se completent bien. Vander Linden a travaille un
peu sur la structure rhetorique, et intensivement sur sa realisation grammaticale. De notre cote,
nous nous sommes attardee sur la selection de contenu, la selection de la structure rhetorique
et peu sur la realisation grammaticale.
Pour son etude, Vander Linden a eectue une etude de corpus de textes d'instructions
aussi en utilisant la RST. Les relations rhetoriques retrouvees le plus frequemment sont:
les sequences d'actions { ex. Faites O1 et O2.
les concurrences d'actions { ex. Faites O1 tout en faisant O2 .
les buts { ex. Pour faire Op , faites Oe.
les preconditions { ex. Dans ce cas , faites O.
les resultats { ex. Faites O, ceci se produira.
Vander Linden a identie un certain nombre de criteres inuencant la forme grammaticale
des relations rhetoriques, leur position dans la phrase et les connecteurs utilises. Par exemple,
l'agent de l'operation, la probabilite de veracite d'une condition, le type d'une operation ou
d'un resultat sont tous des facteurs inuencant la realisation grammaticale. De facon generale,
les sequences d'actions sont exprimees par des sequences de propositions imperatives. Les buts
et les preconditions sont communiques par des propositions avant l'action qu'elles decrivent,
tandis que les resultats sont exprimes par des phrases declaratives apres l'action. Le travail de
realisation grammaticale de Vander Linden nous interesse particulierement et ses observations
sur la realisation anglaise ont ete retenues lors de l'implantation du module de realisation
linguistique de spin. Nous avons cependant adapte ses resultats pour le francais et pour des
textes plus explicatifs.
Pour le choix rhetorique, m^eme si Vander Linden suppose l'existence d'un planicateur de
t^ache pour construire la representation conceptuelle de la procedure, il n'utilise pas la distinction
faite dans ce domaine entre etats et operations. En eet, Vander Linden considere tout comme
des operations. Il developpe alors un ensemble de criteres pour selectionner le statut rhetorique
29
en se basant fortement sur la distinction deja faite par le planicateur de t^ache et par consequent
les regles semblent un peu simples.
Comme nous verrons au chapitre 5, nos criteres de selection de statut rhetorique prennent
avantage de la distinction deja faite par le planicateur de t^ache, et rajoute un niveau supplementaire de criteres de selection. A ce point de vue, nous croyons que nos heuristiques sont plus
ranees que celles de Vander Linden. De plus, comme le note DSH93, Sco93], la selection des
relations rhetoriques semble dependre de la langue de communication. Les criteres de Vander
Linden, ne peuvent donc ^etre directement utilisees pour des instructions en francais.
drafter et gist de Scott et al.
Les projets drafter et gist Sco93, DSH93, DHP+ 94, PS94, PVLF+ 95], actuellement
en developpement a Brighton, s'interessent a la generation multilingue (anglais, francais, italien,
allemand et portugais) de textes d'instructions administratifs et de manuels de logiciels.
Dans un contexte multilingue, il semble qu'une m^eme representation semantique est presentee par dierentes relations rhetoriques dependant de la langue de communication DHP+ 94].
Par exemple, dans:
(15) a. The stepping load can be altered by loosening the locking lever and changing the
position of the cylinder foot.
La charge d'appui peut ^etre modiee en desserrant le levier et en changeant la
position des verins.]
b. Pour modier la charge d'appui, desserrer les leviers puis deplacer le pied des verins.
c. Nach Lockern der Klemmhebl kann durch Verschierben des Zylinderfu)es die Tretbelastung ver$adert werden.
Apres avoir desserre les leviers, en poussant les verins, la charge d'appui peut ^etre
modiee.]
ce qui en anglais est presente par une relation de maniere (by loosening : : :), est presente en
francais par un but (pour modier : : :) et en allemand par une circonstance (Nach Lockern : : :).
Les chercheurs concluent qu'une representation semantique des instructions n'est donc
pas bien denie en termes de relations rhetoriques car ceux-ci ne sont pas universels. Une
representation par plan semble mieux appropriee. En utilisant un formalisme etendu de strips,
Delin et ses collegues utilisent les relations de generation et de permission qu'ils adaptent a la
planication de t^ache de la facon suivante DHP+ 94]:
genere si:
{ est le corps d'un plan P dont le but est permet 30
{ si est une precondition d'un plan P et est le but de P
{ ou si est le corps de P et est une precondition de Ces regles semblent bien appropriees cependant, le projet etant a ses debut, nous n'avons
pas pu utiliser leurs resultats.
4. Resume
Dans ce chapitre, nous avons fait un tour d'horizon des travaux en redaction technique,
psychologie et linguistique-informatique s'interessant aux textes d'instructions.
Des travaux en redaction technique, peu de notions nous sont utilisables. En eet, la majorite de ces travaux donnent des conseils aux niveaux grammaticaux, lexicaux et typographiques
les niveaux semantiques et rhetoriques ne sont generalement pas abordes.
Des travaux en psychologie, nous retenons que la representation conceptuelle d'une procedure est hierarchique et doit ^etre utilisee pour structurer le texte.
Les travaux d'interpretation en linguistique-informatique nous ont familiarise avec les relations de generation, contribution, permission et abstraction souvent retrouvees dans les textes
d'instructions. Aussi, le travail de Di Eugenio nous ore son analyse tres utile des imperatifs
negatifs. Les travaux en generation d'instructions nous ont fourni des points de depart et de
comparaison qui seront repris tout au long de cette these.
Les prochains chapitres traiteront en detail de la planication textuelle d'instructions.
CHAPITRE 3
Planication d'instructions
La selection des informations a communiquer et de la structure rhetorique pour les presenter
depend d'un grand nombre de facteurs. Pour restreindre notre recherche, nous ne nous sommes
attardee que sur un genre textuel particulier: les textes d'instructions.
Ce chapitre est dedie a la description des textes d'instructions en tant que genre textuel. D'abord, nous en decrivons les caracteristiques rhetoriques qui en permettent une analyse
stricte. Ensuite, nous decrivons l'outil d'analyse: la theorie de structure rhetorique (RST). Nous
expliquons les fondements de la RST et analysons comment elle est utilisee de facon descriptive et constructive en planication textuelle. Finalement, nous presentons notre approche a la
planication textuelle d'instructions et decrivons brievement le corpus sur lequel l'analyse a ete
eectuee.
1. Les textes d'instructions en tant que genre textuel
Le developpement de systemes de generation de texte est grandement limite par l'habilete a eectuer des choix justies parmi toutes les possibilites disponibles aux niveaux de la
planication et de la realisation textuelle. Ces choix dependent, entre autres, de la nature et
de la relation entre interlocuteurs, du contexte de la communication et du medium employe.
Cependant, certains types de situations communicatives donnent lieu de facon systematique a
des genres textuels particuliers caracterisables par leurs choix textuels. On pensera par exemple
a des textes narratifs, publicitaires ou descriptifs.
Les textes d'instructions possedent une structure textuelle assez stereotypee. En eet,
Kittredge Kit82] et Price et Korman PK93] y identient 3 parties principales:
(i) une introduction (ou passage descriptif ) ecrit dans un style similaire a celui retrouve
dans la langue courante,
32
(ii) les etapes (ou la section procedurale ) dont la sequence de phrases imperatives forme le
c&ur du texte d'instructions,
(iii) les explications qui identient, par exemple, des erreurs possibles.
Dans le cas des textes d'assemblage, Tutin Tut92a] detaille l'introduction en commentaires (ex. l'historique), parametres (ex. le temps de d'assemblage) et une liste d'instruments
necessaires (ex. les ingredients d'une recette). Dans cette these, nous ne nous attardons qu'a la
section procedurale des textes (partie (ii)) que nous appelons simplement instructions comme
dans Tut92a]. Voyons maintenant comment cette section est structuree.
En linguistique-informatique, il existe plusieurs approches pour decrire la structure d'un
texte. On retrouve, par exemple:
Les segments de discours: qui decoupent le texte en blocs qui se chevauchent ou
s'incluent Rei78, GS86, Pol88].
Les schemas rhetoriques: qui denissent une combinaison plus ou moins exible de
predicats rhetoriques pour representer la structure stereotypique de textes McK85,
Par91].
Les relations de discours: qui representent la structure textuelle par un arbre de
relations entre expressions linguistiques adjacentes. Parmi les etudes qui suivent cette
approche, on retrouve les relations de coherence de Hobbs Hob79, Hob82, Hob85,
Hob90] et de Dahlgren Dah88, Dah89], et la theorie de structure rhetorique (Rhetorical Structure Theory ou RST) de Mann et Thompson MT88].
Les instructions sont caracterisees par des relations claires et stereotypees entre les expressions linguistiques. L'approche par relations de discours pour l'analyse de ces textes est
donc tres appropriee. Dans notre etude, cette analyse a ete eectuee par la RST. En eet,
certaines etudes (par exemple, RS92, VL93b]) ont deja utilise cette theorie dans le contexte
de la generation et de l'analyse d'instructions. Ces etudes demontrent ainsi l'applicabilite de la
RST dans ce genre discursif et nous orent des points de depart et de comparaison tres interessants. La RST est d'ailleurs une theorie bien connue, analysee et generalement acceptee en
linguistique-informatique. Pour de plus amples discussions sur cette theorie, voir par exemple
Hov90b, Hov93, MH93] MP92] en soulignent cependant certaines limites.
Voyons maintenant en quoi consiste la RST et comment elle peut ^etre utilisee dans le cadre
de la planication de texte.
33
2. La theorie de structure rhetorique (RST)
La RST a initialement ete developpee par des linguistes et des informaticiens dans le cadre
de l'analyse de discours MT88]. La RST est actuellement bien developpee en tant que theorie
descriptive et aussi en tant que theorie constructive (pour la generation).
La RST a pour but d'identier les relations semantiques et pragmatiques entre portions
adjacentes de texte a tous les niveaux de la structure textuelle. Une description textuelle par
la RST s'eectue a partir de schemas de relations.
les relations:
Une relation specie comment deux portions adjacentes de texte sont reliees. La majorite des relations sont denies entre une partie principale, le noyau, et une partie auxiliaire, le satellite. Cependant, dans certaines relations, toutes les portions de textes sont
considerees au m^eme niveau il s'agit alors de relations multi-nucleiques. Par exemple,
dans:
(16) Pour mettre le poste de TV hors tension , presser le bouton de nouveau.
il existe une relation de but (purpose) entre le satellite pour mettre le poste : : : et le
noyau presser le bouton : : : Dans:
(17) : : : ] enlevez l'ampoule, deconnectez les ls de la douille et passez a l'etape 6.
une sequence relie trois noyaux.
La RST est applicable a de nombreux domaines de discours et genres textuels cependant, lorsqu'elle est appliquee a un nouveau contexte, de nouvelles relations ou des mises
a jour y sont souvent introduites. C'est justement cette versatilite qui fait de la RST
un outil pratique. L'ensemble initial d'environ 25 relations constitue ainsi un ensemble
ouvert pour une adaptation de la liste des relations pour les textes d'instructions, on
se referera au chapitre 5.
les schemas:
Les schemas specient la composition structurelle d'un texte. Denis en termes de relations, les schemas indiquent comment les portions de texte sont agencees. Par exemple,
le schema correspondant a la relation de but de l'exemple (16) est:
but
Pour mettre le poste
de TV hors tension,
presser le bouton
de nouveau.
34
Avant de rebobiner, enfoncer le bouton placé sous le boîtier pour débrayer la roue d’entraînement, puis tourner la manivelle de
rembobinage dans le sens des aiguilles d’une montre jusqu’à ce que la pellicule soit entièrement rentrée dans la cartouche.
La manivelle ne doit alors plus offrir de résistance. Le dos peut maintenant etre ouvert, toujours en lumière atténuée.
séquence
Avant de rebobiner, enfoncer le
bouton placé sous le boîtier pour
débrayer la roue d’entraînement,
séquence
puis tourner la manivelle de rembobinage
dans le sens des aiguilles d’une montre
jusqu’à ce que la pellicule soit entièrement
rentrée dans la cartouche. La manivelle ne
doit alors plus offrir de résistance.
Le dos peut maintenant être ouvert,
toujours en lumière atténuée.
circonstance
but
Avant de rebobiner,
enfoncer le bouton
placé sous le boîtier
pour débrayer la
roue d’entraînement,
circonstance
Avant de
rebobiner
enfoncer le bouton
placé sous le boîtier
Le dos peut
toujours en lumière atténuée.
maintenant être ouvert,
résultat
La manivelle ne doit alors
puis tourner la manivelle
plus offrir de résistance.
de rembobinage dans le
sens des aiguilles d’une montre
jusqu’à ce que la pellicule soit
entièrement rentré dans la cartouche.
circonstance
puis tourner la manivelle
de rembobinage dans
le sens des aiguilles d’une montre
jusqu’à ce que la pellicule soit
entièrement rentrée dans la cartouche.
Figure 3.4. Exemple d'analyse textuelle par la RST
ou le satellite pour mettre le poste : : : se rapporte au noyau presser le bouton : : : Dans
la convention de la RST, le segment horizontal indique l'expression linguistique, le
segment vertical (ou oblique) indique un noyau et l'arc etiquete X indique l'existence
de la relation rhetorique X.
2.1. La RST en tant que theorie descriptive
La RST denit des relations a tous les niveaux de la structure textuelle. Une description
de texte par la RST construit donc une structure arborescente qui relie les portions du m^eme
niveau, puis des portions plus petites jusqu'a couvrir tout le texte. Par exemple, la gure 3.4,
illustre une analyse de texte1 par la RST2.
2.2. La RST en tant que theorie constructive
La RST peut ^etre utilisee de facon constructive a deux ns: pour planier le contenu ainsi
que l'organisation textuelle ou pour planier seulement l'organisation textuelle, la determination
du contenu etant basee sur une autre methode.
source: photo, p. 87-88]. Les citations de cette forme indiquent un texte du corpus dont la reference se
trouve a l'appendice A.1.
2 Nous utilisons ici les relations originelles de la RST, et non les relations particuli
eres pour les instructions
presentees au chapitre 5.
1
35
2.2.1. Planication entiere par la RST
La RST peut ^etre utilisee non seulement pour organiser le contenu, mais aussi pour le determiner c'est le cas de MP88, MP93, Moo95]. Cette approche se base sur le but communicatif
du texte pour diriger la selection du contenu et des relations rhetoriques ainsi que leur structure
hierarchique. Le planicateur de texte est en fait un planicateur de t^ache (cf. le chapitre 6,
section 2) qui utilise deux types d'operateurs: des operateurs caracterisant les croyances du
lecteur (pour determiner le contenu textuel) et des operateurs rhetoriques. Chaque operateur
est denie par:
(i) un eet c'est-a-dire l'eet de l'operateur sur les croyances du redacteur et du lecteur,
(ii) des contraintes a verier avant d'appliquer l'operateur ces contraintes peuvent porter
sur des faits ou des relations du domaine de discours, sur des connaissances du lecteur
ou encore sur le noyau de la relation rhetorique suggeree au champ (iii), le satellite et
leur combinaison,
(iii) un noyau et un satellite deux sequences d'operateurs qui, lorsqu'executes, peuvent
atteindre l'eet (i). Le noyau, obligatoire, peut ^etre un acte de parole ou un etat a
atteindre par ranement successif. Les satellites eux, sont optionnels.
Par un processus de planication de t^ache, comme celui de noah Sac77], le planicateur
de texte recherche un operateur dont l'eet (champ (i)) satisfait le but communicatif du texte et
utilise le noyau et le satellite (champ (iii)) pour developper le reste du contenu et de la structure
textuels.
Cette approche a l'avantage d'^etre concise, d'indiquer comment les parties de discours sont
reliees entre elles et quel but communicatif chaque partie de texte atteint. Cette approche effectue la selection du contenu et la selection des relations rhetoriques en une seule etape, mais
il est tout a fait possible de permettre un lien plusieurs a plusieurs entre ces deux questions. En
eet, un operateur semantique (croyances du lecteur) peut se realiser par dierentes combinaisons de noyaux/satellites (champ (iii)). La liste des contraintes (champ (ii)) vient alors diriger
la strategie rhetorique la plus appropriee. Cette approche est en accord avec les travaux de
Moore et Pollack MP92] qui ont demontre de facon convaincante que la planication textuelle
doit faire la distinction entre le niveau informationnel ou semantique et le niveau intentionnel
ou rhetorique ces deux niveaux n'etant pas relies de facon directe, mais plut^ot de plusieurs a
plusieurs KK93].
36
2.2.2. Organisation textuelle par la RST
Bien que la planication entiere par la RST soit tout a fait appropriee, pour la generation
de textes d'instructions, il nous semble preferable de n'utiliser la RST que pour l'organisation
textuelle. En eet, comme ces textes decrivent de facon plus ou moins stricte une procedure a
eectuer, il semble preferable de planier la procedure a accomplir, de selectionner le contenu
textuel a partir de la representation de la procedure et enn de faire correspondre ce contenu
textuel a une structure rhetorique. Dans les travaux de Mellish Mel88, ME89, Mel90] , de Dale
Dal92] et de Vander Linden VL93b] un planicateur de t^ache est utilise pour determiner la
representation conceptuelle de la procedure comme une hierarchie de plans le contenu textuel
est ensuite selectionne suivant certaines regles les relations de discours ne sont utilisees que
pour l'organisation textuelle. Les travaux de Mellish et de Dale n'utilisent pas explicitement les
relations de la RST, mais des relations equivalentes quelques fois implicites.
Dans le travail de Mellish Mel88, ME89, Mel90], la planication du contenu transmet dans
le texte toutes les operations et les relations hierarchiques retrouvees dans la representation
conceptuelle de la procedure. Le but de ce travail est d'expliquer des plans et non de generer
des textes d'instructions comme nous avons vu au chapitre 2, cette strategie ne semble pas
appropriee pour generer des textes naturels car:
Toutes les operations et toutes les relations hierarchiques sont presentees, alors que
dans les textes naturels, certaines informations sont laissees implicites.
Aucun resultat, imperatif negatif (DE93a, DE93b]) ou autre type d'information retrouves dans des textes naturels ne sont inclus dans le texte.
Du point de vue de l'organisation textuelle, les strategies rhetoriques de Mellish considerent
generalement un lien direct entre les niveaux semantique et rhetorique. En eet, hormis certaines
strategies rhetoriques non justiees linguistiquement, les operations sont toujours reliees par une
relation de sequence, tandis que les relations hierarchiques sont toujours presentees par un but.
Dans le systeme epicure Dal92], la planication du contenu insere systematiquement
dans le texte toutes les operations situees aux feuilles de la representation conceptuelle de la
procedure, c'est-a-dire, les operations que le lecteur sait eectuer, et seulement ces informations.
D'apres l'etude de Vander Linden VL93b] presentee au chapitre 2, comme dans le domaine des
recettes de cuisine, 90 a 100% du contenu est forme de sequences d'actions et que generalement
37
seules les operations aux feuilles de la representation conceptuelle sont presentees par des sequences d'actions, cette strategie semble appropriee. Cependant elle ne peut ^etre directement
appliquee a d'autres domaines ou la proportion de sequence d'actions est plus faible.
En ce qui concerne l'organisation textuelle, epicure eectue un choix rhetorique tres
simple: toutes les operations sont presentees par une sequence d'actions. Comme nous venons
de voir, cette strategie est tres appropriee dans les recettes de cuisine cependant, dans d'autres
domaines, les operations ne sont pas toujours presentees par cette relation rhetorique.
Dans le systeme imagene VL93b] la question de selection de contenu n'a pas vraiment
ete abordee, mais la selection de la structure rhetorique a quelque peu ete etudiee. A l'inverse
de Mellish et de Dale, Vander Linden considere que les niveaux semantique et rhetorique sont
relies de facon plusieurs a plusieurs. Cependant, son etude, eectuee pour l'anglais, ne peut ^etre
utilisee telle quelle, car comme le remarque Scott et son equipe Sco93] et DSH93], le choix des
relations rhetoriques pour presenter une m^eme information peut dierer d'une langue a l'autre.
De plus, cette question n'etant pas l'emphase de son projet, ses criteres pour selectionner la
structure rhetorique restent assez simples.
3. Notre approche a la planication textuelle
Considerant l'approche prise dans les travaux anterieurs, nous avons choisi d'utiliser la RST
en tant qu'outil descriptif pour analyser un corpus de textes, et en tant qu'outil constructif dans
la selection de la structure textuelle. En ce qui concerne la planication du contenu, comme
nous travaillons sur des textes d'instructions, nous suivons l'approche de Mellish, Dale et de
Vander Linden en utilisant un planicateur de t^ache (cf. le chapitre 6).
3.1. Modele general
Dans cette these, nous considerons la generation de textes d'instructions comme un processus de choix entre dierents niveaux de representations. Cette approche est illustree a la
gure 3.5.
Choix I. A partir d'une representation conceptuelle du domaine, par exemple, une bibliotheque de schemas d'operations non-instancies, un processus de planication selectionne,
lie et instancie ces connaissances en une representation conceptuelle de la procedure a decrire
c'est l'etape I de la gure 3.5. Dans les travaux anterieurs, cette etape est generalement eectuee par un planicateur de t^ache. Cette technique est en accord avec les resultats des etudes
psychologiques qui indiquent que la representation conceptuelle d'une procedure possede une
structure hierarchique et contient des schemas d'operations instancies.
38
Choix II. A partir de la representation conceptuelle de la procedure, on choisit l'infor-
mation a communiquer dans le texte et celle qui restera implicite. Cette etape produit une
representation semantique du texte d'instructions. Ce processus n'a pas recu beaucoup d'attention dans les travaux anterieurs en linguistique-informatique probablement par crainte de
supposer une representation conceptuelle subjective.
Choix III. A partir de la representation semantique du texte, sa structure rhetorique est
choisie. Dans la plupart des systemes anterieurs, la determination du contenu et la determination
de la structure rhetorique relevent de la m^eme question. Sans distinction entre les choix II et
III, une diversite rhetorique est alors perdue3 .
Choix IV. La structure rhetorique est nalement transformee en une representation
grammaticale et lexicale. C'est a cette etape que le choix des formes grammaticales et des mots
a utiliser pour faire reference a une relation et un concept particuliers est eectue. Ces decisions
sont prises en m^eme temps car les choix grammaticaux dependent de la disponibilite lexicale
de la langue4 . En eet, il n'est pas toujours possible de trouver une forme lexicale convenant
aux structures grammaticales preferees Dan85].
Choix V. La representation lexicale est nalement mise en page et realisee typographiquement. Ici aussi de nombreux choix sont disponibles pour transmettre une m^eme representation lexicale. Faut-il numeroter les etapes ou non ? Les termes techniques sont-ils mieux
presentes en italiques ou en caracteres gras ? Les travaux de Hartley et de Price et Korman
Har85, Har86, PK93] discutent de ces choix.
Cette architecture a ete choisie pour sa simplicite d'implantation cependant d'un point
de vue theorique, elle fait abstraction d'un certain nombre d'interdependances entre les dierents niveaux de choix. Par exemple, les choix de mise en page peuvent inuencer les choix
lexicaux, grammaticaux et rhetoriques. En eet, une liste enumeree preferera un parallelisme
lexical, grammatical et rhetorique entre les elements enumeres, tandis que dans un paragraphe
Seulement lorsque toute la planication de texte est eectuee de facon constructive par des operateurs
semantiques et des operateurs rhetoriques, comme dans MP93], alors un lien plusieurs a plusieurs peut ^etre
realise.
4 Comme nous verrons au chapitre 6, dans notre implantation, les d
ecisions grammaticales sont generalement prises avant les decisions lexicales car dans la plupart des cas, cette derniere etape ne s'occupe que de
lexicaliser des concepts et des relations respectivement par des noms et des verbes sans vides lexicaux. Dans le
cas de changement de categorie conceptuelle a lexicale (ex. une relation nominalisee) les decisions grammaticales
ont droit de regard sur le lexique, evitant ainsi un retour arriere lors de vides lexicaux.
3
39
explicatif, un tel parallelisme alourdirait le texte. Avec l'approche lineaire de la gure 3.5 l'interdependance entre les niveaux ne peut ^etre realisee.
Aussi, il est important de noter que ce qui importe a nos yeux est la distinction entre la
question semantique et la question rhetorique et non la distinction de leurs processus. Dans
notre approche, nous avons opte pour deux processus sequentiels, chacun s'occupant d'une
question particuliere. Cependant, nous ne condamnons aucunement d'autres architectures. Deux
processus (un semantique et un rhetorique) entrelaces ou un m^eme processus s'occupant des
deux questions feraient tout a fait l'aaire s'ils distinguent les deux niveaux et permettent un
lien plusieurs a plusieurs entre les deux.
Comme notre travail cherche a bien distinguer les etapes de determination de contenu et
de structure textuelle en planication de texte, nous avons porte une attention particuliere a
la correspondance entre les representations conceptuelle, semantique, et rhetorique (choix II
et III). Pour le premier choix, un ensemble d'heuristiques de selection de contenu choisit des
elements semantiques a ^etre communiques dans le texte. Lors de cette etape, nous considerons la
distinction faite au niveau de la planication de t^ache entre operations et etats (cf. le chapitre 6).
La correspondance entre les niveaux semantique et rhetorique est eectuee par des heuristiques
de presentation qui selectionnent la structure rhetorique la plus appropriee dans un contexte
particulier. Ces heuristiques considerent que les niveaux semantiques et rhetoriques sont relies de
facon plusieurs a plusieurs comme le conseillent Korelsky et Kittredge KK93]. Pour temoigner
de phenomenes linguistiques naturels, ces deux ensembles d'heuristiques sont bases sur l'etude
d'un corpus de textes d'instructions.
3.2. Analyse de corpus
A notre connaissance, aucun travail ne s'est directement penche sur la question de selection de contenu et de structure textuelle dans les instructions. Pour etudier ces aspects, nous
avons alors eectue une analyse de corpus. Cette methode est souvent utilisee en linguistiqueinformatique Tut92a, VL93b, DE93b] car elle permet d'eviter la simplication de problemes
textuels et linguistiques. Ainsi, Kittredge considere une telle analyse comme une etape essentielle pour bien caracteriser les phenomenes de la langue Kit83]:
Tout syst
eme operationnel doit ^etre base sur une description empirique compl
ete du langage, tel qu'il est utilise dans le domaine d'origine du texte. p. 45
Lors de la selection du corpus, nous avons pris soin de ne considerer que des instructions
\correctes". En eet, certains manuels sont incomprehensibles du point de vue linguistique
40
Représentation Conceptuelle du Domaine
I
Représentation Conceptuelle de la Procédure
..
.
..
.
..
.
II
Représentation Sémantique du Texte
III
Représentation Rhétorique du Texte
IV
Représentation Grammatico-Lexicale du Texte
V
Représentation Typographique du Texte
.
.
.
.
.
.
Figure 3.5. Notre approche a la planication de textes d'instructions
41
(mauvaise structuration, mauvais termes) ou extra-linguistique (manuels desuets). Pour eviter
d'analyser des textes linguistiquement incorrects, nous n'avons considere que des textes rediges
a l'origine en francais ou des traductions correctes qui ne semblaient pas inuencees par la
langue d'origine.
Le corpus selectionne provient de 15 sources dierentes. Il est compose de 79 procedures5 et
compte environ 13 300 mots. Pour ne pas se restreindre a un style particulier d'instructions, les
textes selectionnes vont de listes d'execution (explications lineaires) a des textes plus explicatifs
(explications fonctionnelles). En eet, nous avons choisi des textes assez varies que ce soit du
point de vue du lecteur vise, du types d'operations ou du but des instructions de facon a
developper une theorie applicable a un grand nombre d'instructions. Le prix de cette decision
est une perte de precision lors de la generalisation des resultats. Pour ne pas perdre trop de
signication dans nos generalisations, nous avons adopte les precautions suivantes:
Seules les parties procedurales ont ete analysees.
Les textes du corpus ont ete classies selon leur but communicatif (cf. le chapitre 4)
et les resultats de l'analyse prennent ce facteur en consideration. En ce qui concerne le
niveau d'expertise du lecteur, une classication moins rigoureuse a ete eectuee, mais ce
facteur entre tout de m^eme en jeu lors de la planication textuelle. Toute generalisation
des resultats par rapport a l'expertise du lecteur et au but communicatif est justiee
par notre analyse de corpus.
L'analyse d'un corpus moins varie aurait sans doute permis de developper des heuristiques
plus precises, mais leur application a d'autres domaines n'aurait pas ete possible. En fait, nous
suivons l'approche deja adoptee par Mellish Mel88] c'est a dire d'avoir des regles generales pour
la generation d'instructions dans tous les domaines, puis des regles particulieres pour ajuster le
texte au domaine et au lecteur desires.
Le corpus est constitue de procedures de:
soins d'urgences respiratoires bouche],
recettes de cuisine recette],
assemblage de meubles armoire],
utilisation d'un magnetoscope vcr],
utilisation d'un televiseur tele],
5 Cette mesure n'est pr
esentee qu'a titre indicatif. Lorsqu'une procedure est divisee en plusieurs sous{
procedures, nous avons compte de la facon suivante: si la procedure principale atteint un but bien precis (par
exemple, changer l'huile d'une voiture), alors nous n'avons compte qu'une seule procedure si par contre la
procedure principale atteint un but vague (par exemple, utiliser les boutons de la telecommande), alors chaque
sous-procedure a ete comptee.
42
reparations electriques elect],
entretien automobile auto, mazda],
techniques du rotin rotin],
techniques de la photographie photo],
vinication vin],
restauration de meubles antiques antique],
organisation de disques durs ordi],
peinture sur verre peint],
souage de verre soue].
Les references completes du corpus d'analyse sont donnees a l'appendice A.1.
4. Resume
Dans ce chapitre, nous avons considere les textes d'instructions en tant que genre textuel.
Nous en avons presente les caracteristiques textuelles generales et note que leur structure rhetorique stereotypee en permet une analyse stricte. La theorie de la RST, utilisee lors de l'analyse
de corpus, a ete presentee et nous avons vu ses utilisations descriptive et constructive dans les
travaux anterieurs de planication textuelle.
Finalement, nous avons decrit et justie notre approche generale. Nous considerons la
generation de textes d'instructions comme un processus de choix entre dierents niveaux de
representations: de la representation conceptuelle du domaine a la representation typographique
du texte. Les deux prochains chapitres presenteront les liens entre la representation conceptuelle
de la t^ache, la representation semantique et la representation rhetorique du texte.
CHAPITRE 4
Selection du contenu
Nous avons vu a la gure 3.5 du chapitre precedent que la planication de texte prend en
entree une representation conceptuelle de la t^ache a accomplir et selectionne une representation rhetorique du texte de procedure. Ce processus s'eectue en deux etapes: d'abord un
ensemble d'elements semantiques 1 est selectionne (choix II) puis les relations rhetoriques les
plus appropriees pour presenter ces elements sont selectionnees (choix III).
Dans ce chapitre, nous discutons des heuristiques pour choisir les elements semantiques a
communiquer: les heuristiques de selection. D'abord les elements semantiques qui se retrouvent
le plus souvent dans les textes d'instructions sont presentes. Ensuite les criteres les plus importants inuencant leur inclusion dans le texte sont presentes. Finalement, pour chaque element
semantique, les heuristiques de selection sont presentes en detail.
1. Analyse semantique des instructions
1.1. Les elements semantiques
Les elements semantiques identient le sens des expressions textuelles. Dans le corpus,
nous avons identie 9 elements semantiques proceduraux et un element non-procedural.
l'operation sequentielle,
l'attribut d'objet (non procedural),
la condition materielle,
l'eet,
l'inuence,
l'operation co-temporelle,
l'option,
la prevention,
1 Nous utilisons le terme element plut^ot que relation car ces informations donnent generalement lieu au
satellite ou au noyau d'une relation rhetorique plut^ot qu'au lien entre ces composantes.
44
E lements Semantique Nombre Proportion
operation sequentielle
condition materielle
attribut d'objet
eet
in uence
operation co-temporelle
option
prevention
operation eventuelle
autre
total
758
164
158
134
130
45
34
21
15
12
1471
51 %
11 %
11 %
9%
9%
3%
2%
1%
1%
1%
100 %
Table 4.2. E lements semantiques du corpus
l'operation eventuelle.
La frequence de ces elements semantiques dans le corpus est presentee a la table 4.2. Bien
s^ur cette liste n'est pas exhaustive elle reste un ensemble ouvert. Cependant, elle comptabilise
la grande majorite (99%) des elements retrouves dans notre corpus.
Pour identier l'element semantique communique par une expression textuelle, nous avons
utilise la classication de la gure 4.6 (p. 49).
Les attributs d'objets: Parmi les elements semantiques, seuls les attributs d'objets sont non-proceduraux. Par exemple:
(18) Une lampe a une seule douille comporte habituellement une lyre qui tient a une
barre de retenue par les manchons.
Cet element ne participe pas directement a la procedure mais ne fait que modier les
connaissances du lecteur. Les 8 autres elements semantiques sont proceduraux.
Les eets et les conditions materielles: Les elements proceduraux peuvent communiquer un etat ou une operation.
La distinction entre un etat et une operation est une question delicate. Dans son
travail VL93b], Vander Linden considere tout element au niveau semantique comme
etant une operation. Il ne prend pas avantage de la distinction deja faite au niveau
de la planication de t^ache entre un etat et une operation2. Vander Linden ne considere jamais un element comme un etat, mais recherche toujours l'operation qui l'a
entra^%ne. Bien que tout etat soit engendre par une operation, non seulement il n'est
pas toujours possible de determiner comment un etat a ete atteint, mais une telle operation peut ^etre sans aucune valeur dans le contexte de la procedure. Par exemple, la
verication du niveau d'huile d'une automobile diere s'il s'agit d'une traction avant
2
En planication de t^ache, une operation est une fonction entre deux etats.
45
ou d'une traction arriere. Ici, on ne peut determiner l'operation qui a engendre le type
de traction (le proprietaire a achete une traction avant, le concessionnaire la lui a
vendue, le fabricant l'a construite, : : :). De plus, m^eme si cette operation pouvait ^etre
determinee, elle ne serait d'aucun secours lors de la redaction de la procedure. Dans
notre etude, nous avons alors considere tout element semantique execute par l'agent
de la procedure exclusivement dans le cadre de la procedure comme une operation
dans les autres cas, nous avions aaire a un etat.
S'il s'agit d'un etat, celui-ci peut ^etre engendre par une operation ou bien peut
contraindre une operation. Par exemple, dans:
(19) Appuyer sur la touche play. La lecture normale appara^t.
l'operation appuyer cree l'etat lecture normale appara^t . Il s'agit alors d'un eet.
Nous verrons plus tard qu'un eet peut aussi communiquer une operation.
Par contre, si l'etat contraint l'application d'une operation alors il communique une
condition materielle comme dans:
(20) L'enfant a moins de 2 ans ? Placez-le sur votre avant-bras ou sur votre cuisse.
Ici, l'operation placer ne doit ^etre executee que si l'etat enfant a moins de 2 ans est
vrai.
Les preventions: Une expression communiquant une operation, peut ^etre positive
(par ex. Faites ceci.) ou negative (par ex. Ne faites pas ceci.). Une operation negative
communique toujours une prevention.
Les options et les operations eventuelles: Une operation positive peut ^etre obligatoire ou facultative. Si l'operation communiquee est facultative, la decision de l'executer ou non peut ^etre prise par l'agent de facon volontaire ou involontaire. Par
exemple, dans:
(21) Pour monter un dispositif de securite pour enfants, : : :] immobilisez le dispositif de securite avec la ceinture ventrale.
l'agent ne doit pas necessairement monter le dispositif mais l'operation est telle que
s'il l'execute, il en est tout a fait conscient son choix a ete volontaire. Dans ce cas,
on a aaire a une option.
D'un autre c^ote, dans:
(22) Si vous tentez d'acceder au disque \C >", vous n'y parviendrez pas.
46
l'operation tenter d'acceder au disque C > est telle que l'agent peut l'eectuer sans
s'en rendre compte. Par exemple, il suppose qu'une commande n'accede pas au disque,
mais en fait necessite cet acces. Dans le cas d'une decision involontaire comme celle-ci,
l'expression communique une operation eventuelle.
Les inuences et les eets: Si l'operation est obligatoire elle peut ^etre generee (dans
le sens de Goldman, cf. le chapitre 2) par une autre operation incluse dans le texte.
Dans ce cas, il peut s'agir d'une inuence ou d'un eet3 :
Si l'operation-parent () contribue toujours a l'operation-enfant (), independamment
de comment est executee, alors on a aaire a un eet. Dans ce cas, n'inuence
pas l'interpretation et l'execution de . Par exemple dans:
(23) Revissez l'ecrou capuchon sur la lyre pour ne pas le perdre.
peu importe comment on revisse l'ecrou capuchon () (par exemple, en faisant deux
rotations a droite plut^ot que trois) la generation aura lieu car l'ecrou capuchon ne sera
pas perdu (). Il existe donc une relation de generation entre les 2 types d'actions
revisser et ne pas perdre.
D'un autre cote, l'operation-enfant peut ^etre generee par l'operation-parent uniquement si celle ci est executee d'une facon particuliere. C'est le cas dans:
(24) : : : ] tourner cette touche a droite et a gauche pour minimiser les parasites .
Ici, la generation entre tourner et minimiser n'aura lieu que si tourner est execute
d'une facon particuliere. Par exemple, si la touche est tournee deux fois a droite plut^ot
que trois, la generation n'aura pas lieu car les parasites ne seront pas minimises. La
generation est donc conditionnelle a la facon dont est executee et cette condition
est dierente chaque fois que l'operation est executee. Il existe donc une relation de
generation entre les instances d'actions, mais entre les types d'actions, on ne peut
denir de relation de generation. Dans ces cas, l'operation-parent inuence, ou
guide, l'interpretation de l'operation-enfant de facon a produire la generation. On
a alors aaire a une inuence.
Tres recemment, Di Eugenio et Webber DEW95] ont note, dans les instructions, un
phenomene apparente a l'inuence phenomene qu'elles nomment la surcharge pragmatique (pragmatic overloading). Di Eugenio et Webber notent que les expressions
de but (purpose clauses), les expressions \jusqu'a" (until clauses) et les modieurs
(free adjuncts) peuvent mettre en jeu une surcharge pragmatique. Plus precisement,
3
KL95] discute de ces 2 elements semantiques.
47
la surcharge pragmatique joue deux r^oles: elle communique explicitement la relation
de contribution R (generation, permission ou une combinaison de ces relations) entre
et et implicitement, elle contraint l'interpretation de ou de R. Par exemple,
dans:
(25) a. Tenir la tasse sous le bec-verseur pour la remplir de cafe.
b. Tenir la tasse sous le robinet pour la laver.
Il existe une relation de permission entre tenir la tasse () et la remplir () et entre tenir la tasse () et la laver (). Cependant, dans (25a), le lecteur deduit des contraintes
supplementaires sur son comportement. En eet, il deduit de que la tasse doit ^etre
en position verticale avec sa concavite vers le haut. Dans le cas de (25b), n'inuence
pas l'interpretation de . L'analyse Di Eugenio et Webber porte sur la relation de
contribution, tandis que la n^otre ne porte que sur la generation. L'inuence peut donc
^etre vue comme un cas particulier de la surcharge pragmatique, et l'eet comme un
cas particulier de non-surcharge lorsque R = generation. Dans notre exemple (24),
le lecteur infere de l'information supplementaire de minimiser les parasites () pour
bien executer tourner cette touche a droite et a gauche ().
Une methode simple pour determiner si une expression communique un eet ou une
inuence, consiste a relire le texte en eliminant l'operation-parent (). Si l'instruction est interpretee de la m^eme facon, alors il s'agit d'un eet, sinon, l'expression
communique une inuence4 . On peut aussi tenter de connecter les deux expressions
par les locutions de facon a ou de sorte que . Si l'interpretation de l'instruction est la
m^eme, alors il s'agit d'une inuence, sinon d'un eet. Dans les exemples precedents,
la phrase:
(26) Revissez l'ecrou capuchon sur la lyre.
est susante pour generer ne pas perdre , tandis que
(27) : : : ] tourner cette touche a droite et a gauche.
n'est pas susante pour minimiser les parasites. Aussi,
(28) Revissez l'ecrou capuchon sur la lyre an de ne pas le perdre.
laisse croire qu'il faut revisser l'ecrou d'une facon particuliere ce qui n'est pas indique
dans la phrase originale. Cependant,
(29) : : :] tourner cette touche a droite et a gauche an de minimiser les parasites .
a une interpretation equivalente a la phrase originale (24).
4
Cette methode semble aussi ^etre utilisee par Di Eugenio et Webber DEW95].
48
Les operations eventuelles: Si l'operation communiquee n'est pas generee par une
autre operation communiquee dans le texte, elle peut ^etre executee au moment de
l'execution du reste de la procedure ou beaucoup plus tard. Dans ce dernier cas,
l'expression communique une operation eventuelle, comme dans:
(30) Veriez-le de nouveau lorsque la voiture aura roule.
Les operations co-temporelles et sequentielles: Parmi les operations obligatoires
a eectuer immediatement, on peut distinguer celles eectuees en m^eme temps qu'une
autre: les operations co-temporelles, par exemple:
(31) : : : ] eeurer la surface du verre, tout en le faisant tourner.
et les operations a executer individuellement: les operations sequentielles, comme
dans:
(32) 1. Mettre le commutateur catv sur la position \STD".
2. Selectionner dierents canaux : : :]
1.2. Problemes lies a l'analyse semantique
De facon generale, toute analyse de texte a un niveau plus profond que la syntaxe posent
un certain nombre de problemes. En eet, les textes nous presentent leur syntaxe, leur choix
lexicaux et leur mise en page. Cependant, de ces formes de surface, des analyses rhetorique et
semantique ne peuvent qu'^etre deduites par interpretation. Deja, lorsqu'une analyse rhetorique
est eectuee, plusieurs structures semblent convenir. L'interpretation semantique d'un texte
etant encore plus eloignee de la forme de surface, elle peut alors aussi accepter plusieurs solutions. Pour eectuer l'analyse semantique du corpus, nous avons donc tenter de questionner
chaque expression analysee sur sa probabilite de satisfaire les traits identies a la gure 4.6.
Ceci a ete eectue en visualisant l'execution des instructions dans leur environnement le plus
probable et quelques fois en s'inspirant de la forme de surface.
En eet, certains traits sont facilement deductibles directement de la forme de surface.
Par exemple la polarite d'une operation est indiquee par la polarite de l'expression (ex. ne
pas faire) et la semantique du verbe employe (ex. eviter). Aussi, l'execution immediate/future
d'une operation se deduit generalement du temps du verbe employe. La majorite des elements
semantiques s'identient, cependant, par la forme de surface ainsi que par des connaissances
pragmatiques liees a procedure elle-m^eme. C'est le cas de la distinction entre eets et conditions
materielles. Les conditions materielles sont habituellement precedees d'expressions comme si ou
lorsque ce qui n'est pas le cas pour les eets. Aussi, en executant l'instruction (mentalement ou
physiquement) on peut distinguer les etats generes par une operation de ceux qui la contraignent.
expression
linguistique
Figure 4.6. Classication des elements semantiques
non
procedurale
attributs
d'objets
etat
prevention
negative
condition
materielle
engendre
par une
operation
contraint
une
operation
eet
generee
par une
autre
operation
du texte
procedurale
generation
entre instances
d'actions
generation
entre types
d'actions
obligatoire
operation
non-generee
par une
operation
du texte
positive
execution
immediate
execution
future
facultative
operation
eventuelle
choix
involontaire
option
choix
volontaire
inuence
eet
operati
co-tempo
execution
concurrente
operatio
sequentie
execution
individuelle
operation
eventuelle
49
50
Dans le cas d'options et d'operations eventuelles, la syntaxe et la pragmatique nous sont aussi
d'un grand secours. En eet, les options presentent generalement une operation-parent suivie
de ses operations-enfants (indiquant le but d'une operation) tandis que l'operation eventuelle
utilise l'ordre inverse (la consequence d'une operation). De plus, l'operation eventuelle consiste
generalement en une erreur, un oublie ou une operation qui s'est executee toute seule sans que
l'agent n'est pu la prevenir. Dans le cas d'une option, l'agent est tout a fait conscient qu'il doit
executer la suite d'operations. Finalement, certains elements semantiques ne sont identiables
que par des connaissances pragmatiques de la procedure elle-m^eme. Par exemple, comme nous
avons vu a la section precedente, la distinction entre inuences et eets n'est pas devoilee par
des indices syntaxiques, mais bien en modelisant la procedure.
Dans notre analyse semantique, plusieurs elements semantiques semblent quelques fois ^etre
communiques par une m^eme expression. Par exemple, dans:
(33) Pour pallier cet inconvenient , peindre ces surfaces transparentes avec les couleurs a
l'huile et attendre qu'elles sechent.
il n'est pas clair si l'expression en italique communique une operation optionnelle (si vous
voulez pallier : : :) ou obligatoire (vous devez pallier : : :). Dans le premier cas, on a aaire a
une option dans le second cas, il s'agit d'un eet.
Dans notre analyse de corpus, nous avons considere l'element semantique qui nous paraissait le plus saillant dans le contexte. Il serait interessant, cependant, de considerer tous les
elements possiblement communiques et verier si une combinaison des heuristiques de selection
et de presentation est applicable.
Pour donne un apercu de notre analyse, l'appendice B presente un exemple de texte analyse.
2. Contraintes des heuristiques
Pour selectionner quels elements semantiques doivent ^etre inclus dans le texte, les heuristiques de selection se basent sur cinq types de contraintes: la structure de la representation
conceptuelle, les cooccurrences d'elements semantiques, la nature de la t^ache, les connaissances
du lecteur et le but communicatif du texte. Certains de ces criteres se basent fortement sur la
notion d'operation de base, c'est pourquoi nous tenons a denir ce terme avant de presenter les
contraintes.
2.1. Les operations de base
Pour decider quelles operations communiquer dans le texte, et quelles operations laisser
implicites, il semble necessaire d'introduire la notion d'operation de base. Informellement, les
51
operations de base sont les operations les plus generales eectuees directement par l'agent. Elles
sont assez speciques pour ^etre descriptives mais assez generales pour ^etre utiles5 .
De nombreux travaux en psycholinguistique se sont penches sur la question de niveaux de
base dans des categories conceptuelles structurees hierarchiquement CGB88, PR90]. Les categories de base sont denies comme les categories les plus abstraites pour lesquels les membres
possedent un grand nombre de proprietes perceptuelles ou abstraites communes ou bien comme
les categories possedant les proprietes communes les plus importantes. Cependant, ces travaux
se penchent generalement sur les concepts d'objets et peu se sont occupes de concepts d'evenements.
D'apres Rosch Ros78], les operations de niveau de base semblent ^etre les operations plus
facilement retenues en memoire. Rosch a eectue des experiences sur les unites d'evenements
memorises en demandant a des sujets de se souvenir des operations eectuees durant la journee,
la veille, l'avant-veille, etc et pendant des periodes de temps diverses. Les sujets ont cites des
operations comme se brosser les dents , prendre une douche , aller au cours de statistiques, mais
personne n'a mentionne des unites plus petites comme prendre le tube de dentifrice , l'ecraser
ou des unites plus larges comme eectuer les t^aches matinales . De plus, les unites d'evenements
mentionnes etaient les m^emes independamment de la periode de temps consideree et de la
proximite temporelle de l'evenement. Rosch a donc fait l'hypothese que les gens possedent une
representation mentale plus facilement accessible pour certains evenements qu'elle a appele des
evenements de base. De plus, Rosch stipule que le niveau de base des evenements correspond au
niveau de base des objets impliques dans l'evenement. Ainsi se brosser les dents est une operation
de base car elle implique l'utilisation d'objets de base (une brosse a dents, un dentifrice, : : : )
plus facilement disponible conceptuellement.
Dans le m^eme ligne de pensee, Pollack aussi denit la notion d'operations de niveau de
base (domain-basic act-types) Pol86]. Elle prend comme exemple, le domaine du courrier electronique, dans lequel toutes les operations qui decrivent une commande sont des operations de
niveau de base (par ex. eacer un message , envoyer un message, : : :). Pour Pollack, taper un
caractere au clavier ne peut ^etre considere une operation de base du domaine car l'operation
est trop specique. De m^eme pour taper une cha^ne de caracteres ou taper quoi que ce soit .
Dans ce domaine, une operation de base serait plut^ot emettre une commande . Pollack propose
donc qu'a l'interieur d'un domaine de discours, on peut denir un ensemble d'operations de
5 La notion d'op
erations de base diere de la notion d'operations primitives. Cette derniere sera plus
detaillee au chapitre 6 mais pour les impatients, la distinction se situe au niveau des connaissances du lecteur.
En eet, le lecteur sait decomposer une operation de base en sous-operations, tandis que pour une operation
primitive, il conna^!t non seulement sa decomposition mais aussi ses pre- et postconditions.
52
base. Dans certains cas, certains agents peuvent posseder un repertoire d'operations de base
dierent.
La notion d'operation de base est donc assez subjective. L'ensemble des operations de base
n'est pas universel a tous les domaines et a tous les sujets6 . Il semblent dependre:
du domaine de discours,
du niveau de connaissances du lecteur et du redacteur,
du but de la communication.
Rappelons qu'en philosophie des actions, Goldman et Danto Gol70, Dan63, Dan65, Dan73]
denissent aussi une notion d'actions de base . Pour Goldman et pour Danto, une action de base7
est a la source de toute relation de generation. Une action est consideree de base si elle est la
plus specique que l'agent peut eectuer de facon volontaire par exemple baisser le bras ou
lever les epaules . De plus, une operation de base ne peut ^etre executee en faisant une autre
action. Dans ce cas, l'action taper un caractere au clavier n'est pas de base car elle ne peut
^etre eectuee qu'en faisant une autre action qu'en bougeant ses doigts d'une facon particuliere
sur un endroit particulier. En philosophie d'actions, l'ensemble des actions de base correspond
generalement aux actions physiques d'un agent humain executees avec des parties de son corps.
Dans la litterature, il existe donc deux extr^emes a la notion d'operations de base. En
philosophie, l'ensemble des operations de base n'inclut que les operations physiques les plus
speciques que l'agent peut eectuer de facon volontaire. Cet ensemble est donc independant
du domaine et est plus ou moins universel a tous les agents8 . A l'autre extr^eme, en psychologie
on retrouve la notion de Pollack, qui considere les operations de base comme etant dependantes
du domaine et du niveau de connaissances de l'agent. Il s'agit alors d'operations plus generales
que des operations physiques de plus bas niveau. De son c^ote, la notion de Rosch semble
supposer qu'une operation de base est universelle a tous les agents. Cependant, le domaine de
son experience est si restreint qu'il ne laisse pas de place a dierents niveaux d'expertise de la
part des agents de plus, dans ses experiences avec des objets concrets RMG+ 76], elle indique
que les categories de niveaux de base dependent des connaissances de l'agent. Aussi pour Rosch,
une operation de base ne correspond pas aux operations physiques de plus bas niveau.
6 Kor94] remarque que dans le domaine bureaucratique, certaines op
erations souvent eectuees ensemble
sont regroupees en une operation de base. C'est le cas, par exemple, de remplir et faire circuler des formulaires.
7 Pour rester d
ele a leur terminologie, nous utilisons ici le terme action, plut^ot que operation.
8 G
eneralement, tous les agents humains peuvent eectuer les m^emes operations physiques a moins d'une
impossibilite exceptionnelle (ex. un handicap).
53
Nous utiliserons alors le terme operation de base dans le sens de Pollack et de Rosch.
La notion de Goldman et de Danto s'apparente mieux a la notion d'operation primitive en
planication de t^ache (cf. le chapitre 6).
La notion d'operation de base peut expliquer l'introduction de certaines operations dans
les textes d'instructions: les operations de base sont incluses dans le texte, car les redacteurs
en possedent une representation mentale facilement accessible Ros78], et car elles facilitent
la memorisation du lecteur, puisque ceux-ci peuvent facilement construire une representation
mentale de la procedure. En expliquant les contraintes considerees par nos heuristiques, le r^ole
des operations de base sera mieux deni.
tion:
Voici maintenant les types de contraintes prises en compte par les heuristiques d'introduc-
le contenu et la structure de la representation conceptuelle,
les cooccurrences d'elements semantiques,
les connaissances et intentions du lecteur,
la nature de la t^ache,
le but communicatif du texte.
Ces cinq types de contraintes ne forment pas une liste exhaustive des criteres inuencant
le choix du contenu. En eet, d'autres criteres, comme le domaine de discours9 et la langue de
communication, peuvent inuencer ces choix. Cependant, notre corpus est trop restreint pour
tirer des conclusions justiees sur d'autres criteres.
2.2. Le contenu et la structure de la representation conceptuelle
Comme le prescrivent les travaux en psychologie presentes au chapitre 2, le contenu et
la structure conceptuels d'une procedure sont essentiels pour determiner le contenu d'un texte
d'instruction facile a interpreter.
Dans notre corpus, le contenu de la representation conceptuelle inuence le choix des
elements semantiques. En eet, comme l'illustre la gure 4.6 (p. 49), un etat et une operation
donnent lieu a un ensemble dierents d'elements semantiques. Determiner si on a aaire a
un etat ou a une operation est donc essentiel pour determiner les elements semantiques a
communiquer.
9 Il est int
eressant de constater que dans les recettes de cuisine 80 % des elements semantiques sont des
operations sequentielles tandis que la moyenne pour les textes d'execution est de 60 % (cf. la gure 4.7, p. 72).
54
Aussi, la structure de la representation conceptuelle est necessaire pour selectionner un
element semantique. En eet, pour faciliter l'interpretation du texte, ses elements semantiques
doivent ^etre structures de facon similaire a la structure de la representation conceptuelle (voir
le chapitre 2). Par exemple, si une operation O se decompose en 7 2 operations Oi dans la
representation conceptuelle et que O et plusieurs Oi sont jugees importants a communiquer,
alors idealement, le texte devrait se decomposer en une sous procedure, tout comme dans la
representation conceptuelle.
2.3. Les cooccurrences d'elements semantiques
Dans les textes d'instructions, l'inclusion de certains elements semantiques semble codependre de l'inclusion d'autres elements semantiques tandis que certaines combinaisons d'elements semantiques ne se retrouvent jamais.
Par exemple, lorsque le lecteur sait executer une operation de base, mais ne conna^%t pas
les dierents etats atteints par ses operations-enfants, alors typiquement, les operations-enfants
sont incluses dans le texte accompagnees des etats qu'elles atteignent. C'est le cas dans (34a):
(34) a. Appuyer sur la touche otr pour specier l'heure d'enregistrement.
Lorsque la touche est enfoncee une fois, `pm 10:35 (30min)' sera ache.
Lorsqu'elle est enfoncee deux fois, `pm 11:05 (1h)' sera ache.
Lorsqu'elle est enfoncee trois fois, `pm 11:35 (1h 30min)' sera ache.
b. Appuyer sur la touche otr pour specier l'heure d'enregistrement.
Enfoncer la touche une fois,
L'enfoncer deux fois,
L'enfoncer trois fois.
c. Appuyer sur la touche otr pour specier l'heure d'enregistrement.
`pm 10:35 (30min)' sera ache.
`pm 11:05 (1h)' sera ache.
`pm 11:35 (1h 30min)' sera ache.
Inclure seulement les operations-enfants comme dans (34b) serait inutile car le lecteur sait
deja qu'il doit les eectuer. D'un autre c^ote, inclure seulement les dierents etats en les associant
a une seule operation-parent comme dans (34c), ne se retrouve pas non plus. L'inclusion des
operations-enfants et l'inclusion des eets semblent donc, dans ce cas, ^etre co-dependentes.
Considerer les cooccurrences d'elements semantiques permet ainsi de produire des textes
coherents et naturels.
2.4. Les connaissances et intentions du lecteur
Les connaissances et intentions du lecteur forment un critere important en generation
de texte car il permet de produire un texte mieux adapte au lecteur (voir par exemple Par91]
Par93] et PR94]). En eet, en considerant ses connaissances et intentions, on peut ainsi donner
55
au lecteur de l'information qu'il ne conna^%t pas, omettre si possible ce qu'il sait deja et corriger
ses connaissances erronees.
Les connaissances et intentions du lecteur peuvent ^etre denies par un modele du lecteur.
Ce modele est une entite dynamique inuencee par le contexte textuel precedent. En eet, au
fur et a mesure que le lecteur lit le texte, ses connaissances evoluent. La notion d'operation de
base est fortement utilisee par ce type de contrainte.
2.5. La nature de la t^ache
La nature de la t^ache denit des caracteristiques sur les operations et les etats dans la
t^ache particuliere. Ces contraintes indiquent par exemple si un etat est interne ou externe a
l'appareil manipule, facile a verier ou non : : :L'inclusion de certains elements semantiques est
dependant de ce type de contrainte. C'est le cas, par exemple, des eets qui ne sont inclus dans
les textes d'execution que s'ils sont externes tandis que dans les textes visant seulement la
comprehension, des eets internes et externes se retrouvent aussi frequemment.
2.6. Le but communicatif
Dans notre these, le but communicatif est deni par l'incitation a eectuer ou non la
procedure au moment de la lecture du texte. Il indique si le lecteur est l'agent de la procedure
ou non. Pour determiner si le but communicatif joue un r^ole dans la selection du contenu, nous
avons divise notre corpus en 3 categories:
les texte d'execution qui s'adaptant bien a une execution immediate de la procedure
(7 textes). Ces textes sont caracterises par des listes enumerees de phrases courtes
speciant au moins une operation a eectuer. Les procedures sont courtes, requierent
peu d'instruments et utilisent des termes peu specialises. De plus, leurs operations
requierent peu de dexterite et de jugement. Ces textes se rapprochent des explications
lineaires de Smith et Goodman SG82] (cf. le chapitre 2).
les textes de comprehension visant uniquement la comprehension (4 textes). Ces
textes sont caracterises par des paragraphes expliquant les etapes a suivre. Les operations a eectuer demandent plus de jugement et de dexterite de la part de l'agent
et ne sont pas mises en evidences par des marqueurs typographiques. Les procedures
requierent plus d'instruments et utilisent des termes plus specialises. On inclut ici les
explications structurelles et fonctionnelles de Smith et Goodman.
les textes hybrides pouvant satisfaire les deux buts communicatifs precedents (4
textes).
56
type de
texte
longueur des
procedures (mots)
dexterite/jugement instruments specialisation mise en
requis
requis
des termes page
execution
120{820 (moyenne: 440) moyen{grand
hybride
120{255 (moyenne: 200) peu{moyen
comprehension 50{370 (moyenne: 150) peu{moyen
grand
peu{moyen
peu{moyen
moyen-grand
peu-moyen
peu-moyen
peu-moyen
moyen
grand
Table 4.3. Caracteristiques des dierents types de textes du corpus
La table 4.3 resume les caracteristiques des textes de notre corpus. L'appendice A.2 en
donne les details.
Nous avons ensuite calcule la frequence des elements semantiques dans chacun de ces types
de texte. Comme le montrent les gures10 4.7 et 4.8 (pp. 72 et 73), le but communicatif semble
inuencer 3 elements semantiques: les attributs d'objets, les eets et les \autres elements"
tous les trois plus presents dans les textes de comprehension. Deux elements semantiques, les
operations co-temporelles et les operations sequentielles, semblent a prime abord aussi inuences
par le but communicatif, mais nous croyons que leur variation est due a un autre facteur. Les
operations co-temporelles semblent plus frequentes dans les textes de comprehension que dans
les textes d'execution, mais nous croyons que ceci est d^u au fait que les t^aches complexes,
qui requierent plus d'operations co-temporelles, sont generalement presentees par un texte de
comprehension et les t^aches plus simples le sont par une liste d'execution. D'un autre c^ote, les
operations sequentielles semblent moins frequentes dans les textes de comprehension. Seulement,
nous croyons que leur frequence relative aux autres elements est plus basse, car ces textes
comptent une plus grande frequence des autres elements semantique. En eet, si on calcule la
frequence des operations sequentielles par rapport aux elements semantiques non-inuences, on
a 69 % d'operations sequentielles dans les textes d'executions, 65 % dans les textes hybrides et
64 % dans les textes de comprehension. La frequence des operations sequentielles semble donc
maintenue.
Le but communicatif sera donc pris en consideration pour communiquer les attributs d'objets et les eets, mais pas pour les autres elements semantiques.
3. Heuristiques de selection
Les elements semantiques retrouves dans notre corpus sont presentes a la table 4.2 (p. 44).
L'appendice C.1 presente ces resultats en detail pour chaque texte du corpus. Les elements
dont nous discutons ici traitent de 99 % du texte. Parmi les autres elements , on retrouve de
l'information de securisation, d'historique, : : :
5.9.
10
Nous tenons a remercier Massimo Fasciano dont le systeme postgraphe a genere les gures 4.7, 4.8 et
57
Telles que presentees dans les sections qui suivent, les heuristiques:
sont reliees par une disjonction,
sont exhaustives,
sont presentees en ordre de preference, bien qu'elles soient souvent mutuellement exclusives. Ainsi, si plusieurs heuristiques sont applicables a un contexte particulier, on
preferera selectionner la premiere citee.
Voyons maintenant sous quelles conditions un element semantique est introduit dans le
texte. Les elements sont presentes par ordre d'importance.
3.1. Les operations sequentielles
L'operation sequentielle est l'element semantique le plus frequent dans tous les types d'instructions. Dans notre corpus, cet element forme pres de la moitie des textes (51%). On retrouve
cet element dans les phrases telles que:
(35) a. Placez une disquette ms-dos dans le lecteur A].
b. Appuyer sur la touche otr pour specier l'heure d'enregistrement.
Lorsque la touche est enfoncee une fois , `pm 10:35 (30min)' sera ache.
L'operation sequentielle indique une operation positive, obligatoire, immediate et independante que l'agent doit directement eectuer. Dans l'exemple (35b), l'expression specier
l'heure d'enregistrement ne communique pas une operation sequentielle car l'operation n'est
pas eectuee directement, mais est plut^ot generee par l'operation appuyer sur otr l'expression
communique un eet.
D'apres notre analyse, l'introduction d'operations sequentielles dans le texte est regie par
quatre heuristiques. Ces heuristiques mettent en jeu tous les types de contrainte, sauf le but
communicatif du texte. En eet, comme explique a la section 2 le but communicatif ne semble
pas inuencer l'introduction des operations sequentielles.
(i) Si le lecteur sait eectuer une operation de base, ses operations-enfants ne sont generalement pas incluses dans le texte. Cependant, si les operations-enfants engendrent des
etats dierents inclus dans le texte en tant qu'eets (ils satisfont les heuristiques des
eets cf. la section 3.4) alors l'operation de base et ses operations-enfants sont communiquees dans le texte en tant qu'operations sequentielles. C'est le cas des operations
appuyer et enfoncer dans l'exemple (35b).
(ii) Si deux conditions materielles equivalentes sont incluses dans le texte et que le lecteur
conna^%t l'operation a eectuer sous ces conditions materielles, alors cette operation n'est
pas incluse dans le texte. C'est le cas dans:
58
heuristique conceptuelle
(i)
(ii)
(iii)
(iv)
contrainte
nature
coocde la t^ache currence
Ob doit ^etre executee, Ob a plusieurs operationsenfants Oei et
les Oei engendrent des etats
Ei dierents
O doit ^etre exe- E1 E2
cutee et les etats
E1 et E2 contraignent l'application de O
Ob doit ^etre executee
Ob doit ^etre executee
-
lecteur
les Ei sont com- Ob est de base
muniques dans
le texte par des
eets
E1 et E2 sont
communiquees
dans le texte
par des conditions materielles
-
-
commubut com- niquer
municatif
-
Oe et Ob
sait que O est a effectuer sous E1 et
E2
-
exclure O
Ob est de base, le
lecteur ne sait pas
comment eectuer
Ob, mais sait eectuer ses operations
descendants Odi
Ob est de base
-
Odi
-
Ob
Table 4.4. Heuristiques de selection: l'operation sequentielle
(36) Si la couleur ne suit pas lorsque l'on passe rapidement sur le verre, c'est qu'elle
est trop epaisse.
Ici, l'operation exclue est diluer la peinture .
(iii) Si le lecteur ne sait pas comment eectuer une operation de base, alors ses operationsdescendants (enfants ou petits-enfants) qu'il sait eectuer sont incluses en tant qu'operations sequentielles. L'operation de base sera incluse en tant qu'inuence ou eet si
elle satisfait les heuristiques de ces elements semantiques.
(iv) Dans tous les autres cas, toute operation de base obligatoire, immediate et independante
est incluse dans le texte comme operation sequentielle.
Ces heuristiques sont resumees a la table 4.4.
3.2. Les attributs d'objets
Dans de nombreuses procedures, de l'information qui n'a pas directement a voir avec
la procedure a executer est communiquee ce sont les attributs d'objets. Comme l'indique la
gure 4.8 (p. 73), cet element semantique est beaucoup moins frequent dans les instructions
d'execution que dans les instructions visant seulement la comprehension. Ceci explique pourquoi
aucun travail en analyse d'instruction, par exemple RS92, VL93b], ne discute de ce sujet.
Cependant, en moyenne, dans notre corpus, cet element semantique compte pour pres de 11 %
du texte. Voici deux exemples d'attributs d'objets:
59
heuristique conceptuelle
(i)
(ii)
nature
de la t^ache
un objet OB A est un atdoit ^etre utilise tribut de OB
qui justie la
prochaine ligne
d'operations
un objet OB
doit ^etre utilise
ou O doit ^etre
executee
contrainte
cooclecteur
currence
-
-
but communicatif
ne conna^!t pas execution
l'attribut A de
OB
-
texte visant de
plus en plus la
comprehensionplut^ot que l'execution
communiquer
A
de plus en
plus de d'attributs de OB
et de O
Table 4.5. Heuristiques de selection: l'attribut d'objet
(37) a. Une lampe a une seule douille comporte habituellement une lyre qui tient a une
barre de retenue par des manchons. Pour enlever la lyre, : : :
b. Le selecteur de sortie VCR/VHF OUT est implante sur le panneau arriere a gauche
du connecteur d'antenne.
(i) Si le texte vise l'execution immediate de la procedure, un objet particulier est manipule
et un de ses attributs que le lecteur ne conna^%t pas entra^%ne ou justie l'execution
d'une ligne d'operations, alors cet attribut est inclus dans le texte. C'est le cas de
l'exemple (37a) extrait d'une procedure pour reparer la douille d'une lampe. Ici, le fait
que les lampes a une seule douille comportent generalement une lyre qui bloque l'acces
a la douille justie qu'il faille enlever la lyre pour reparer la douille.
Cette regle compte pour 62 % des attributs d'objets communiques dans les textes
d'execution. Les autres 38 % semblent tous se justier dieremment.
(ii) Plus le texte vise la comprehension de la procedure plut^ot que son execution immediate,
plus d'objets manipules et d'operations eectuees sont accompagnes d'une description
et ceci, a la discretion du redacteur.
Les attributs d'objets ne sont pas necessaires a l'interpretation correcte de la procedure,
c'est pourquoi les heuristiques, resumees a la table 4.5, ne sont pas particulierement precises.
3.3. Les conditions materielles
Les conditions materielles precisent l'etat de l'environnement dans lequel une operation doit
^etre eectuee. Elles sont incluses dans le texte pour permettre a l'agent de decider lui-m^eme si
la prochaine ligne d'operations doit ^etre executee. Par exemple:
(38) a. Si le liquide contient des fragments metalliques , adressez vous a un mecanicien
qualie.
b. Si des bulles apparaissent autour de la valve , c'est qu'il y a une fuite a cet endroit .
Faites-la remplacer par un mecanicien qualie.
Les conditions materielles comptent pour 11 % des elements semantiques de notre corpus.
60
Pour introduire une condition materielle, il semble que les contraintes conceptuelles soient
primordiales:
(i) Toutes les conditions materielles qui ne peuvent ^etre resolues d'apres les connaissances
de la representation conceptuelle du domaine sont introduites dans le texte. En eet,
si un etat non-verie n'est pas inclus dans le texte, alors celui-ci ne transmet pas
delement la representation conceptuelle de t^ache et la procedure sera erronee. Ici, les
connaissances du lecteur ne sont pas a considerer car m^eme s'il sait qu'une operation est
contrainte par une condition materielle, le texte l'induirait en erreur si celle-ci n'etait
pas mentionnee.
(ii) De plus, si la condition materielle a communiquer est dicile a evaluer ou que le
lecteur ne sait pas comment l'evaluer, alors une condition equivalente dans le contexte
de la procedure, mais plus facile a evaluer est communiquee. Si le lecteur ne peut
deviner l'equivalence de ces deux conditions, alors elles sont toutes deux communiquees
par contre, si le lecteur peut deviner leur equivalence, seulement la plus facile est
communiquee. C'est le cas dans:
(39) S'ils les ecrous] portent la marque L, ils ont le letage a gauche et vous devez
les devisser en tournant dans le sens des aiguilles d'une montre. Pour les ecrous
qui ne portent aucune marque , tournez en sens contraire
Ici, le letage a gauche / a droite est la condition fondamentale pour determiner dans
quel sens devisser les ecrous. Cependant, cet etat est dicile a verier, tandis que l'etat
equivalent (porter ou non la marque L) est bien plus facile a verier. Initialement,
comme le lecteur ne sait pas necessairement que les deux etats sont equivalents, ils
sont tous les deux communiques. Cependant, on peut supposer plus tard que le lecteur
peut deviner que l'etat les vis ne portent aucune marque est equivalent a les vis ont
le letage a droite. Il est donc inutile de communiquer ce second etat. Comme nous
verrons au chapitre 6, les conditions equivalentes sont speciees dans la representation
conceptuelle de la t^ache (cf. la table 6.25, p. 109).
L'operation contrainte par l'etat peut ^etre explicite dans le texte, comme dans les exemples
precedents, ou bien peut ^etre laissee implicite, comme dans:
(40) Si la couleur ne suit pas lorsque l'on passe rapidement sur le verre , c'est qu'elle est trop
epaisse . Suivre le modele sous verre, : : :
Ici, l'operation implicite, diluer la peinture , satisfait l'heuristique (ii) des operations sequentielles (cf. la section 3.1) et par consequent n'est pas communiquee.
61
heuristique conceptuelle
nature
de la t^ache
contrainte
cooccurrence
(ii)
l'etat Ed contraint Ef
une operation et
est inveriabled'apres
les connaissances
du domaine
E
(ii)
l'etat Ed contraint Ef
une operation et
est inveriabled'apres
les connaissances
du domaine
E
(ii)
l'etat Ed contraint Ed est di"cile ne sait pas que Ef
une operation et a evaluer, Ef
est inveriable
est plus facile
d'apres les connais- et Ef Ed
sances du domaine
l'etat Ed contraint Ed est di"cile
une operation et a evaluer, Ef
est inveriable
est plus facile
d'apres les connais- et Ef Ed
sances du domaine
l'etat E contraint
une operation et
est inveriabled'apres
les connaissances
du domaine
(ii)
(i)
d
d
lecteur
-
-
E
d
ne sait pas comment verier Ed ,
sait verier un
autre etat Ef
mais ne sait pas
que Ef Ed
ne sait pas comment verier Ed ,
sait verier un
autre etat Ef et
sait que Ef Ed
-
sait que Ef
Ed
-
commubut com- niquer
municatif
-
Ed et Ef
-
Ef
-
Ed et Ef
-
Ef
-
E
Table 4.6. Heuristiques de selection: la condition materielle
Certains travaux, comme Mel88, VL93b], discutent de conditions temporelles speciant
la n d'une operation (par ex. quand O est nie ). Dans notre corpus, ces conditions ne comptent que pour 6 occurrences (4 % des conditions materielles), c'est pourquoi, elles ne sont pas
considerees par nos heuristiques.
Les heuristiques sont recapitulees a la table 4.6.
3.4. Les eets
L'eet specie ce que l'execution d'une ligne d'operations cause a l'etat actuel du monde.
C'est-a-dire ce qui devient vrai et ce qui n'est plus vrai dans le monde. L'eet permet a l'agent
de verier si une ligne d'operations a ete bien executee ou simplement satisfait sa curiosite. Pres
de 9 % des elements semantiques de notre corpus sont des eets. Par exemple:
(41) a. Amener a ebullition et laisser mijoter doucement pendant 2 a 3 minutes, en remuant
sans arr^et, la creme epaissira et changera de texture .
b. Faites rouler l'automobile 20 minutes pour rechauer le moteur.
62
c. Si la lumiere du jour reste preponderante, l'eet peut ^etre agreable si c'est l'eclairage
articiel qui l'emporte, un ltre bleu clair sera susant pour corriger le rendu des
couleurs.11
Notons que l'operation qui engendre un eet peut ^etre nulle. Par exemple dans (41c),
l'operation implicite est ne faites rien et l'eet pourra ^etre agreable .
Un eet semble inclus dans le texte en fonction de la nature de la t^ache, des connaissances
du lecteur et de son but communicatif. En eet:
(i) Si une ligne d'operations peut ^etre mal eectuee alors un eet est introduit comme
point de contr^ole pour permettre a l'agent de verier s'il a bien execute les operations
et peut continuer la procedure. C'est le cas dans l'exemple (41a).
(ii) Si le lecteur ne peut comprendre pourquoi une ligne d'operations doit ^etre eectuee
dans le contexte courant de la procedure, dans ce cas, un eet est introduit simplement
pour satisfaire la curiosite du lecteur. Par exemple, dans (41b), le lecteur inexperimente
peut tres bien se demander pourquoi, pour verier le niveau de liquide de transmission
d'une voiture, il faut la faire rouler pendant 20 minutes.
(iii) Si le lecteur peut supposer un eet incorrect, l'eet correct est introduit pour rectier
ses connaissances. Les fausses suppositions du lecteur peuvent ^etre faites a partir de
ses connaissances initiales du domaine ou de la mention precedente d'un eet dans la
procedure. Par exemple, dans,
(43) Appuyer sur tv/vcr. Le voyant s'allume : : :] Si l'interrupteur d'alimentation
est en position on, le selecteur tv/vcr doit ^etre mis en position tv et le voyant
reste eteint .
le premier eet enseigne au lecteur l'etat engendre si on appuie sur tv/vcr. Cependant,
cette instruction suppose, sans le mentionner, que l'interrupteur est en position off
dans ce cas, appuyer une fois sur le bouton tv/vcr met l'appareil en position vcr. Le
lecteur peut donc croire, a tort, que chaque fois qu'il appuie sur ce bouton, le voyant
s'allume. Le second eet a donc ete introduit pour corriger cette supposition.
Dans ces 3 situations, le but communicatif du texte inuence l'introduction d'eets (cf. la
gure 4.8, p. 73). Pour expliquer ceci, nous avons d'abord classie les eets en 3 categories:
les eets externes a un appareil c'est-a-dire visibles ou facilement mesurables par
l'agent. Par exemple:
11 Il ne faut pas confondre l'eet dans cette phrase avec une condition mat
erielle presentee par une relation
de resultat comme dans:
(42) Si des bulles apparaissent autour de la valve, c'est qu'il y a une fuite a cet endroit. Faites-la remplacer
par un mecanicien qualie.
63
type de texte
execution
hybrides
comprehension
types d'eets
externe externe/interne interne
83 %
3%
4%
69 %
26 %
5%
54 %
4%
42 %
Table 4.7. Types d'eets par rapport au type de texte
(44) Le voyant reste eteint.
les eets internes a un appareil et invisibles a l'agent, par exemple:
(45) Par contre, s'il surgit plus tard, c'est qu'il existe un probleme quelconque au
niveau de votre carte contr^oleur.
les eets a la fois internes et externes, comme dans:
(46) : : : celui-ci signale sa \disponibilite" par la presence d'un petit tiret.
Ici, la disponibilite est un eet interne tandis que la presence d'un petit tiret est un
eet externe.
Ensuite, nous avons note la frequence de chaque type d'eet dans les dierents types de
textes. Comme l'illustre la table 4.7, on remarque que dans les textes d'execution la grande
majorite (83 %) des eets sont externes, il y a un peu moins d'eet externes dans les textes
hybrides (69 %), tandis que dans les textes de comprehension, il y a autant d'eets internes
qu'externes. Les heuristiques (i), (ii) et (iii), recapitulees a la table 4.8, ont donc ete ajustees
pour prendre en consideration le but communicatif du texte.
3.5. Les inuences
Une inuence indique comment ou pourquoi une operation doit ^etre executee tout en
guidant son execution. Par exemple,
(47) : : :tourner cette touche a droite et a gauche pour minimiser les parasites .
Dans le corpus, 9 % des elements semantiques sont des inuences. L'inuence se distingue
de l'eet, car ce dernier n'inuence pas comment l'operation est executee, mais augmente simplement les connaissances du lecteur. L'eet entre 2 operations specie une relation de generation entre les types d'action. D'un autre cote, l'inuence specie une generation entre des
instances d'action. Si l'operation-enfant est executee d'une facon particuliere alors elle generera
l'operation parent l'execution de l'operation-enfant est donc inuencee par l'operation-parent.
Comparez par exemple, les phrases (41b) et (47). Dans la premiere, rechauer le moteur n'inuence pas comment on fait rouler l'automobile , tandis que dans le second exemple, comment
la touche est tournee de droite a gauche est dicte par la quantite de parasites a l'ecran.
64
heuristique conceptuelle
(i)
(i)
(i)
(ii)
(ii)
(ii)
(iii)
(iii)
(iii)
un ensembled'operations soeurs Oi
doit ^etre eectue
et Oi engendre
l'etat E
un ensembled'operations soeurs Oi
doit ^etre eectue
et Oi engendre
l'etat E
un ensembled'operations soeurs Oi
doit ^etre eectue
et Oi engendre
l'etat E
un ensembled'operations soeurs Oi
doit ^etre eectue
et Oi engendre
l'etat E
un ensembled'operations soeurs Oi
doit ^etre eectue
et Oi engendre
l'etat E
un ensembled'operations soeurs Oi
doit ^etre eectue
et Oi engendre
l'etat E
un ensembled'operations soeurs Oi
doit ^etre eectue
et Oi engendre
l'etat E
un ensembled'operations soeurs Oi
doit ^etre eectue
et Oi engendre
l'etat E
un ensembled'operations soeurs Oi
doit ^etre eectue
et Oi engendre
l'etat E
nature
de la t^ache
contrainte
cooclecteur
currence
but communicatif
communiquer
Oi peuvent ^etre
mal eectuees et
E est externe
-
-
Oi peuvent ^etre
mal eectuees et
E n'est pas interne
-
Oi peuvent ^etre
mal eectuees
-
E est externe
-
ne comprendpas execution
l'utilite de Oi
E
E n'est pas interne
-
ne comprendpas hybride
l'utilite de Oi
E
-
ne comprendpas comprehension E
l'utilite de Oi
E est externe
-
fausse deduction execution
possible
E
E n'est pas interne
-
fausse deduction hybride
possible
E
-
fausse deduction comprehension E
possible
-
-
execution
E
-
hybride
E
-
comprehension E
Table 4.8. Heuristiques de selection: l'eet
65
Dans les travaux anterieurs, decider si une relation hierarchique doit ^etre incluse dans le
texte est eectue de facon assez simple. En eet, Mellish prescrit l'inclusion de toutes les relations hierarchiques (eets ou inuence) Mel88], tandis que Dale n'en prescrit aucune Dal92].
D'apres notre analyse, il semble qu'une inuence est introduite en fonction de tous les types de
contraintes sauf le but communicatif. On introduit une inuence si:
(i) Le lecteur requiert des precisions sur l'execution d'une operation de base Ob par
exemple, il ne conna^%t pas toutes les etapes, hesite entre plusieurs methodes : : :Dans ce
cas, parmi toutes ses operations-enfants Oe, un sous-ensemble S faisant reference aux
operations (ou caracteristiques) les plus discriminantes est inclus dans le texte pour
clarier comment Ob doit ^etre executee. Par exemple,
(48) La paraison12 est centree en utilisant le marbre .
Ici, Ob = centrer la paraison , Oe = fdeposer la paraison sur le marbre, rouler la paraison g et S = futiliser le marbre g. L'ensemble S ne sut pas pour eectuer Ob , mais
plut^ot fait reference a l'ensemble Oe dont les operations peuvent generer Ob. Ici, la
relation n'est clairement pas une permission cf. le chapitre 2) car Oe doit ^etre execute
en m^eme temps que Ob et Oe genere Ob.
Au pire cas, S peut contenir tous les elements de Oe sauf un. C'est le cas dans:
(49) Si la bo^%te-pont est munie d'une jauge d'huile, tirez-la hors du tube de remplissage, essuyez-la, reinserez-la completement et retirez-la de nouveau pour lire le
niveau d'huile .13
Ici, pour eectuer l'operation de base lire le niveau d'huile , toutes ses operations-enfants
sont precisees, sauf la plus evidente regarder la marque du niveau d'huile sur la jauge .
Dans le corpus, 70 % des inuences satisfont ce cas.
(ii) On introduit aussi une inuence dans le texte si Ob est une operation de base, Ob
est enfant-unique et son execution depend de l'execution de son operation parent Op .
Cette dependance denit generalement une condition d'arr^et comme dans (50a) (Ob =
secouer et Op = degager), ou bien une methode a suivre comme dans (50b) (Ob =
couper et Op = former) et (50c) (Ob = disposer et Op = placer).
(50) a. Secouez doucement le capuchon pour le degager .
b. Coupez le carre en deux pour former deux triangles .14
12
fusion.
Dans le domaine du sou$age de verre, la paraison est le resultat de la seconde cueillette de verre en
13 On peut aussi interpr
eter cette phrase comme speciant une permission dans ce cas, pour lire le niveau
d'huile communiquerait une operation sequentielle et non une in uence.
14 Exemple hors-corpus tir
e de DE93b].
66
heuristique conceptuelle
(i)
(ii)
(iii)
nature
de la t^ache
contrainte
cooccurrence
lecteur
Ob doit ^etre ef- S est l'ensemble Ob est commu- Ob est de base
fectuee
des operationsen- niquee par une et necessite des
fants de Ob les operationsequen- precisions sur complus discriminantes tielle
ment ^etre executee
Ob doit ^etre ef- Ob est enfant uni- Ob est commu- Ob est de base
fectuee
que et son exe- niquee par une
cution depend de operationsequenl'executionde son tielle
operation parent
Op
O doit ^etre efOe sont commu- Oe sont de base
fectuee et est
niquees par des
divisee en une
operationssequendizaine d'operatielles
tions enfants Oe
commubut com- niquer
municatif
-
S
-
Op
-
O
Table 4.9. Heuristiques de selection: l'inuence
c. On dispose alors de l'objet a clisser de telle sorte que le fond se trouve place
en haut .
Dans le corpus, 27 % des inuences satisfont ce cas.
(iii) Finalement, une inuence est aussi introduite si une operation est divisee en 7 2
operations-enfants Oe de base. Dans ce cas, une sous-procedure est utilisee comme
dans:
(51) Une fois formee, la paraison est centree, : : : ] Ce travail s'eectue au banc, de
la facon suivante: le soueur place la canne sur les bardelles et saisit : : :
Ici, l'operation-parent centrer la paraison inuence l'interpretation des operationsenfants (placer, saisir, : : :).
Seulement 3 % des inuences du corpus, se trouvent dans cette situation.
La table 4.9 recapitule ces heuristiques.
3.6. Les operations co-temporelles
Certaines operations doivent ^etre executees immediatement, mais de facon simultanee. Par
exemple,
(52) : : :] eeurer la surface du verre, tout en le faisant tourner .
En moyenne, 3 % des elements semantiques du corpus communiquent des operations cotemporelles. Pour introduire cet elements semantique, on se base sur les heuristiques des operations sequentielles. En eet, comme l'indique la table 4.10:
67
heuristique autre
(i)
contrainte
commuconceptuelle nature
cooclecteur but com- niquer
de la t^ache currence
municatif
les heuristiques O1 et O2 sont
des operationsse- co-temporelles
quentielles s'appliquent sur une
paire d'operations
a eectuer O1 et
O2
-
-
-
-
O1 et O2
Table 4.10. Heuristiques de selection: l'operation co-temporelle
(i) Les operations co-temporelles sont introduites sous les m^emes conditions que les operations sequentielles (cf. section 3.1), mais en plus, la representation conceptuelle de la
t^ache doit temoigner de leur co-temporalite.
3.7. Les options
Certaines expressions dans les textes d'instructions expriment une option de l'usager. Une
option indique une operation, et eventuellement ses operations-enfants, qui n'est pas necessaire
a la procedure, mais qui peut ^etre executee si l'agent le desire. Par exemple,
(53) a. Si l'on souhaite une ligne plus large , alors s'attarder sur le verre de facon a laisser
s'ecouler plus de couleur.
b. Pour vous aider , poussez fermement le anc du pneu avec votre pied.
On compte environ 2 % d'options dans le corpus.
L'introduction d'une operation optionnelle et de ses operations-enfants ne semble dependre
ni du but communicatif (cf. la gure 4.7, p. 72) ni des contraintes de cooccurrences. En eet:
(i) Si une operation indique une regle generale, on preferera l'introduire par une operation
eventuelle (cf. section 3.9).
(ii) Par contre, on introduit une option s'il s'agit d'une operation facultative, qui facilite
la t^ache, ou qui atteint un but generalement desirable. De plus, si l'operation avait ete
obligatoire, elle aurait ete communiquee dans le texte en tant qu'operation sequentielle
(c'est-a-dire qu'elle satisfait les heuristiques de la section 3.1).
De plus, une fois qu'une operation optionnelle est incluse dans le texte, ses operationsenfants deviennent dans un environnement localement obligatoire les heuristiques de
selection des operations sequentielles y sont donc applicables. En particulier, si l'operation optionnelle est de base et que le lecteur ne sait pas l'eectuer, alors ses operationsenfants sont incluses dans le texte en tant qu'operations obligatoires (sequentielles,
co-temporelles ou eventuelles).
68
heuristique autre
(i)
(ii)
conceptuelle
O doit ^etre executee
si l'operation O O doit ^etre exeetait obligatoire, cutee et un etat
elle satisferaitles E de type si
heuristiques des l'agent le desire
operationssequen- contraint O
tielles
-
contrainte
nature
de la t^ache
O est une regle
generale
O facilitela t^ache
ou O est generalement desirable
commucooclecteur but com- niquer
currence
municatif
-
-
-
exclure O
-
-
-
O et appliquer
les heuristiques
d'operationssequentielles sur
les operationsenfants comme
si elles etaient
obligatoires.
Table 4.11. Heuristiques de selection: l'option
Ces heuristiques sont recapitulees a la table 4.11.
M^eme s'il est possible de determiner si une operation optionnelle sera volontairement executee, l'etat la contraignant doit ^etre exprime. En eet, ne pas introduire une telle expression
changerait le sens de la procedure car l'operation optionnelle serait maintenant vue comme une
operation obligatoire. Les intentions du lecteur ne sont donc pas a considerer.
3.8. Les preventions
Une expression de prevention communique une operation a ne pas eectuer. Par exemple:
(54) Secouez doucement le capuchon pour le degager, sans le tourner .
Les preventions se realisent par des imperatifs negatifs DE93b]. Rappelons du chapitre 2
que Di Eugenio divise les imperatifs negatifs en deux classes: les neg-TC (take care) et les
DONTs. Bien que tres appropriee dans l'analyse d'instructions, cette caracterisation ne nous a
pas ete utile pour selectionner les preventions a introduire dans le texte mais le sera lors du
choix de la relation rhetorique (cf. le chapitre 5).
Dans le corpus, on retrouve en moyenne 1 % de prevention. L'inclusion de cet element
semantique dans le texte depend fortement des connaissances du lecteur et de la nature de la
t^ache. Comme l'illustre la gure 4.7 (p. 72), le but communicatif ne semble pas jouer de r^ole
important. Les preventions semblent incluses dans le texte dans 3 situations:
(i) Une operation ne doit pas ^etre eectuee mais le lecteur pourrait naturellement supposer
qu'elle doit l'^etre. Ses raisons peuvent inclure:
(a) dans une situation similaire l'operation a ete eectuee, ou
(b) le but courant est generalement atteint par cette operation.
Par exemple, dans:
69
heuristique conceptuelle
(i)
(ii)
(iii)
nature
de la t^ache
contrainte
cooclecteur
currence
une operation O
ne doit pas ^etre
eectuee
un etat E emp^eche l'application
d'une operation O
une operation O O est dangereuse
ne doit pas ^etre ou nefaste et O
eectuee
est irreversible
-
-
peut naturellement
supposer que O
doit ^etre executee
ne conna^!t pas E
commubut com- niquer
municatif
-
-
negation de O
-
negation de O
-
negation de O
Table 4.12. Heuristiques de selection: la prevention
(55) Utilisez une cle en croix pour desserrer les ecrous de la roue : : : ] N'enlevez pas
completement les ecrous.
la plupart du temps ou l'on desserre un ecrou, le but nal est de l'enlever. C'est pourquoi, l'instruction precise de ne pas atteindre ce but habituel.
Ce cas compte pour environ 75 % des preventions retrouvees.
(ii) Si un etat emp^eche l'execution d'une operation de base dans le contexte courant, mais le
lecteur ne conna^%t pas cet etat, il pourrait supposer que l'operation peut ^etre eectuee
une prevention est donc communiquee. Par exemple.
(56) En cas de feu, n'utilisez pas les ascenseurs .15
Ce cas compte pour 12.5 % des preventions retrouvees.
(iii) S'il est tres dangereux ou nefaste a la procedure qu'une operation soit eectuee et
que l'operation est irreversible, alors elle est communiquee en tant que prevention. Par
exemple,
(57) Ne jamais melanger de produits contenant de l'acide ou de l'ammoniaque avec
du javellisant au chlore.16
Cette situation compte pour 12.5 % des preventions du corpus.
On retrouve 21 preventions dans le corpus et les heuristiques ci-dessus, resumees a table 4.12,
semblent toutes les justier.
3.9. Les operations eventuelles
Pres de 1 % des expressions du corpus communiquent une operation eventuelle: une operation facultative que l'agent peut eectuer involontairement ou une operation obligatoire qu'il
pourra eectuer dans le futur. C'est le cas de:
15
16
Exemple hors-corpus. Cet exemple satisfait aussi l'heuristique (iii).
Exemple hors-corpus tire de DE93b].
70
heuristique autre
contrainte
concep- nature
cooctuelle de la t^ache
currence
(i)
l'operation O satisfait une heuristique des options
-
(ii)
l'operation O est
a executer
-
(iii)
l'operation O satisfait les heuristiques des operations sequentielles
-
O est applicable
maintenantmais
est aussi une regle
generale
O peut facilement ^etre mal
executee
premiere introduction de O
dans le texte
l'eet de la negation de O sera
incluse dans le
texte
O peut ^etre executee plus tard
commulecteur but com- niquer
municatif
-
-
O
-
-
negation de O
-
-
O
Table 4.13. Heuristiques de selection: l'operation eventuelle
(58) a. En tenant le pinceau a la verticale, dresse sur la pointe , on obtient des lignes nes.
b. Veriez-le de nouveau lorsque la voiture aura roule .
L'introduction d'operations eventuelles n'est inuencee que par la nature de la t^ache et les
cooccurrences d'elements semantiques. En eet:
(i) Si une operation facultative satisfait les heuristiques des options, mais en plus, forme
une regle generale (non seulement a eectuer maintenant, mais a se rappeler tout au
long de la procedure) elle est incluse la premiere fois comme operation eventuelle. C'est
le cas de l'exemple (58a).
(ii) S'il est facile d'executer une operation obligatoire en faisant une erreur. L'erreur eventuelle est alors speciee, suivie de son eet. Dans ce cas, c'est la negation de l'operation
a eectuer qui est communiquee comme une operation eventuelle. Par exemple:
(59) Presser \3" et \8" : : :] Si le second chire n'est pas presse dans les deux secondes , le canal 3 sera selectionne.
(iii) Toute operation obligatoire, qui satisfait les heuristiques des operations sequentielles,
mais qui ne doit pas necessairement ^etre executee tout de suite, est communiquee par
une operation eventuelle. C'est le cas dans (58b).
La premiere heuristique compte pour 65 % des cas du corpus, la seconde, pour 30 % et la
derniere pour 5 %. Celles-ci sont resumees a la table 4.13.
4. Resume
Dans ce chapitre, nous avons discute de la selection du contenu des textes d'instructions
c'est-a-dire comment choisir les elements semantiques a communiquer dans le texte. Les 9
elements semantiques les plus frequents dans les textes instructions ont ete presentes. Nous avons
71
remarque que leur introduction dans le texte depend de 5 types de contraintes: des contraintes
conceptuelles, des cooccurrences d'elements semantiques, les connaissances et intentions du
lecteur, la nature de la t^ache et le but communicatif du texte. Nous avons egalement deni la
notion d'operation de base comme etant les operations les plus facilement accessibles chez un
agent particulier et dans un domaine particulier. Finalement, pour chaque element semantique,
les heuristiques de selection ont ete speciees.
Le prochain chapitre s'interesse a la selection de la relation rhetorique la plus appropriee
pour communiquer un element semantique particulier.
72
textes de compréhension
textes hybrides
textes d’exécution
40
20
élément sémantique
Figure 4.7. E lements semantiques non-inuences par le but communicatif
opération éventuelle
prévention
option
opération co-temporelle
influence
condition matérielle
0
opération séquentielle
% d’occurences
60
73
textes de compréhension
textes hybrides
textes d’exécution
25
% d’occurences
20
15
10
5
0
attribut
effet
autre
élément sémantique
Figure 4.8. E lements semantiques inuences par le but communicatif
CHAPITRE 5
Selection de la structure rhetorique
Une fois un element semantique selectionne, il faut determiner le point de vue le plus approprie
pour le presenter cependant, la correspondance entre ces deux niveaux n'est pas directe. En
eet, un element semantique peut ^etre presente par plusieurs relations rhetoriques et, inversement, une relation rhetorique peut servir a presenter dierents elements semantiques.
Dans ce chapitre nous developpons les heuristiques pour selectionner la relation rhetorique
la plus appropriee dans un contexte donne: les heuristiques de presentation. D'abord les relations rhetoriques les plus frequentes dans les textes d'instruction sont presentees. Puis, tout
comme pour les heuristiques de selection, les contraintes gerant les heuristiques sont presentees.
Finalement, pour chaque element semantique, les heuristiques de presentation sont speciees.
1. Les relations rhetoriques dans les instructions
Parmi les relations rhetoriques de la RST, seul un ensemble restreint est couramment
utilise dans les textes d'instructions. Deux travaux anterieurs ont etudie la question des relations
rhetoriques dans les textes d'instructions Vander Linden VL93b] et R$osner et Stede RS92].
Pour Vander Linden, les 5 relations les plus importantes sont:
la sequence,
la precondition, que nous appelons c-condition,
le but (purpose),
le resultat,
la concurrence.
R$osner et Stede considerent aussi:
la limite (until),
l'alternative,
la sequence enumeree (step-sequence).
75
A notre tour, nous ajoutons:
la maniere (means),
l'elaboration.
Voyons maintenant chaque relation en detail.
1.1. La sequence
La sequence est une relation multi-nucleique ou les noyaux sont relies par une relation de
succession. On retrouve cette relation dans des phrases comme:
(60) Faire cuire les spaghettis, les egoutter et les saler au go^ut.
1.2. La c-condition
La c-condition est en fait une combinaison des relations de circonstance et de condition
de la RST. En eet, comme le notent R$osner et Stede, dans les instructions, de nombreuses
expressions tendent autant vers la condition que la circonstance. Par exemple dans:
(61) Remplir le reservoir de reserve jusqu'a la marque max avec le moteur froid .1
il n'est pas clair quelle relation est exprimee par avec le moteur froid . Pour ce genre
d'expressions, une relation combinant la circonstance et la condition a ete cree: la precondition.
Dans notre projet, pour eviter la confusion entre les preconditions au niveau de la planication
de t^ache et cette nouvelle relation rhetorique, nous appelons cette derniere une c-condition.
1.3. Le but
Le but presente une situation a realiser par l'intermediaire d'une autre activite celle presentee dans le noyau. Par exemple:
(62) Pour ne pas perdre l'ecrou-capuchon , revissez-le sur la lyre.
1.4. Le resultat
Le resultat inclut les resultats desires et non-desires de la RST (volitional et non-volitional
results). Dans un resultat, le noyau exprime une situation A qui a pu causer la situation B exprimee dans le satellite. Cependant, A est plus importante que B pour l'intention du redacteur
ce qui distingue les relations de resultat et de cause.
1.5. La concurrence
La concurrence n'est pas incluse dans la liste des relations de la RST. La concurrence
est multi-nucleique comme la sequence, mais les noyaux sont relies par une relation de cotemporalite. Par exemple:
1
Exemple hors-corpus tire de RS92].
76
(63) En tenant la canne horizontalement ou legerement inclinee vers le sol, on y envoie un
jet d'air rapide.
1.6. La limite
La limite est formee d'un noyau qui presente une operation et un satellite qui presente une
condition d'arr^et pour le noyau. R$osner et Stede precisent que la condition d'arr^et doit ^etre
facilement observable. Comme dans:
(64) Remplissez le radiateur avec du nouveau liquide de transmission jusqu'a la jauge .2
Dans notre corpus, cette relation est tres peu frequente. En eet, on ne retrouve que 16
relations de limite (1 % du corpus). Pour les operations ponctuelles, la limite est reliee au probleme de repetition que nous n'avons pas etudie et pour les operations duratives, l'introduction
des limites necessite une representation conceptuelle bien plus detaillee que des schemas d'operations utilises dans ce projet Roc92]. Pour ces raisons, notre analyse de corpus a inclus les
expressions de limite dans les expressions de leur noyau. En d'autres termes, les expressions de
limite n'ont pas ete considerees directement. Par exemple dans:
(65) Repeter ce geste jusqu'a ce que la personne rejette le corps etranger ou perde conscience .
toute l'expression en italique a ete consideree comme une operation sequentielle presentee
dans une sequence d'actions.
1.7. L'alternative
L'alternative indique plusieurs actions ou situations alternatives, mais qui ne sont pas en
contraste l'une avec l'autre. Par exemple:
(66) Si l'appareil est amene directement d'un endroit froid a un endroit chaud ou est place
dans une piece tres humide : : :]3
Dans ce projet, nous n'avons pas considere que la representation conceptuelle du domaine
puisse contenir des disjonctions4. De plus, dans notre corpus, on ne retrouve que 18 relations
d'alternative (1 % du corpus), c'est pourquoi nous n'avons pas considere cette relation. Dans
notre analyse, l'exemple (66) n'est donc pas decompose et toute l'expression est consideree
comme une c-condition.
1.8. La sequence enumeree
La sequence enumeree de R$osner et Stede se distingue de la sequence standard de la RST.
En eet, ces chercheurs considerent dierentes les operations presentees dans une liste enumeree
et les operations presentees dans des paragraphes mais, la distinction entre ces deux relations
Exemple hors-corpus tire de RS92].
Exemple hors-corpus tire de RS92].
Une option n'est qu'un etat a verier par l'agent lors de l'execution de la procedure et ne forme pas une
disjonction.
2
3
4
77
Relation rhetorique Nombre Proportion
sequence
c-condition
elaboration
but
maniere
resultat
concurrence
total
767
172
170
119
100
98
45
1471
52 %
12 %
12 %
8%
7%
7%
3%
101 %5
Table 5.14. Relations rhetoriques du corpus
n'est pas bien justiee. Nous ne sommes pas convaincue qu'une telle distinction existe du point
de vue rhetorique. Le fait de presenter une operation par une sequence dans un paragraphe ou
une sequence dans une enumeration est, nous croyons, une question de realisation motrice, et
ne devrait pas donner lieu a une nouvelle relation rhetorique.
1.9. La maniere
La maniere n'est pas directement consideree par Vander Linden. En eet, il ne distingue
pas entre la maniere et le but. Pour lui, les deux propositions:
(67) a. Faites Op en faisant Oe.
b. Pour faire Op , faites Oe.
presentent la relation hierarchique entre Op et Oe de la m^eme facon. D'apres Mann et
Thompson MT88], dans la relation de maniere (67a), en comprenant le satellite (en faisant
Oe ) le lecteur augmente son habilete d'eectuer l'operation du noyau (Op ), tandis que dans la
relation de but (67b), le satellite (pour faire Op ) presente une situation a realiser par l'execution
de l'operation du noyau (Oe). Nous distinguons alors, comme Mann et Thompson, entre la
maniere et le but.
1.10. L'elaboration
L'elaboration n'est pas une relation procedurale, mais presente des details additionnels sur
le noyau. Par exemple, le noyau peut presenter un ensemble et le satellite un membre particulier,
ou le noyau peut presenter un tout et le satellite une partie. Dans les textes d'instructions, le
noyau presente generalement un objet, et le satellite un attribut de l'objet.
La table 5.14 resume les relations retrouvees dans notre corpus et leur proportion. Le
lecteur attentif remarquera que certaines relations rhetoriques correspondent de tres pres a
certains elements semantiques. C'est le cas, par exemple, de la sequence et de la concurrence
tres apparentees aux operations sequentielles et aux operations co-temporelles. En fait, vu
78
l'importance de l'aspect temporel des operations dans les instructions, cet aspect est presque
toujours presente par les m^emes strategies rhetoriques et celles-ci sont choisies pour que le
lecteur le deduise de facon non-ambigu$e.
Les sections suivantes, expliquent comment le choix de la relation rhetorique est eectue.
2. Criteres des heuristiques
Tout comme pour la selection des elements semantiques, la selection des relations rhetoriques se base sur un certain nombre de contraintes:
le contenu et la structure de la representation semantique,
les cooccurrences de relations rhetoriques,
les connaissances et intentions du lecteur,
la nature de la t^ache.
Le but communicatif du texte ne semble pas inuencer comment un element semantique
est presente.
2.1. Le contenu et la structure de la representation semantique
Le critere le plus important pour determiner le choix d'une relation rhetorique est l'identite
des elements semantiques a presenter. Par exemple, une condition materielle n'est jamais communiquee par un resultat ou une maniere. Pour communiquer un element semantique particulier,
il existe donc un ensemble de relations rhetoriques adequates. Les liens entre relations rhetoriques et elements semantique sont presentees a la table 5.15. Comme l'illustre cette table, les
ensembles de relations rhetoriques pour presenter les elements semantiques ne sont pas mutuellement exclusifs. Il est clair de cette table, que certaines relations rhetoriques sont privilegiees
lorsqu'il s'agit de presenter un element semantique particulier. Ce phenomene ne contredit pas
l'approche de separer les questions semantiques et rhetoriques. En eet, sans cette distinction,
aucune diversite rhetorique ne serait possible. L'appendice B.3.2 presente les resultats en detail.
Nous voyons la representation semantique6 comme ayant une structure arborescente ressemblant a la structure de la representation conceptuelle. D'apres les etudes en psychologie
Dix87b, DFG88, DBFD92], cette representation doit inuencer la structure textuelle pour faciliter l'interpretation du texte. Dans notre corpus, nous avons eectivement remarque ce phenomene car la structure semantique inuence le choix d'une relation rhetorique. Par exemple,
pour presenter une inuence, deux relations rhetoriques sont disponibles: le maniere et le but. La
6
l'ensemble des elements semantiques a communiquer
79
E lement semantique Proportion Relations Exemple
rhetoriques
operation sequentielle
98% sequence
0.9 % but
0.8 % c-condition
Faites O1 . Faites O2 .
Faites O1 pour faire O2 .
Faites O1 avant de faire O2 .
condition materielle
90 %
4%
4%
2%
Si C est le cas,
Pour le cas C ,
Si C1 est vraie,] alors C2 l'est aussi.
Verier C .
attributs d'objets
c-condition
but
resultat
sequence
100 % elaboration
L'objet OB possede l'attribut A.
eet
68 % resultat
29 % but
4 % maniere
Faites Oe .] Op sera fait.
Pour faire Op , faites Oe .]
Faites O] en faisant Oe .
in uence
69 % maniere
31 % but
Faites Op en faisant Oe.
Faites Oe pour faire Op .
operation co-temporelle
100 % concurrence
En faisant O1 , faites O2 .
option
79 % but
21 % c-condition
Pour faire O,
Si vous voulez faire O,
prevention
86 % sequence
14 % maniere
Faites O1 ,]. Ne faites pas O2 .
Faites O1 ,] en evitant de faire O2 .
operation eventuelle
73 % c-condition
27 % maniere
Si vous faites O,
En faisant O,
Table 5.15. Presentation des elements semantiques
80
relation preferee depend, entre autres, du fait que l'operation sequentielle parent se decompose
en une seule operation sequentielle ou en un ensemble d'operations sequentielles.
2.2. Les cooccurrences de relations rhetoriques
Dans les textes d'instructions, certaines relations rhetoriques semblent co-dependentes,
tandis que certaines combinaisons ne se retrouvent jamais. Par exemple, si deux conditions
materielles equivalentes sont a communiquer, alors la plus facile a verier est presentee par une
c-condition, tandis que l'autre est presentee par un resultat. D'un autre c^ote, pour presenter
une inuence entre operations co-temporelles, on n'utilisera jamais une sequence reliee par
une relation de maniere a une concurrence, comme l'illustre l'exemple (68a). Dans ces cas, on
preferera un but relie a une concurrence, comme dans (68b).
(68) a. Faites A1 en faisant A2 tout en faisant A3.
b. Pour faire A1, faites A2 tout en faisant A3 .
2.3. Les connaissances et intentions du lecteur
Lors de la presentation des elements semantiques, les connaissances et intentions du lecteur
sont aussi a considerer. Par exemple, pour presenter une option, une c-condition ou un but sont
disponibles, comme dans:
(69) a. Si l'on souhaite une ligne plus large, alors s'attarder sur le verre de facon a laisser
s'ecouler plus de couleur.
b. Pour obtenir une ligne plus large, alors s'attarder sur le verre de facon a laisser
s'ecouler plus de couleur.
On prefere cependant une c-condition pour les lecteurs novices, car la nature optionnelle y
est plus explicite (69a). D'un autre cote, le but (69b) ne presente pas la nature optionnelle aussi
explicitement et est par consequent plus approprie pour des lecteurs experts qui ne risquent pas
d'interpreter le but comme etant obligatoire.
2.4. La nature de la t^ache
La nature de la t^ache inuence non seulement la selection des elements semantiques, mais
aussi la selection des relations rhetoriques. En eet, certaines relations rhetoriques sont plus
appropriees pour presenter certains types d'operations et d'etats. Par exemple, comme nous
verrons plus loin, une condition facile a evaluer sera plut^ot presentee par une c-condition,
tandis qu'une condition plus dicile a evaluer preferera un resultat. Aussi, un eet externe sera
plut^ot presente par un resultat, tandis qu'un eet interne preferera un but.
2.5. Le but communicatif
Les relations rhetoriques ne semblent pas inuencees par le but communicatif du texte.
En eet, dans notre corpus, un m^eme element semantique est presente par la m^eme relation
81
rhetorique peu importe s'il s'agit d'un texte d'execution, de comprehension ou hybride (cf. la
section 2.6 du chapitre 4).
La gure 5.9 illustre les resultats du corpus. Les attributs d'objets et les operations cotemporelles sont respectivement presentes par des elaborations et des concurrences independamment du type de texte. Les operations sequentielles sont presque toujours presentees par
des sequences d'actions dans les 3 types de textes. Les conditions materielles, les eets, les
inuences, les options et les preventions utilisent dierentes strategies rhetoriques dependant
du type de texte. Cependant, ces variations sont trop faibles pour determiner s'il s'agit de cas
isoles ou de tendances generales. De son c^ote, l'operation eventuelle est generalement presentee
par une maniere dans les textes de comprehension, tandis que dans les autres types de textes,
une c-condition est toujours utilisee. Cependant, le corpus ne contient que 1 % de cet element
semantique (15 occurrences) une etude plus approfondie est donc necessaire pour verier s'il
s'agit d'un cas general ou pas.
3. Heuristiques de presentation
Nous discutons maintenant des criteres pour selectionner la relation rhetorique la plus
appropriee pour communiquer un element semantique. Tout comme au chapitre 4, notons que
les heuristiques presentees possedent les caracteristiques suivantes:
elles sont reliees par une disjonction,
elles sont exhaustives,
elles sont presentees en ordre de preference.
3.1. Les operations sequentielles
Une operation sequentielle est presentee par 3 relations rhetoriques:
une sequence d'actions (98 % du temps), comme dans:
(70) Mettre le magnetoscope sous tension et placer le selecteur tv/vcr sur \vcr".
un but7 (0.1 %), par exemple:
(71) Veriez le commutateur de la douille ou reinstallez la douille pour ensuite] verier le commutateur du socle : : :]
Ici, on n'a pas aaire a un eet ou une inuence car il n'existe aucune relation de
generation entre les deux operations verier le commutateur de la douille ou reinstallez
7 DHP+ 94] ont etudie le cas d'operations sequentielles presentees par des buts et remarquent que ce choix
semble dependre de la langue de communication (cf. l'exemple (15a) du chapitre 2, section 3.2).
82
résultat
élaboration
concurrence
but
1 2 3
1 2 3
1 2 3
1 2 3
1 2 3
1 2 3
1 2 3
1 2 3
1 2 3
opération co-temporelle
option
opération éventuelle
prévention
1 textes d’exécution
influence
séquence d’actions
effet
2 textes hybrides
condition matérielle
manière
attribut d’objet
3 textes de compréhension
opération séquentielle
100
c-condition
% d’occurences
80
60
40
20
0
élément sémantique
Figure 5.9. Presentation des elements semantiques par rapport au but communicatif
83
la douille et verier le commutateur du socle . Les deux operations sont plut^ot reliees
par une permission.
une c-condition8 (0.8 %), comme dans les exemples (72a) et (72b),
(72) a. Retrait de la lyre:
: : :] sur certaines lampes, il faut enlever la douille avant de soulever la
lyre : : :]
Degagement de la douille:
: : :]
b. Appuyer sur la touche otr pour specier l'heure d'enregistrement.
Lorsque la touche est enfoncee une fois , `PM 10:35 (30 min)' sera ache.
Lorsque la touche est enfoncee deux fois , `PM 11:05 (1h)' sera ache.
Les heuristiques de presentation sont fonction de tous les types de contraintes: de la representation semantique, des cooccurrences, des connaissances du lecteur et de la nature de la
t^ache.
(i) On utilise une c-condition dans 3 cas distincts:
(a) Le lecteur croit que deux operations sequentielles O1 et O2 doivent ^etre executees
dans un certain ordre, mais en realite elles doivent ^etre executees dans l'ordre
inverse. C'est le cas dans (72a) ou le retrait de la lyre et le degagement de la
douille sont, dans le cas general, a executer dans cet ordre, comme indique par
les titres des procedures, mais dans le cas present les m^emes operations doivent
^etre executees dans l'ordre inverse. Dans ce cas, une des operations est presentee
par une sequence et l'autre par une c-condition. Ici, l'utilisation d'une c-condition
permet de mettre en valeur l'ordre temporel des operations.
(b) Un resultat ou une sequence d'actions suivra une operation sequentielle O dans
le texte et l'agent de O n'est pas necessairement l'agent du reste de la procedure.
Dans ce cas, la c-condition permet simplement d'indiquer que O doit ^etre faite,
mais sans preciser qui doit la faire.
(c) S est un ensemble d'operations sequentielles, enfants d'une operation sequentielle
Op Op sera incluse dans le texte par une sequence d'actions et les eets des
membres de S seront inclus par des resultats. C'est le cas de (72b). Dans ce cas,
chaque membre de S est presente par une c-condition.
(ii) On utilise un but comme dans (71) si O est une operation sequentielle de base dont
l'execution est contrainte par un ensemble de conditions modiables E. Une condition
est modiable si l'agent doit la verier ou faire en sorte qu'elle devienne vraie en
8
Ce phenomene est appele par Vander Linden la retrogradation rhetorique VLCM92b].
84
heuristique semantique
(ia)
(ib)
(ic)
(ii)
(iii)
O1 et O2 sont des
operations sequentielles a executer
dans un certainordre
cooccurrence
contrainte
lecteur
nature de
la t^ache
l'une des 2 opera- croit que O1 et O2
tions sera presentee sont a executer dans
par une sequence, l'ordre inverse
l'autre par une ccondition
O est une operation un resultat ou une
l'agent de O n'est
sequentielle
sequence suivra O
pas necessairement
dans le texte
l'agent de la procedure
Op est une opera- Op est incluse dans
tion sequentielle et le texte par une seS est un ensemble quence et les eets
d'operationssequen- de chaque membre
tielles, enfants de de S seront presenOp
tes par des resultats
O est une operation Oi sont inclus dans
O est de base, E
sequentiellecontrainte le texte par une
est modiable par
par un etat E
sequence
les operation Oi
O est une operation
sequentielle
relation
preferee
c-condition et
sequence
c-condition
chaque membre
de S par une ccondition
O par un but
sequence
Table 5.16. Heuristiques de presentation: l'operation sequentielle
executant une operation Oi qu'il conna^%t. Il existe donc un lien de permission9 entre
Oi et O. De plus pour utiliser un but, au moins un Oi doit ^etre communique dans le
texte et les Oi doivent ^etre presentes par une sequence. Par exemple, dans:
(73) Comprimez les bras de la lyre pour la replacer dans la barre de retenue.
replacer la barre ne peut ^etre execute que si les bras de la lyre sont comprimes. Cet etat
modiable forme ainsi une condition d'execution pour replacer la barre et l'operation
comprimer les bras permet l'operation replacer la barre .
(iii) Dans les autres cas, toute operation sequentielle O est presentee par une sequence
comme dans (70).
Ces heuristiques sont resumees a la table 5.16.
3.2. Les attributs d'objets
Comme le montrent les tables 5.15 (p. 79) et 5.17, pour presenter les attributs d'objets, la
relation d'elaboration est toujours utilisee. Par exemple,
(74) Une lampe a une seule douille comporte habituellement une lyre qui tient a une barre
de retenue par les manchons.
9 Dans l'implantation, les liens de g
eneration et de permission sont denis comme dans le projet de
DHP+ 94] (cf. le chapitre 2.)
85
heuristique semantique
(i)
A est un attribut
d'objet
cooccurrence
-
contrainte
lecteur
-
nature de
la t^ache
-
relation
preferee
elaboration
Table 5.17. Heuristiques de presentation: l'attribut d'objet
3.3. Les conditions materielles
Une condition materielle peut ^etre presentee par 4 relations rhetoriques:
la c-condition (91 % du temps), comme dans l'exemple:
(75) Si des bulles apparaissent autour de la valve c'est qu'il y a une fuite a cet endroit.
Faites-la remplacer par un mecanicien qualie.
le but (4 %), voir l'exemple (76),
(76) Pour verier] un commutateur ordinaire : : :], touchez la vis de la borne de
cuivre avec la pince du vericateur.
le resultat (4 %), par exemple:
(77) Si des bulles apparaissent autour de la valve c'est qu'il y a une fuite a cet endroit .
Faites-la remplacer par un mecanicien qualie.
la sequence (2 %), comme dans:
(78) Introduire la cassette (verier que la languette de la videocassette n'a pas ete
enlevee.)
On remarque que tous les types de contraintes (semantiques, de cooccurrences, les connaissances du lecteur et la nature de la t^ache) inuencent le choix de la relation rhetorique. En eet:
(i) Un resultat et une c-condition sont utilisees si 2 conditions materielles equivalentes
sont a communiquer. L'etat dicile a evaluer presente la condition fondamentale justiant la prochaine ligne d'actions. Cet etat est toujours presente par un resultat, et
l'etat plus facile a verier utilise une c-condition. C'est le cas dans (75) et (77). Aussi
dans:
(79) a. Au laboratoire incognito, si vous ^etes sur nil, vous ^etes sur une station
sparc-10 utilisez la procedure de ces machines.
b. Au laboratoire incognito, si vous ^etes sur une station sparc-10, vous ^etes
sur nil utilisez la procedure particuliere a cette machine.10
10
Exemples hors-corpus.
86
L'expression au laboratoire INCOGNITO denit le contexte dans lequel l'equivalence
des etats est veriee. En eet, si dans ce laboratoire seule la machine nil est un sparc10, les deux etats vous ^etes sur NIL et vous ^etes sur une station SPARC-10 sont equivalents. Dans (79a), la condition fondamentale pour utiliser la procedure des SPARC-10
est d'^etre sur un SPARC-10. La c-condition vous ^etes sur NIL n'est communiquee que
pour faciliter la t^ache au lecteur a determiner si eectivement il est sur un SPARC-10.
Ce dernier etat est donc presente par un resultat, et le premier par une c-condition. D'un
autre c^ote, dans (79b), la condition fondamentale pour utilisez la procedure particuliere
a nil est d'^etre sur nil. L'etat vous ^etes sur une station SPARC-10 n'est communique que pour aider le lecteur a determiner si eectivement il est sur nil ou non. C'est
pourquoi cette derniere condition est presentee par un resultat, et la premiere par une
c-condition.
(ii) Une sequence est utilisee dans le cas de conditions materielles modiables qui ne sont
pas relies a l'operation par une permission. C'est le cas de (78). En eet, Vander Linden
remarque que les conditions qui specient un etat modiable (un etat que l'agent doit
verier ou faire en sorte qu'il devienne vrai) sont presentees par une sequence VL93b].
C'est ce qu'il appelle la promotion rhetorique. Ce phenomene semble s'appliquer aussi
bien en francais que dans l'etude de Vander Linden.
(iii) Un but ou une c-condition avec ellipse du verbe sont utilises lorsque la condition materielle indique un type d'appareil/systeme, par exemple (76). Dans ce cas, la condition
materielle est aussi souvent presentee par les deux relations.
(iv) Dans tous les autres cas, les conditions materielles sont presentees par une c-condition,
comme dans (75).
Ces heuristiques sont resumees a la table 5.18.
3.4. Les eets
Comme l'indique la table 5.15 (p. 79), un eet peut ^etre presente par11.:
un resultat (68 %), comme dans les exemples (80a) et (80b),
(80) a. Brancher le cordon d'alimentation du magnetoscope dans une prise secteur
120V et appuyer sur l'interrupteur \power". Le voyant \power" s'allume
et l'horloge commence a clignoter.
b. Engagez le levier de vitesse rapidement dans chacune des positions : : :], cela
fait circuler le liquide de transmission .
11 DHP+ 94] notent qu'en anglais, un eet peut ^
etre presente par une sequence, mais ce phenomene n'a
pas ete retrouve dans notre corpus.
87
heuristique semantique
contrainte
cooclecteur
currence
nature de
la t^ache
CM1 CM2 , CM1
est di"cile a evaluer et CM2 est plus
facile
CM1 CM2 , CM1
est di"cile a evaluer
relation
preferee
(i)
CM1 et CM2 sont
des conditionsmaterielles
-
(i)
CM1 et CM2 sont
des conditionsmaterielles
-
sait evaluer CM2
(i)
CM1 et CM2 sont
des conditionsmaterielles
-
ne sait pas evaluer CM1 CM2 , CM2
CM1
est facile a evaluer
(i)
CM1 et CM2 sont
des conditionsmaterielles
-
ne sait pas evaluer CM1 CM2
CM1 mais sait evaluer CM2
(ii)
CM est une condition materielle
CM est une condition materielle
CM est une condition materielle
-
-
CM est modiable
-
-
-
-
CM specie le type c-condition ou
d'appareil
but
c-condition
(iii)
(iv)
-
CM1 par une
c-condition et
CM2 par un
resultat
CM1 par une
c-condition et
CM2 par un
resultat
CM1 par une
c-condition et
CM2 par un
resultat
CM1 par une
c-condition et
CM2 par un
resultat
c-condition
Table 5.18. Heuristiques de presentation: la condition materielle
un but (29 %), comme dans:
(81) Pour proteger les bornes contre la tension , nouez les extremites separees du cordon.
une maniere (4 %), par exemple:
(82) Vous pouvez voir le niveau de volume en observant la barre rouge sur la gamme
de 15 barres achees sur l'ecran.
Dans ce cas, l'eet lui-m^eme (vous pouvez voir) est presente dans une sequence d'action
et l'operation qui l'engendre (observer) lui est reliee par une maniere.
Le choix entre un but, un resultat et une maniere ne semble pas dependre de cooccurrences
de relations rhetoriques mais plut^ot des autres types de contraintes. En eet, considerons les
exemples suivants12:
(83) a. Pour eteindre la radio tournez le bouton volume completement a gauche.
b. E teignez la radio en tournant le bouton volume completement a gauche.
c. Tournez le bouton volume completement a gauche, la radio s'eteindra .
d. * Pour eteindre la radio , eteignez le moteur de la voiture.
e. * E teignez la radio en eteignant le moteur de la voiture.
f. E teignez le moteur de la voiture, la radio s'eteindra .
12
Exemples hors-corpus.
88
(84) a. * Pour allumer le temoin Caps Lock momentanement, enfoncez et rel^achez la touche
Caps Lock.
b. * Allumer le temoin Caps Lock momentanement, en enfoncant et en rel^achant la
touche Caps Lock.
c. Enfoncez et rel^achez la touche Caps Lock , le temoin Caps Lock s'allumera momentanement .
d. * Pour allumer le temoin Caps Lock momentanement , lancez le gestionnaire de
fen^etres x.
e. * Allumer le temoin Caps Lock momentanement, en lancant le gestionnaire de fen^etres x.
f. Lancez le gestionnaire de fen^etres x, le temoin Caps Lock s'allumera momentanement .
Ces exemples demontrent qu'un but ne peut ^etre utilise pour presenter un eet non-externe
que si l'agent desire atteindre l'eet, c'est le cas dans (83a). En eet, un but laisse implicitement
a l'agent le choix d'executer ou non la prochaine ligne d'operations. L'utilisation de cette relation
n'est donc adequate que si l'agent reconna^%t l'eet comme etant desirable et choisira lui-m^eme
d'executer la prochaine ligne d'operations. Cependant, un resultat et une maniere obligent le
lecteur a executer l'operation qui engendre l'eet. Ces relations peuvent donc ^etre utilisees
m^eme si l'eet n'est pas desire par le lecteur, c'est le cas de (83b) et (83c). Aussi, le but et la
maniere communiquent que l'operation qui suit est la methode normale pour atteindre l'eet,
c'est pour cela que les exemples (83e) et (83d) semblent inadequats tandis que le resultat
dans (83f) semble tout a fait correct.
Lorsqu'il s'agit d'une reaction de l'appareil, c'est-a-dire d'un eet externe a l'appareil et
directement engendre par un autre agent que l'agent principal de la t^ache, les relations de but,
de resultat et de maniere s'interpretent de la m^eme facon que s'il s'agissait d'eets non-externes.
Cependant une reaction n'est habituellement pas desiree par l'agent par exemple dans (84), en
temps normal, l'agent ne desire pas allumer le temoin Caps Lock. Habituellement, le temoin
Caps Lock n'est qu'un eet secondaire sans importance. Dans ce cas, les relations de but et
de maniere ne sont generalement pas preferee car elle mettent en evidence l'importance de cet
eet.
De ces observations, les regles suivantes peuvent ^etre formulees:
(i) Un resultat est toujours utilise s'il s'agit d'une reaction de l'appareil, car l'eet est
generalement un eet secondaire non desirable c'est le cas dans (80a), (84c) et (84f).
(ii) Un but est utilise si le lecteur sait ou peut deviner que l'eet est desirable et si la
methode decrite est la facon normale pour realiser l'eet c'est le cas dans (81) et
(83a).
89
heuristique semantique
cooccurrence
(i)
E est un eet
(ii)
E est un eet
-
(iii)
E est un eet
-
(iii)
E est un eet
-
-
contrainte
lecteur
nature de
la t^ache
relation
preferee
E est une reaction resultat
(un eet externe engendre par un autre
agent que l'agent
principal)
sait ou peut deviner l'operation qui en- but
que E est desirable gendre E est la methode normale d'engendrer E
ne peut deviner que
resultat
E est desirable
l'operation qui en- resultat
gendre E est la methode normale d'engendrer E
-
Table 5.19. Heuristiques de presentation: l'eet
(iii) Un resultat est aussi utilise si le lecteur ne peut deviner qu'un eet est desirable,
comme dans (80b) et (83c) ou lorsque la methode decrite pour realiser l'eet n'est
pas la methode normale, comme dans (83f). Dans ce cas, le resultat assure que l'agent
eectuera la ligne d'operation speciee.
Une maniere est utilisee si le lecteur ne peut deviner que l'eet est desirable et si l'operation
qui engendre l'eet est la methode normale. Cependant, dans cette situation, un resultat est
toujours disponible. Comme on ne retrouve que 4 % de maniere dans notre corpus, mais 68 % de
resultat, il semble preferable d'utiliser cette derniere relation. Ces heuristiques sont recapitulees
a la table 5.19.
3.5. Les inuences
L'inuence est un peu speciale car il s'agit plut^ot d'une relation et non d'un element
semantique. L'inuence existe entre deux ensembles d'operations: une operation-parent et une
ou plusieurs operations-enfants. En contraste avec les autres elements semantiques, le noyau
de la relation rhetorique utilisee n'est pas xe: il depend de la relation rhetorique choisie.
L'inuence peut ^etre presentee par:
une relation de maniere (69 %), comme dans les exemples (85a), (85b) et (85c) dans
ce cas le noyau est constitue de l'operation parent,
(85) a. La paraison est centree soit en utilisant le marbre , soit en la roulant dans une
forme creusee dans du bois, appelee \mailloche" .
b. Avec un tournevis plat , grattez la salete accumulee sur le contact.
c. Regler la ceinture en la tirant par la languette .
90
une relation de but (31 %), voir les exemples (86a), (86b) et (86c) dans ce cas le noyau
est forme des operations-enfants.
(86) a. Si la bo^%te-pont est munie d'une jauge d'huile, tirez-la hors du tube de remplissage, essuyez-la, reinserez-la completement et retirez-la de nouveau pour
lire le niveau d'huile .
b. Tourner cette touche a droite et a gauche pour minimiser les parasites .
c. Rouler le pinceau en le tirant vers soi de facon a reformer la pointe .
Il est a noter que pour des raisons grammaticales, toutes les operations-enfants sont presentees par une m^eme relation rhetorique les inuences dans:
(87) Pour faire Ogp , faites Op en faisant Oe1 et Oe2.
mettent en jeu des operations de trois niveaux d'abstraction dierents cependant, les
operations du m^eme niveau (Oe1 et Oe2) sont toutes deux presentees par la m^eme relation (la
maniere).
Les heuristiques13 impliquees dans le choix de la relation rhetorique dependent du contexte
textuel et de la nature de la t^ache.
(i) une maniere est utilisee si:
(a) Plus d'une operation-enfant sont a presenter et l'une d'elle precise l'utilisation
d'un instrument14. Par exemple, dans (85a), l'utilisation du marbre dicte le choix
d'une maniere pour toutes les operations-enfants.
(b) Une seule operation-enfant Oe est a presenter et Oe specie l'utilisation d'un
instrument particulier. Dans ce cas, une maniere est generalement utilisee, mais
avec ellipse du verbe utiliser , comme dans (85b).
(c) Une seule operation-enfant Oe est a presenter, et son operation-parent Op est
une operation de base. Dans ce cas, l'inuence est generalement vue en aval (le
noyau est forme de Op et le satellite de Oe ) par une maniere, comme dans (85c).
(ii) une relation de but est utilisee si:
Ces heuristiques n'expliquent pas tous les phenomenes du corpus. Par exemple, dans le manuel de
magnetoscope du corpus, on retrouve les etapes:
(88) 5. Selectionner le canal a regler en appuyant sur le selecteur de canal .
6. :: : ]
7. Appuyer sur la touche de reglage de canal (channel set) pour regler le canal de reception.
Ici, dans le m^eme contexte textuel et dans la m^eme t^ache, la premiere fois une maniere est utilisee et la
seconde fois, un but est utilise.
14 En eet, dans le corpus, l'utilisation d'un instrument n'est exprim
ee par une sequence d'action independante (par exemple, utiliser tel instrument ) qu'a une seule reprise. Tous les autres instruments sont species
par une maniere.
13
91
heuristique semantique
(ia)
(ib)
(ic)
(iia)
(iib)
(iic)
Se et Op communiquent une in uence
et Se est un ensemble
Oe et Op communiquent une in uence
et Oe n'est pas un
ensemble
Oe et Op communiquent une in uence
et Oe n'est pas un
ensemble
Se et Op communiquent une in uence
et Se est un ensemble
Se et Op communiquent une in uence
et Se est un ensemble
Oe et Op communiquent une in uence
et Oe n'est pas un
ensemble
cooccurrence
contrainte
lecteur
nature de
la t^ache
un membre de Se
indique l'utilisation
d'un instrument
Oe indique l'utilisation d'un instrument
-
-
-
-
-
Op est de base
-
les membres Se ne
doivent pas ^etre executes en sequence
aucun membre Se
n'indiquel'utilisation
d'un instrument
Oe est de base
-
-
-
-
relation
preferee
Se par une maniere, Op par
une sequence
Oe par une maniere, Op par
une sequence
Oe par une maniere, Op par
une sequence
Op par un but,
Se par une autre
relation
Op par un but,
Se par une sequence
Op par un but,
Oe par une sequence
Table 5.20. Heuristiques de presentation: l'inuence
(a) Les operations-enfants ne peuvent ^etre presentees par une maniere car elles ne
doivent pas ^etre executees en sequence. C'est le cas dans (86c) ou les operationsenfants (rouler et tirer ) sont reliees par une concurrence. Ici, l'utilisation d'une
maniere produirait:
(89) * Reformer la pointe en roulant le pinceau tout en le tirant vers soi.
qui ne semble pas naturel.
(b) Plus d'une operation-enfant sont a presenter et aucune ne precise l'utilisation
d'un instrument. C'est le cas de (86a).
(c) Une seule operation-enfant Oe est a presenter et Oe est une operation de base.
Dans ce cas, la relation est vue en amont comme dans (86b).
Notons que les deux heuristiques (ic) et (iic) encouragent l'operation de base a ^etre vue
comme l'operation principale a executer en la presentant dans le noyau de la relation. La
table 5.20 resume les heuristiques.
92
heuristique semantique
(i)
contrainte
relation
cooclecteur nature de preferee
currence
la t^ache
O1 et O2 sont des operations cotemporelles
-
-
-
concurrence
Table 5.21. Heuristiques de presentation: l'operation co-temporelle
3.6. Les operations co-temporelles
Comme l'illustrent les tables 5.15 (p. 79) et 5.21, l'operation co-temporelle est toujours
presentee par une concurrence15 . Par exemple:
(90) a. Rouler le pinceau en le tirant vers soi de facon a reformer la pointe.
b. En tenant la canne horizontalement ou legerement inclinee vers soi, on y envoie un
jet d'air rapide.
c. En souant, il tourne la canne, en la tenant a un angle de 45 degres.
3.7. Les options
Les options peuvent ^etre presentees dans le texte par:
un but (79 % des cas ), comme dans:
(91) Tirer la roue et le pneu pour vous aider , poussez fermement le anc du pneu
avec votre pied.
une c-condition (21 %), comme dans:
(92) Si l'on souhaite une ligne plus large , alors s'attarder sur le verre de facon a laisser
s'ecouler plus de couleur.
Comme l'illustre la table 5.22, il semble que le choix de relation rhetorique ne depende que
de contraintes semantiques et de la nature de la t^ache:
(i) Un but est utilise si l'option sera probablement suivie par l'agent comme dans (91).
(ii) D'un autre cote, une c-condition presente les options qui ont autant de chance d'^etre
suivies que rejetees. C'est le cas de (92).
En eet, la c-condition rend le choix de l'agent bien plus explicite en utilisant des expressions comme si vous voulez tandis que le but exprime l'option de facon moins explicite, ainsi
rendant la possibilite de rejet moins evidente.
3.8. Les preventions
La prevention peut ^etre communiquee par:
Il ne faut pas confondre la relation de concurrence et la relation de maniere qui, en francais, sont toutes
deux realisees grammaticalement par un gerondif (ex. en souant ). Dans le cas d'une concurrence, il est possible
d'ajouter l'adverbe tout devant le gerondif (ex. tout en souant ) sans alterer le sens de l'expression, tandis que
la maniere ne peut se realiser par tout + gerondif. En anglais, la distinction est plus frappante car la maniere
est realisee par un gerondif tandis que la concurrence est realisee sans la preposition by et avec une preposition
while, meanwhile, : : : VL93b]
15
93
heuristique semantique
(i)
OP est une option
(ii)
OP est une option
cooccurrence
contrainte
lecteur
-
-
-
-
nature de
la t^ache
relation
preferee
OP sera probable- but
ment suivie par le
lecteur
OP ne sera pas c-condition
probablementsuivie
par le lecteur
Table 5.22. Heuristiques de presentation: l'option
heuristique semantique
(i)
(ii)
P est une prevention
P est une prevention
cooccurrence
contrainte
lecteur
-
-
nature de
la t^ache
relation
preferee
P est de type DONT sequence
P est de type neg- maniere
TC
Table 5.23. Heuristiques de presentation: la prevention
une sequence (86 %), voir les exemples (93a) et (93b)
(93) a. Une fois le mors de la canne rechaue, il ne faut pas le plonger dans la masse
de verre en fusion : : :]
b. Secouez doucement le capuchon pour le degager, sans le tourner .
une maniere (14 %), comme dans:
(94) On soutire a nouveau le vin en prenant soin de ne pas deranger la lie et en
s'eorcant de laisser entrer le moins d'air possible.
Comme l'illustre la table 5.23, l'etude de Di Eugenio DE93b] explique ces phenomenes.
En eet:
(i) Toutes les preventions de type DONT sont presentees par des sequences d'actions
negatives, comme dans (93a) et (93b).
(ii) Dans notre corpus, une maniere presente toujours les neg-TC16 (negation de la forme
en prenant soin de ne pas ), comme dans (94). Notons, cependant, que notre corpus ne
compte que 3 neg-TC.
3.9. Les operations eventuelles
L'operation eventuelle est presentee par:
une c-condition (73 %), comme dans (95a) et (95b),
16 Ceci ne semble pas ^
etre le cas en anglais. En eet, le corpus de DE93b] compte de nombreux neg-TC
presentes par des sequences d'actions.
94
heuristique semantique
(i)
O est une operation
eventuelle
(i)
O est une operation
eventuelle
O est une operation
eventuelle
(ii)
cooccurrence
contrainte
lecteur
-
-
-
-
-
-
nature de
la t^ache
O est une regle
generale mais son
execution n'est pas
immediate
O est une regle
generale
O est une erreur de
l'agent
relation
preferee
c-condition
c-condition
ou maniere
c-condition
Table 5.24. Heuristiques de presentation: l'operation eventuelle
(95) a. Si vous selectionnez un numero de canal qui n'est pas dans la capacite de
ce poste de tv, le poste selectionnera automatiquement le canal memorise le
plus inferieur.
b. En tenant le pinceau a la verticale, dresse sur la pointe , on obtient des lignes
nes lorsqu'on le couche doucement sur le verre, la ligne s'epaissit progressivement.
une maniere (27 %), comme dans:
(96) En tenant le pinceau a la verticale, dresse sur la pointe, on obtient des lignes nes
lorsqu'on le couche doucement sur le verre , la ligne s'epaissit progressivement.
Pour presenter une operation eventuelle, le choix ne depend que de la representation semantique et de la nature de la t^ache.
(i) La c-condition et la maniere se chargent toutes deux des operations eventuelles qui
expriment des regles generales. Ces deux relations semblent interchangeables, mais si
l'operation ne doit pas ^etre executee immediatement, alors la c-condition est preferee
car elle permet de mieux exprimer les notions temporelles. Par exemple, dans (95b)
et (96) on retrouve deux regles generales presentees par les deux relations rhetoriques.
(ii) La c-condition est toujours utilisee si l'operation indique une erreur de l'agent. C'est
le cas dans (95a).
La table 5.24 resume ces heuristiques de presentation.
4. Resume
Dans ce chapitre, nous avons discute de la selection de la structure rhetorique: comment
choisir la relation rhetorique la plus appropriee pour presenter un element semantique. Les 7 relations rhetoriques retrouvees dans les textes d'instructions francais ont ete presentees il s'agit
de la sequence, la c-condition, l'elaboration, le but, la maniere, le resultat et la concurrence. Ensuite, nous avons identie les 4 types de contraintes inuencant leur utilisation: des contraintes
95
semantiques, des cooccurrences de relations rhetoriques, les connaissances et intentions du lecteur et la nature de la t^ache. Nous avons aussi demontre que, malgre son inuence sur le choix
des elements semantiques, le but communicatif ne change pas le choix des relations rhetoriques.
Finalement, les heuristiques de presentation ont ete presentees en detail pour chaque element
semantique.
Au prochain chapitre, nous verrons comment les heuristiques de selection du chapitre 4 et
les heuristiques de presentation de ce chapitre ont ete implantees dans le systeme spin pour
generer des textes d'instructions.
CHAPITRE 6
Implantation: le systeme SPIN
Jusqu'a present, cette these a analyse la question de planication de textes d'instructions d'un
point de vue theorique. Ce chapitre va maintenant considerer la question sous un angle plus
pratique. En eet, ce chapitre decrit le systeme informatique spin, un systeme de generation de
texte qui implante le modele de generation d'instructions presente aux chapitres precedents. Il
suit le modele illustre a la gure 3.5 et les heuristiques de selection et de presentation developpees
aux chapitres 4 et 5.
A partir d'une representation conceptuelle du domaine, spin utilise une technique hierarchique de planication de t^ache pour construire une representation conceptuelle de la t^ache a
accomplir. Le systeme utilise ensuite un ensemble de regles pour appliquer les heuristiques de
selection et de presentation et ainsi selectionner le contenu et la structure rhetorique du texte.
spin eectue ensuite les realisations linguistiques et motrices pour produire un texte en langue
naturelle.
Dans ce chapitre, nous decrivons d'abord l'architecture generale du systeme, puis chaque
etape est detaillee et illustree a l'aide d'un exemple de texte genere. L'analyse des resultats de
spin sera discutee au chapitre 7.
1. Description generale de SPIN
spin a ete developpe an de verier les heuristiques des chapitres 4 et 5 c'est pourquoi
l'emphase du systeme a ete mise sur la selection du contenu et de la structure rhetorique.
Les autres etapes de la generation ont egalement ete implantees an d'eviter de simplier le
phenomene que l'on etudie en deleguant les problemes diciles a un autre module. Nous evitons
ainsi de supposer que le module precedent procurera au planicateur de texte toute l'information
dont il a besoin et que le module suivant s'accommodera de l'information que le planicateur
produira.
Comme l'illustre la gure 6.10, spin possede une architecture lineaire. Dans cette gure,
les rectangles indiquent les processus et les rectangles arrondis, les bases de connaissances. Les
97
requête initiale
planification de tâche
représentation conceptuelle
de la tâche
représentation conceptuelle
du domaine
nature de
schémas
d’opérations
la tâche
sélection des éléments
sémantiques
éléments sémantiques
planification
de texte
modèle du lecteur
schémas
d’opérations
structuration sémantique
structure sémantique
sélection des
relations rhétoriques
relations rhétoriques
structuration sémantique
structure rhétorique
sélection de la
structure grammaticale
réalisation
linguistique
structure grammaticale
réalisation
lexico-morphologique
lexique
Bescherelle
texte non-formatté
réalisation motrice
texte
Figure 6.10. Processus de generation de spin
nature de
la tâche
98
tache plan.pl
planication de t^ache
semantique.pl
selection des elements semantiques
structure s.pl
texte plan.pl
planication de texte
spin.pl
structuration semantique
rhetorique.pl
selection des relations rhetoriques
structure r.pl
structuration rhetorique
grammaire.pl
linguistique.pl
realisation linguistique
selection de la structure grammaticale
lexi-morpho.pl
realisation lexico-morphologique
moteur.pl
realisation motrice
Figure 6.11. Modules hierarchiques de spin
structures de donnees utilisees et generees sont en italiques, tandis que les processus en caracteres gras indiquent l'emphase du systeme. Finalement, les liens pleins indiquent le cheminement
de la generation, tandis que les liens pointilles indiquent les consultations et mises a jour des
bases de connaissances.
spin est ecrit en Prolog et utilise le formalisme de grammaire a clauses denies (DCG)
PW80]. Prolog est un langage de choix car l'unication et le retour arriere, deux mecanismes
abondamment utilises pour le traitement de la langue naturelle, y sont predenies. Excluant
la representation conceptuelle du domaine et le modele du lecteur, spin compte environ 6 000
lignes de code.
spin est compose de 11 modules de processus organises de facon hierarchique. Quatre
autres modules sont consultes au besoin la representation conceptuelle du domaine et le modele du lecteur sont charges dynamiquement. L'organisation des modules est schematisee aux
gures 6.11 et 6.12. Ce systeme prototype a ete teste sur 9 versions dierentes de 3 textes du
corpus d'analyse et sur dierentes versions de 5 textes d'un corpus test. Ces resultats, presentes a l'appendice E, seront discutes au chapitre 7. Sur une station sparc-10, la version
Quintus interpretee prend un maximum de 2 secondes pour generer ces textes d'une dizaine de
propositions.
99
: ltreur des connaissances du lecteur
filtre.pl
: lexique
dico.pl
: conjugueur de verbes
bescherelle.pl
: predicats utilitaires
utilitaires.pl
Figure 6.12. Modules non-hierarchiques de spin
Le lancement d'une requ^ete s'eectue par le predicat principal spin/61 ou les arguments
sont respectivement: 1) l'etat du monde desire, 2) l'etat du monde actuel, 3) le chier contenant
la representation conceptuelle du domaine, 4) le chier contenant le modele du lecteur, 5) le
but communicatif du texte et 6) le mode de deverminage (allume ou eteint). Par exemple, la
requ^ete:
spin(programm
e(obj: enregistrement, qual: d'1h 30 min par une touche incr
ementielle)],
dans(obj: cassette, lieu: vid
eo)],
'Specifications/vcr_spec.pl',
'Modele_Lecteur/VCR/novice.pl',
execution,
non).
genere un texte d'instructions pour programmer un enregistrement, supposant que dans
l'etat courant, il y a une cassette dans le video. spin utilisera la representation conceptuelle du domaine du chier Specifications/vcr spec.pl et le modele de lecteur du chier
Modele Lecteur/VCR/novice.pl.Le texte g
enere sera une liste d'execution et le mode de deverminage eteint fera en sorte que les structures intermediaires ne seront pas achees. Le resultat
de cette requ^ete est illustre a la gure 6.13. En suivant la production de ce texte, etudions
maintenant chaque etape de spin.
2. La planication de t^ache
Le but du planicateur de t^ache est de construire une representation conceptuelle de la
t^ache a accomplir a partir d'une representation conceptuelle du domaine. La representation de la
t^ache sera ensuite passee au planicateur de texte qui construira une representation rhetorique
du texte.
Pour se pencher sur des phenomenes particuliers de la planication de t^ache, dierentes
approches ont ete developpees. On retrouve, par exemple, la planication par squelettes Fri79],
1
On peut aussi utiliser le predicat spin/0 et se laisser guider par le menu.
100
Programmation d'un enregistrement d'1h 30 min par une touche incr
ementielle
- Pour une meilleure qualit
e d'image,
- S
electionnez le canal 4 en appuyant
- Appuyez sur la touche OTR 3 fois.
Lorsqu'elle est enfonc
ee 1 fois, PM
Lorsqu'elle est enfonc
ee 2 fois, PM
Lorsqu'elle est enfonc
ee 3 fois, PM
- Appuyez sur la touche TIMER dans un
r
eglez le s
electeur de vitesse de bande sur SP.
sur la touche de canal.
10:35
11:05
11:35
d
elai
(30min).
(1 h).
(1 h 30min).
de 9 secondes.
Figure 6.13. Le texte vcr de spin
par cas Ham89, RS89] ou opportuniste HR80]. Cependant, depuis le systeme abstrips Sac74]
la majorite des planicateurs generaux ont suivi une technique hierarchique pour construire des
plans non-lineaires.
Un plan est un ensemble ou sequence d'operations a executer par un agent unique pour
atteindre un but All91]. Un plan est lineaire s'il est produit par un planicateur qui ordonne
les operations de facon totale. Un tel planicateur est en fait sur{contraignant car il impose
articiellement un ordre de succession entre toutes les operations, m^eme celles dont l'ordre
d'execution est independant. Un plan est dit non{lineaire si le planicateur qui l'a produit
n'ordonne que les operations qui sont obligatoirement contraintes par un ordre. Dans un tel plan,
les operations suivent alors un ordre partiel. Un planicateur est hierarchique s'il genere une
hierarchie de plans ou le niveau le plus eleve est un plan abstrait ne contenant que les operations
importantes, tandis que les niveaux inferieurs contiennent des operations plus detaillees. Les
planicateurs hierarchiques a plans non-lineaires possedent de nombreux avantages:
Du point de vue operationnel, ces planicateurs sont plus ecaces. En eet, en ne surcontraignant pas l'ordonnancement des operations du plan, le systeme peut resoudre
certains problemes directement, sans eectuer de retour-arriere. Dans un plan lineaire,
un plan trop strict force l'utilisation inecace du retour-arriere. Aussi, la planication
hierarchique oblige les systemes a formuler un plan complet a chaque niveau d'abstraction avant d'entamer le niveau suivant. Ils peuvent donc detecter plus rapidement les
branches qui aboutissent a un echec. De plus, de tels planicateurs conservent un grand
nombre d'informations sur la structure du plan si un retour arriere doit avoir lieu, une
grande partie de l'information est deja disponible.
Du point de vue de la representation de connaissances, la hierarchie de plans produite
est plus detaillee et plus naturelle qu'un seul plan non-lineaire.
Finalement, de nombreux psychologues croient qu'un plan est mentalement represente
par une decomposition successive d'operations (cf. le chapitre 2), cette approche est
donc motivee psychologiquement.
101
Pour ces raisons, spin utilise une approche hierarchique pour developper des plans nonlineaires. Lors du developpement du planicateur de t^ache de spin, 2 criteres etaient importants:
Le code source du planicateur de t^ache doit ^etre disponible. En eet, typiquement,
un plan en intelligence articielle est execute par un agent capable de prendre peu
de decisions il ne peut donc pas contenir de points de choix. Le planicateur typique
doit donc tenter de satisfaire les preconditions d'une operation avant de la selectionner.
Cependant, dans notre cas, le plan, visant un agent humain, peut contenir de nombreux
points de choix. Le planicateur de spin doit donc verier les preconditions au moment
du developpement du plan, cependant, si elles ne peuvent ^etre satisfaites, l'operation
doit quand m^eme ^etre retenue et au moment de l'execution, ses preconditions seront
re-veriees2 .
Le module doit generer une representation de t^ache en un temps assez court.
Apres avoir etudie et teste certains planicateurs du domaine public nous avons choisi de
developper notre propre systeme. En ce qui concerne nos predecesseurs, le systeme de generation de Mellish Mel88] utilise une traduction Prolog de la sortie du planicateur nonlin
Tat76] Vander Linden ne fait que supposer l'existence d'un planicateur de t^ache VL93b] et
nalement, Dale a construit lui-m^eme son planicateur de t^ache pour epicure Dal92].
Avant de decrire le fonctionnement du module de planication de t^ache, voyons en quoi
consiste son entree et sa sortie.
2.1. L'entree du planicateur de t^ache
Le planicateur de t^ache de spin agit de facon conventionnelle: a partir d'une description du
monde desire et du monde courant, il tente de trouver une suite d'operations pour transformer le
monde de l'etat courant a l'etat desire. Les operations disponibles sont decrites par des schemas
d'operations faisant partie de la representation conceptuelle du domaine (cf. la gure 6.10). La
gure 6.14 illustre un schema d'operation tire du chier vcr spec.pl (presente integralement
a l'appendice D). Comme l'illustre la gure 6.14 et l'appendice D, les schemas contiennent un
certain nombre d'expressions lexicales toutes faites.
Les schemas indiquent:
le nom de l'operation, par exemple programmer un objet X,
les preconditions: l'etat requis pour eectuer l'operation, par exemple une cassette
doit ^
etre dans l'appareil vid
eo,
2
C'est ce que Sac77] appelle des execution-time conditionals.
102
op(programmer(obj:X, qual: d'1h 30 min par une touche incr
ementielle)) :precond(dans(obj: cassette, lieu: vid
eo)]),
corps(r
egler(obj: s
electeur de vitesse de bande, dest: SP),
s
electionner(obj: canal 4),
sp
ecifier(obj: heure d'enregistrement d'1h 30 min),
appuyer(dest:touche TIMER, qual:dans un d
elai de 9 secondes)]),
succes(ajout(programm
e(obj: X, qual: d'1h 30 min par une touche incr
ementielle))]),
echec(ajout(neg(programm
e(obj: X, qual: d'1h 30 min par une touche incr
ementielle)))]).
Figure 6.14. Exemple de schema d'operation pour le texte vcr
le corps: les operations-enfants a accomplir pour executer l'operation courante par
exemple, regler le selecteur de vitesse de bande sur SP, selectionner le canal
4, sp
ecifier l'heure d'enregistrement d'1h 30 min et appuyer sur la touche
TIMER dans un d
elai de 9 secondes,
les postconditions de succes: les modications (ajouts et retraits) a l'etat courant
du monde si l'operation est correctement executee, par exemple ajouter que X sera
programm
e,
les postconditions d'echec: les modications (ajouts et retraits) a l'etat courant du
monde si l'operation n'est pas correctement executee, par exemple ajouter que X ne
sera pas programm
e.
Comme on peut le constater, la syntaxe des schemas est basee sur la logique de predicats
de plus, les variables permettent de generaliser les operations et par unication les adapter
a un cas particulier rappelons du chapitre 2 que l'utilisation de variables dans les schemas
d'operations est motivee psychologiquement.
Lorsque des schemas d'operations sont utilises comme source pour la planication de t^ache
puis pour la planication de texte, le texte genere est assez dependant de la structure et du
contenu des schemas. Cependant, les schemas d'operations ne sont pas universels a tous les
agents plusieurs facteurs peuvent inuencer leur developpement. La disponibilite lexicale de la
langue utilisee, par exemple, peut inuencer le decoupage d'operations. Aussi, independamment
de la langue utilisee, une m^eme t^ache peut ^etre modelisee de dierentes facons (avec plus ou
moins de details, une structure diverse, : : :). M^eme lorsque deux redacteurs humains redigent
des instructions \naturelles" pour une m^eme procedure, ils peuvent baser leur redaction sur des
representations conceptuelles non-identiques.
Par exemple, en reprenant le schema de la gure 6.14, nous avons choisi de classier
dans(obj: cassette, lieu: vid
eo) en tant que pr
econdition a la programmation du magnetoscope. En eet, d'un point de vue pratique, l'operation de mettre une cassette dans le
103
magnetoscope peut avoir ete eectuee bien avant la programmation. Dans ce cas, cette etape
ne doit pas ^etre toujours executee et ainsi elle ne peut ^etre consideree comme une sous-etape de
programmer. D'un autre c^
ote, aucune cassette ne devrait rester inutilisee dans un magnetoscope
pour ne pas risquer de l'ab^%mer. D'un point de vue theorique, l'utilisateur doit alors toujours
inserer une cassette lors d'un enregistrement cette etape pourrait alors ^etre consideree dans le
corps et non dans les pr
econditions. Non seulement la structure, mais aussi, le contenu de la
representation conceptuelle peut ^etre subjectif. Avant de programmer un magnetoscope, est-il
necessaire de s'assurer qu'il y ait pas de panne d'electricite, que l'appareil soit branche, qu'il
soit fonctionnel, que son panneau avant soit accessible, : : : ? Inversement, lors de la lecture d'un
m^eme texte, deux lecteurs peuvent construire dierentes representations conceptuelles l'un de
l'autre.
Il ne peut donc pas exister une unique representation conceptuelle modelisant une procedure particuliere. Notre but n'est pas de construire et d'utiliser l'unique representation conceptuelle permettant au systeme de generation de reproduire un texte source mot pour mot, mais
plut^ot de produire des textes \possiblement naturels" a partir d'une representation conceptuelle
\possiblement naturelle".
2.2. La sortie du planicateur de t^ache
Le resultat de la planication de t^ache, la representation conceptuelle de la t^ache, est
un reseau procedural Sac77]. Les n&uds du reseau font reference au schema d'une instance
d'operation (act token) comme denies par Goldman Gol70] (cf. le chapitre 2). En eet, un
n&ud fait reference a une operation eectuee par un agent precis a un moment precis et non a
un type generique d'operation. Cette distinction est importante, par exemple, si une t^ache se
decompose de la facon suivante:
1. presser sur le bouton OPEN/CLOSE
2. mettre un disque compact
2.1. ouvrir le bottier du disque
2.2. sortir le disque
2.3. placer le disque
3. presser sur le bouton OPEN/CLOSE
elle requiert 6 instances d'operations, mais 5 types d'operations (car le type d'operation
presser sur le bouton OPEN/CLOSE est ex
ecute aux instances 1 et 6). Dans ce cas, la representation conceptuelle de la t^ache est formee de 6 n&uds distincts faisant reference aux
6 instances d'operations. Aussi, si la m^eme instance d'operation se retrouve dans dierents
plans (dierents niveaux dans la representation de la t^ache) elle ne sera pas distinguee dans ces
dierents plans et sera etiquetee par le m^eme identicateur.
104
plan 1
n1
n2
n3
n2
n2
n6
n6
n4
n7
n8
n9
plan 2
n5
plan 3
n5
n10
n5
plan 4
Figure 6.15. Representation conceptuelle de la t^ache pour le texte vcr
Les n&uds de la representation de la t^ache sont relies par deux types de liens:
Un lien hierarchique entre une operation et ses operations-enfants. Ces liens forment
un arbre, ou chaque niveau de l'arbre constitue un plan a un certain niveau d'abstraction.
Un lien de precedence entre operations d'un m^eme niveau d'abstraction. Ces liens
denissent l'ordonnancement des operations et forment un plan a un niveau d'abstraction particulier.
La gure 6.15 illustre la representation conceptuelle de la t^ache pour le texte vcr. Les
eches pleines indiquent les liens hierarchiques, tandis que les liens en pointilles indiquent la
precedence a l'interieur d'un plan. Dans cet exemple particulier, toutes les instances d'operations
d'un m^eme plan sont ordonnees de facon totale. Cette structure est gardee dans spin sous la
forme d'une liste de plans ou chaque plan est une liste Prolog. L'ordre partiel entre operations
est indique par des sequences Prolog. Par exemple, la hierarchie de la gure 6.15 est representee
par:
n1],
n2, n3, n4, n5],
n2, n6, n7, n5],
n2, n6, n8, n9, n10, n5]]
Voyons maintenant comment fonctionne la planication de t^ache.
105
2.3. Le processus de planication de t^ache
Tel que developpe par Sacerdoti Sac77], l'algorithme pour construire un plan non-lineaire
de facon hierarchique construit d'abord un plan a un niveau d'abstraction eleve, puis ce plan
est decompose a un niveau d'abstraction plus detaille. Plus precisement, il faut:
(i) Former un plan initial compose d'un seul n&ud signiant atteindre(but desire).
(ii) Faire l'expansion du plan le plus detaille dans la hierarchie, ainsi produisant un plan
encore plus detaille.
(iii) Critiquer le nouveau plan pour reordonner ou eliminer les operations redondantes.
(iv) Reiterer les etapes (ii) et (iii) jusqu'au niveau de detail desire.
L'etape (i) permet a spin de creer le n&ud n1 de la gure 6.15.
Pour l'etape (ii), l'algorithme conventionnel d'expansion a quelque peu ete modie pour
tenir compte des preconditions a ne pas nier par echec. En eet, pour qu'une operation O1 soit
selectionnee, sa postcondition de succes doit atteindre un etat desire E et ses preconditions
doivent ^etre satisfaites. Typiquement, pour satisfaire une precondition P , celle-ci doit faire
partie de l'etat courant du monde, ou bien il doit exister une autre operation O2 , elle-m^eme
ayant des preconditions satisfaites, qui rend P vraie si O2 est executee. Dans le systeme spin,
ces 2 techniques de satisfaction de preconditions sont utilisees, mais si aucune ne fonctionne,
l'operation O1 est tout de m^eme selectionnee de facon a ce que P soit verie par l'agent au
moment de l'execution de la procedure. De plus, les autres operations qui satisfont aussi l'etat
initial E et ayant des preconditions que le planicateur ne peut verier, sont aussi acceptees de
facon a creer plusieurs lignes de conduites possibles pour l'agent.
Notons que le planicateur de spin ne peut evaluer ses alternatives. En eet, il selectionne systematiquement la premiere operation satisfaisante sans verier si une autre operation
produirait un plan plus simple.
A l'etape (iii), le systeme de critiques de Sacerdoti sert a verier que les expansions locales forment un plan global coherent. Pour cette etape, le planicateur de t^ache de spin prend
une approche assez simple. En eet, la critique la plus importante de Sacerdoti considere le
conit lorsque la postcondition d'une operation O1 defait une precondition d'une operation
non-sequentielle O2. La solution a ce probleme est de placer l'operation victime O2 avant O1
dans le plan. Dans le planicateur de spin la relation temporelle entre les operations est indiquee directement dans la representation conceptuelle du domaine et non pas calculee par le
planicateur, evitant ainsi ce probleme de conit.
106
Finalement, l'iteration de l'etape (iv) termine lorsque, d'apres le modele du lecteur, toutes
les operations du plan sont primitives c'est-a-dire lorsque le lecteur sait comment eectuer
toutes les operations du plan3.
Rappelons que le but de la planication de t^ache dans spin est de demontrer qu'il est
possible d'utiliser la sortie d'un tel systeme pour des ns de generation de texte malgre sa
simplicite, ce module nous semble adequat dans ce contexte.
3. La planication de texte
Une fois la representation conceptuelle de la t^ache construite, la planication textuelle
vient determiner quoi dire et comment le presenter. Dans spin, ce travail s'eectue en quatre
etapes:
(i)
(ii)
(iii)
(iv)
la selection des elements semantiques,
la structuration des elements semantiques,
la selection des relations rhetoriques,
la structuration des relations rhetoriques.
3.1. Le choix des elements semantiques
Communiquer toute l'information disponible dans la representation conceptuelle de la t^ache
produirait un texte tres lourd c'est pourquoi, il est necessaire de selectionner quels elements
semantiques seront communiques et quels elements semantiques seront laisses implicites.
Pour selectionner les elements semantiques proceduraux a communiquer, la representation
conceptuelle de la t^ache est parcourue. Lorsqu'un n&ud est rencontre pour la premiere fois, les
heuristiques de selection sont appliquees sur chaque champ du schema d'operation (la precondition, le corps, : : :). Pour introduire les elements semantiques non-proceduraux (les attributs
d'objets), des qu'un element semantique procedural est selectionne, les heuristiques de selection
des attributs sont appliquees sur l'operation et les objets impliques. Dans spin, la representation de la t^ache est parcourue en largeur d'apres les liens hierarchiques, de facon a considerer
un plan a la fois. Cependant, un autre ordre de parcours aurait ete tout a fait adequat.
Comme presente aux chapitres precedents, la selection des elements semantiques appliquent
des heuristiques basees sur 5 types de contraintes:
1. Le contenu et la structure de la representation conceptuelle
3
Comme nous verrons a la section 3.1, notre notion d'operation primitive diere de celle de Dal92].
107
Pour verier ces contraintes, spin consulte la representation conceptuelle de la t^ache
construite par le planicateur de t^ache.
2. Les cooccurrences d'elements semantiques
Ces contraintes sont veriees en consultant la liste des elements semantiques deja selectionnes ou en posant des contraintes sur les elements semantiques a communiquer plus tard.
En eet, si le choix d'un element semantique depend des choix futurs, une note de la forme:
contrainte(Contraintes, Choix_si_vraies, Faits_si_vraies,
Choix_si_fausses, Faits_si_fausses)
est prise en compte. Cette note indique les contraintes a verier plus tard, les elements
semantiques a selectionner et les faits a armer si ces contraintes sont satisfaites ou non. Lors de
la structuration semantique, les decisions laissees sous cette forme seront evaluees et remplacees
par le choix approprie (cf. la section 3.2).
3. Les connaissances et intentions du lecteur
spin verie ces contraintes en consultant le modele du lecteur. Ce modele represente les
operations que le lecteur sait eectuer et ses connaissances diverses sur la nature de la t^ache.
Dans le systeme epicure Dal92], le modele du lecteur est simplement represente par une liste
d'operations que le lecteur sait eectuer, ce qu'il appelle les operations primitives. Cependant,
cette methode suppose que:
(i) les connaissances du lecteur sont toujours correctes par rapport a la realite,
(ii) le lecteur conna^%t les schemas d'operations au complet,
(iii) les connaissances du lecteur sont statiques.
Cependant, ces hypotheses ne sont pas toujours veriees. En eet, il peut arriver que le
lecteur possede des connaissances inconsistantes par rapport a la realite: il peut s'attendre,
par exemple, a un certain eet impossible dans les conditions courantes. Ainsi, l'hypothese (i)
de Dale ne semble pas tenir. En comparant les connaissances du lecteur a la representation
conceptuelle du domaine, on evitera de lui donner de l'information evidente a ses yeux et on
pourra inclure dans le texte de l'information qui completera ou rectiera ses attentes.
L'hypothese (ii) de Dale vient de sa denition d'une operation primitive. Pour Dale, une
operation est primitive si le lecteur sait comment l'executer: il conna^%t la valeur du champ
corps. Cependant, cette d
enition ne tient pas compte des autres informations contenues dans
les schemas d'operation. Si le lecteur sait comment decomposer une operation, mais n'en conna^%t
108
lecteur(programmer(obj: X, qual: Y)) :precond(]),
corps(]),
succes(ajout(programm
e(obj: X))]),
echec(ajout(neg(programm
e(obj: X)))]).
Figure 6.16. Exemple de schema d'operations du modele du lecteur pour le
texte vcr
pas les preconditions, celle-ci doit-elle ^etre consideree primitive ? Pour considerer ceci, nous
utilisons une notion d'operation primitive plus contraignante. Une operation est primitive pour
un lecteur, si celui-ci conna^%t au moins un4 de ses schemas de facon complete, correcte et
minimale. Dans spin, le modele du lecteur est donc lui aussi compose d'une bibliotheque de
schemas d'operations et de connaissances sur la nature de la t^ache. La gure 6.16 illustre un
schema d'operation du lecteur tire de modele novice.pl. Ici, le lecteur ne sait pas comment
programmer un objet X, ne sait pas qu'il faut avant tout inserer une cassette dans le video, mais
sait qu'en executant correctement l'operation, l'objet X sera programme sinon, il ne le sera pas.
Finalement, l'hypothese (iii) de Dale ne semble pas non plus justiee, car au fur et a mesure
que le lecteur lit le texte, ses connaissances se developpent. Le modele du lecteur est donc
une entite dynamique. Par exemple, apres avoir mentionne dans le texte l'eet d'une certaine
operation, on peut supposer que le lecteur a appris ce lien causal. Dans spin, le modele du
lecteur est donc mis a jour des qu'un element semantique est selectionne pour ^etre communique
dans le texte. Comme le niveau de detail du plan de la t^ache est determine en fonction des
connaissances du lecteur, idealement, ce plan devrait aussi proter des connaissances acquises
lors de la lecture du texte. Cependant, spin ne conna^%t l'identite d'une nouvelle connaissance du
lecteur que lorsque la planication textuelle est abordee, et par consequent une fois que le plan a
ete developpe. La facon ideale pour remedier a ce probleme, consiste a eectuer la planication
de t^ache et la planication textuelle de facon simultanee. Dans spin, cependant, une facon
plus simple, mais tout aussi ecace, est utilisee. En eet, le plan de la t^ache est developpe en
fonction des connaissances initiales du lecteur, puis lors de la planication textuelle, ce plan est
elague en fonction du modele du lecteur mis a jour.
4. La nature de la t^ache
La nature de la t^ache fait partie de la representation conceptuelle du domaine et le lecteur
en possede un modele personnel. Dans spin, cette base de connaissance est representee par une
liste de predicats speciant les caracteristiques des operations, des etats et des objets impliques
dans la t^ache. Les tables 6.25 et 6.26 presentent les listes completes des predicats disponibles
pour caracteriser la t^ache et les connaissances du lecteur.
4
En eet, plusieurs methodes peuvent exister pour realiser une m^eme operation.
109
Predicats
Operations
Description
before(O1,O2)
dangereux(O)
dependant(O1,O2)
dont(O)
durative(O)
during(O1,O2)
ensemble discriminant(Op,Oe)
erreur(O)
facile a mal executer(O)
facilite tache(O)
fausse deduction(O)
flou(O)
futur(O)
habitude(O)
irreversible(O)
mentale(O)
methode normale(O, E)
nefaste(O)
negtc(O)
preparation(O)
regle generale(O)
optionnel(O)
l'execution de O1 nie avant l'execution de O2 , relation temporelle
de All83])
O est une operation dangereuse
l'execution de O1 depend de O2
O est une prevention de type DONT
O est une operation durative
O2 est executee pendant l'execution de O1 , relation temporelle de
All83])
Oe est l'ensemble des operations discriminantes et plus importantes
pour eectuer Op
l'operation O ne doit pas ^etre executee
O est une operation facile a mal executer
O facilite la t^ache
le but de O peut ^etre faussement deduit
O est une operation oue
O ne doit pas ^etre executee immediatement
O est une operation habituelle
O est une operation irreversible
O est une operation mentale
O est la methode normale pour atteindre l'etat E
O est une operation nefaste
O est une prevention de type neg-TC
O est une operation de preparation
l'operation O est une regle generale
O est une operation optionnelle
E tats
desirable(E)
difficile(E)
equivalent(E1,E2)
externe(E)
interne(E)
materielle(E)
modifiable(E)
option(E,P)
textuel(E)
type appareil(E)
vrai bientot(E)
E est un etat desirable
E est un etat di"cile a evaluer
E1 est un etat equivalent a E2
E est un etat externe
E est un etat interne
E est une condition materielle
E est un etat modiable
E est une option avec probabilite de desir P
E doit ^etre presente de facon textuelle
E specie le type d'appareil manipule
l'etat E sera bient^ot vrai
Objets
attribut(OB,A,V)
justifie operation(A,O)
plus important(OB, O)
l'attribut A de l'objet OB a la valeur V
l'attribut A justie l'operation O
l'objet OB est plus important que l'operation O
Table 6.25. Predicats de la representation de la t^ache
110
Predicats
Operations
Description
base(O)
croit ordre(O1,O2)
etrange(O)
peut etre mal execute(O)
O est une operation de base pour le lecteur
le lecteur croit que O1 et O2 doivent ^etre eectuees dans cet ordre
le lecteur trouve O etrange
le lecteur peut mal executer O
E tats
lecteur sait desirable(E)
lecteur sait equivalents(E1,E2)
lecteur sait verifier(E)
le lecteur sait que E est un etat desirable
le lecteur sait que E1 et E2 sont deux etats equivalents
le lecteur sait verier l'etat E
Objets
attribut lecteur(OB,A,V)
utilisation rare(OB)
connaissances du lecteur sur l'objet OB
l'objet OB est rarement utilise
Table 6.26. Predicats du modele du lecteur
titre(programmer(obj: enregistrement, qual: d'1h 30 min par une touche incr
ementielle)),
op_seq(r
egler(obj: s
electeur de vitesse de bande, dest: SP)),
option(meilleure qualit
e d'image, r
egler(obj: s
electeur de vitesse de bande, dest: SP)),
op_seq(s
electionner(obj: canal 4)),
influence(s
electionner(obj: canal 4), appuyer(dest: touche de canal)),
op_seq(appuyer(dest: touche TIMER, qual: dans un d
elai de 9 secondes)),
op_seq(appuyer(dest: touche de canal)),
op_seq(appuyer(dest: touche OTR, qual: 3 fois)),
op_seq(enfoncer(obj: touche OTR, qual: 1 fois)),
effet(PM 10:35 (30min), enfoncer(obj: touche OTR, qual: 1 fois)),
op_seq(enfoncer(obj: touche OTR, qual: 2 fois)),
effet(PM 11:05 (1 h), enfoncer(obj: touche OTR, qual: 2 fois)),
op_seq(enfoncer(obj: touche OTR, qual: 3 fois)),
effet(PM 11:35 (1 h 30min), enfoncer(obj: touche OTR, qual: 3 fois))]
Figure 6.17. Liste des elements semantiques du texte vcr
5. Le but communicatif
Dans notre these, le but communicatif est deni par l'incitation a eectuer ou non la
procedure au moment de la lecture du texte. Cette notion fait partie des donnees initiales du
systeme (cf. la section 1).
Pour resumer les paragraphes precedents, spin utilise les cinq structures suivantes:
111
structure
contraintes veriees
representation conceptuelle de la t^ache
liste des elements semantiques selectionnes
modele du lecteur
representation conceptuelle du domaine
but communicatif (donne en entree)
conceptuelles
cooccurrences d'elements semantiques
connaissances du lecteur
nature de la t^ache
but communicatif
En consultant et mettant a jour ces dierentes structures, spin peut appliquer les heuristiques de selection presentees au chapitre 4. La sortie de ce processus est une liste lineaire
contenant les elements semantiques selectionnes. Par exemple, la gure 6.17 presente cette structure pour le texte vcr. Idealement, les elements semantiques devraient ^etre emmagasines dans
une structure arborescente suivant la structure de la representation conceptuelle de la t^ache.
La linearisation des structures de spin devraient ^etre eectuees lors de la realisation linguistique et non avant. Dans le contexte de petits textes d'instructions, cette simplication ne pose
cependant pas de handicap important.
3.2. La structuration semantique
Une fois la liste des elements semantiques construite, une certaine structuration est necessaire. Cette etape a pour but de:
(i) reordonner la liste des elements semantiques,
(ii) resoudre les contraintes de cooccurrence d'elements semantiques laissees non-resolues.
3.2.1. Le re-ordonnancement des elements semantiques
Le re-ordonnancement des elements semantiques n'est pas motive linguistiquement mais
est eectue pour des considerations d'implantation. Cette etape a pour but de pallier a 2
problemes:
Les m^emes instances d'operations repetees dans plusieurs plans de la representation de
la t^ache changent l'ordonnancement des elements semantiques.
L'ordonnancement des operations dans le plan a ordre partiel ne correspond pas a
l'ordonnancement des elements semantiques dans un texte a ordre total.
Comme nous avons vu precedemment, spin selectionne les elements semantiques en parcourant la representation de la t^ache en largeur. Cependant, dans cette representation, un noeud
ayant ni son expansion avant les autres, est repete jusqu'au niveau le plus bas. Par exemple,
dans la gure 6.15 les noeuds n2, n6 et n5 se retrouvent a dierents niveaux dans la representation de la t^ache. Ainsi, lors du parcours pour selectionner les elements semantiques, ces noeuds
sont consideres a plusieurs reprises. Ce phenomene peut faire perdre l'ordre de succession des
112
operations. Par exemple, pour selectionner les elements semantiques du texte vcr, spin parcourt
la representation de la gure 6.15 ainsi:
n1, n2, n3, n4, n5, n2, n6, n7, n5, n2, n6, n8, n9, n10, n5
Comme un m^eme n&ud peut se retrouver a dierents niveaux, spin n'en considere que la
premiere occurrence. Dans cet exemple, si seules les operations sequentielles issues des noeuds
feuilles sont selectionnees, l'ordre des operations dans le texte sera:
n2, n5, n6, n8, n9, n10
Ici, l'operation issue du n&ud n5 n'est pas ordonnee correctement car elle devrait ^etre la
derniere. De la m^eme facon, si seule la derniere occurrence etait consideree, le resultat pourrait
^etre errone5 . Pour faire face a ce probleme, une fois que la liste des elements semantiques est
construite, elle est ordonnee de nouveau en fonction des relations temporelles de la representation du domaine.
Comme nous avons vu a la section 2, par defaut un plan non-lineaire ordonne toutes les
operations de facon partielle, sauf si elles sont sequentielles. D'un autre c^ote, le texte ordonne
toutes les operations par un ordre total, sauf si elles sont co-temporelles. Pour rediger un texte
a partir d'un plan non-lineaire, il est donc necessaire d'\aplatir" ce dernier de facon a lineariser
les operations temporellement independantes. D'apres le corpus, 2 criteres semblent ^etre utilises
pour eectuer cette etape:
1. Les operations autonomes: Certaines operations duratives ne demandent pas a
l'agent d'^etre toujours actif. L'agent declenche les operations, puis celles-ci s'eectuent
de facon autonome. Entre temps, l'agent est libre d'eectuer d'autres operations temporellement independantes. C'est le cas, par exemple, de laisser tiedir dans:
(97) 4. Faire fondre le chocolat dans le cafe a feu tres lent. Retirer du feu, ajouter
le rhum et le sel. Laisser tiedir .
5. Pendant ce temps, ajouter au melange les ufs, le beurre, : : :
Lorsqu'une operation est autonome, elle est generalement citee dans le texte avant ses
operations temporellement independantes, de facon a minimiser le temps d'execution
de la procedure.
2. Les contraintes de style: Generalement, dans les textes d'instructions et en particulier dans les textes d'assemblage, il est normal de specier la preparation des
instruments avant de presenter le c&ur de la procedure. Dans le cas des recettes de
cuisine, Tutin remarque que la preparation des ingredients est generalement presentees
avant la cuisson du plat et son service Tut92a]. Cette strategie permet de decomposer
5 Il nous semble plus naturel de consid
erer un plan a la fois par un parcours en largeur cependant, dans
un parcours en profondeur, ce probleme n'aurait pas lieu.
113
titre(programmer(obj: enregistrement, qual: d'1h 30 min par une touche incr
ementielle)),
op_seq(r
egler(obj: s
electeur de vitesse de bande, dest: SP)),
option(meilleure qualit
e d'image, r
egler(obj: s
electeur de vitesse de bande, dest: SP)),
op_seq(s
electionner(obj: canal 4)),
influence(s
electionner(obj: canal 4), appuyer(dest: touche de canal)),
op_seq(appuyer(dest: touche de canal)),
op_seq(appuyer(dest: touche OTR, qual: 3 fois), action),
op_seq(enfoncer(obj: touche OTR, qual: 1 fois)),
effet(PM 10:35 (30min), enfoncer(obj:touche OTR, qual: 1 fois)),
op_seq(enfoncer(obj: touche OTR, qual: 2 fois)),
effet(PM 11:05 (1 h), enfoncer(obj: touche OTR, qual:2 fois)),
op_seq(enfoncer(obj: touche OTR, qual: 3 fois)),
effet(PM 11:35 (1 h 30min), enfoncer(obj: touche OTR, qual: 3 fois)),
op_seq(appuyer(dest: touche TIMER, qual: dans un d
elai de 9 secondes))]
Figure 6.18. Structure semantique du texte vcr
la procedure en trois grandes etapes distinctes et s'assurer qu'une grande etape soit
completee avant d'entamer la suivante.
Pour reordonner les operations temporellement independantes, spin utilise alors les regles
suivantes:
(i) d'abord les contraintes de style sont appliquees: les operations de preparation6 sont
presentees en premier
(ii) parmi les operations restantes, les operations autonomes sont placees ensuite
(iii) nalement, les operations restantes sont placees au hasard tout en gardant adjacentes
les operations ayant un m^eme parent. Ceci permet d'eviter des changements de focus injusties par exemple, d'enoncer une operation permettant d'atteindre le but O, ensuite
une operation non reliee, puis revenir a une operation permettant d'atteindre O.
La liste de elements semantiques de l'exemple vcr apres cette etape est illustree a la gure 6.18. Remarquons ici que l'element semantique issu du n&ud n5 (op seq(appuyer(dest:
touche TIMER, qual: dans un d
elai de 9 secondes))) est maintenant ordonn
e correctement a la n de la liste.
3.2.2. La resolution des contraintes de cooccurrence
Une fois tous les elements semantiques selectionnes, les contraintes de cooccurrences de la
forme:
contrainte(Contraintes, Choix_si_vraies, Faits_si_vraies,
6 Les op
erations de preparation sont explicitement speciees dans la representation de la t^ache (cf. la
table 6.25, p. 109).
114
titre,
but(programmer(obj: enregistrement, qual: d'1h 30 min par une touche incr
ementielle), _),
paragraphe,
action(r
egler(obj: s
electeur de vitesse de bande, dest: SP)),
but(meilleure qualit
e d'image, r
egler(obj: s
electeur de vitesse de bande, dest: SP)),
action(s
electionner(obj : canal 4)),
maniere(appuyer(dest : touche de canal),
action(appuyer(dest: touche OTR, qual: 3 fois)),
c_condition(enfoncer(obj: touche OTR, qual: 1 fois), appuyer(dest: touche OTR, qual: 3 fois)),
resultat(PM 10:35 (30min), enfoncer(obj: touche OTR, qual: 1 fois)),
c_condition(enfoncer(obj: touche OTR, qual: 2 fois), appuyer(dest:touche OTR, qual: 3 fois)),
resultat(PM 11:05 (1 h), enfoncer(obj: touche OTR, qual: 2 fois)),
c_condition(enfoncer(obj: touche OTR, qual: 3 fois), appuyer(dest: touche OTR, qual: 3 fois)),
resultat(PM 11:35 (1 h 30min), enfoncer(obj: touche OTR,qual: 3 fois)),
action(appuyer(dest: touche TIMER, qual: dans un d
elai de 9 secondes))]
Figure 6.19. Liste des relations rhetoriques du texte vcr
Choix_si_fausses, Faits_si_fausses)
peuvent maintenant ^etre resolues. Dans l'exemple vcr, aucune contrainte n'etait laissee
non-resolue cette etape ne modie donc pas la structure semantique.
3.3. Le choix des relations rhetoriques
Une fois la structure semantique construite, il faut determiner sa realisation rhetorique.
La structure semantique est alors traversee, et pour chaque element semantique, la relation
rhetorique la plus appropriee est choisie. Cette etape est eectuee en appliquant les heuristiques
de presentation du chapitre 5. Ici aussi, pour satisfaire les contraintes des heuristiques, les
dierentes structures de spin presentees a la section 3.1 sont consultees et mises a jour. La
gure 6.19 illustre le resultat de cette etape pour le texte vcr. Cette liste contient les relations
rhetoriques du texte nal mais les noyaux et les satellites ne sont pas necessairement ordonnes
correctement. Les relations multi et mono-nucleiques sont respectivement representees par:
Relation rh
etorique(Noyau)
Relation rh
etorique(Satellite, Noyau)
par exemple,
action(s
electionner(obj:canal 4)),
maniere(appuyer(dest:touche de canal), s
electionner(obj:canal 4))),
Les textes generes par spin sont assez courts c'est pourquoi, une liste lineaire est susante. Cependant, pour des textes plus longs, il serait necessaire de construire une structure
arborescente comme dans la theorie de la RST.
115
Relation rhetorique avant apr
es Total
c-condition
elaboration
but
resultat
maniere
90 %
85 %
41 %
5%
23 %
11 %
15 %
59 %
94 %
77 %
101 %
100 %
100 %
99 %
100 %
Table 6.27. Positions des satellites par rapport a leur noyau
3.4. La structuration rhetorique
Une fois les relations rhetoriques selectionnees, cette liste doit ^etre structuree pour:
resoudre les contraintes de cooccurrence de relations rhetoriques,
positionner les satellites des relations rhetoriques par rapport a leur noyau,
ajouter la ponctuation.
3.4.1. La resolution des contraintes de cooccurrence
Une fois toutes les relations rhetoriques selectionnees, les contraintes de cooccurrences sont
resolues tout comme lors de la structuration semantique (cf. la section 3.2.2).
3.4.2. Le positionnement des satellites
Plusieurs travaux ont etudie l'eet du positionnement d'expressions dans les textes d'instructions par exemple, Tho85], DFG88] et VL93b]. En eet, les phrases:
(98) a. Pour faire Op, faites Oe.
b. Faites Oe, pour faire Op .
ne sont pas utilisees de facon interchangeable. En eet, la forme (98b) ne sera pas utilisee
si Op est une operation optionnelle, mais la forme (98a) est toute indiquee. Pour presenter des
instructions correctement, il est donc necessaire d'ordonner le satellite et le noyau des relations
rhetoriques de facon correcte.
Parmi les travaux sur ce sujet, celui de Vander Linden est de loin le plus complet, c'est
pourquoi les decisions prises par spin sont fortement basees sur ses observations. D'apres notre
corpus, la position des satellites d'une relation rhetorique par rapport a son noyau semble la
m^eme en anglais et en francais. Les observations de notre corpus sont illustrees a la table 6.27.
Seules les relations de c-condition, elaboration, but, resultat et maniere sont presentees les
autres relations, etant multi-nucleiques, ne sont pas concernees par le positionnement des satellites.
La c-condition: Les regles de Vander Linden pour le positionnement des c-conditions sont
assez complexes. Cependant, en anglais comme en francais, les c-conditions sont generalement
placees avant le noyau (90 % versus 11 %). Dans le systeme spin, les c-conditions sont alors
116
toujours positionnees avant leur noyau sauf en cas de retrogradation rhetorique. Par exemple,
dans:
Appuyez sur la touche OTR 3 fois.
Lorsqu'elle est enfonc
ee 1 fois, PM 10:35 (30min).
la relation de c-condition a pour satellite: Lorsqu'elle est enfoncee 1 fois et pour
noyau: Appuyez sur la touche OTR 3 fois. Il s'agit d'une retrogradation rhetorique, ainsi,
le satellite est place apres son noyau.
L'elaboration: L'etude de Vander Linden ne considere pas la relation d'elaboration.
Dans notre corpus, le noyau d'une elaboration est generalement placee apres son noyau. Cependant, dans 15 % des cas, le satellite est apres son noyau. Ces elaborations communiquent
habituellement une justication pour la ligne d'operations speciee dans le noyau.
Le but: Dans le corpus de Vander Linden, la majorite des satellites de buts sont exprimes
apres leur noyau. Son systeme place donc toujours le satellite apres le noyau sauf dans des
cas bien particuliers. Comme le montre la table 6.27, le francais aussi place generalement les
satellites des buts apres le noyaux (59 % versus 41 %). Tout comme imagene, spin place par
defaut les satellites apres leur noyau, sauf si le but est considere optionnel, ou s'il s'applique a
plusieurs actions
Le resultat: En anglais et en francais, le satellite des resultats est toujours positionne
apres leur noyau (cf. la table 6.27).
La maniere: Ici, l'etude de Vander Linden ne peut nous aider, car il ne considere pas
cette relation. Generalement, le satellite d'une maniere est place apres son noyau. Cependant,
dans le corpus 23 % des satellites precedent leur noyau. Ces cas ne nous semblent pas toujours
justies c'est pourquoi, spin place toujours le satellite apres le noyau.
3.4.3. La ponctuation
La ponctuation est mise dans le texte au niveau des relations rhetoriques. En eet, dans
les textes d'instructions la ponctuation semble peu dependante de la forme grammaticale. spin
utilise les regles de ponctuations suivantes:
relation
ponctuation relation
action
point virgule resultat
but
virgule
toute relation reliee
c-condition
virgule
toute relation reliee
toute autre relation
point
Dans le corpus, les noyaux des sequences d'actions peuvent faire partie d'une m^eme phrase
ou de phrases dierentes. Determiner comment eectuer l'agregation d'actions n'est pas un
117
titre,
but(programmer(obj: enregistrement, qual: d'1h 30 min par une touche incr
ementielle), _),
paragraphe, item,
but(meilleure qualit
e d'image, r
egler(obj: s
electeur de vitesse de bande, dest: SP)), virgule,
action(r
egler(obj: s
electeur de vitesse de bande, dest: SP)), point, item,
action(s
electionner(obj: canal 4)),
maniere(appuyer(dest: touche de canal), s
electionner(obj: canal 4)), point, item,
action(appuyer(dest: touche OTR, qual: 3 fois)), point, nl, espace,
c_condition(enfoncer(obj: touche OTR, qual: 1 fois), appuyer(dest:touche OTR, qual: 3 fois)), virgule,
resultat(PM 10:35 (30min), enfoncer(obj: touche OTR, qual: 1 fois)), point, nl, espace,
c_condition(enfoncer(obj: touche OTR, qual: 2 fois), appuyer(dest: touche OTR, qual: 3 fois)),
resultat(PM 11:05 (1 h), enfoncer(obj: touche OTR, qual: 2 fois)), point, nl, espace,
c_condition(enfoncer(obj: touche OTR, qual: 3 fois), appuyer(dest: touche OTR, qual: 3 fois)),
resultat(PM 11:35 (1 h 30min), enfoncer(obj: touche OTR, qual: 3 fois)), point, nl, point, item,
action(appuyer(dest: touche TIMER, qual: dans un d
elai de 9 secondes)), point]
Figure 6.20. Structure rhetorique du texte vcr
probleme simple (voir par exemple DH93]). spin ne considere pas cette question et presente
generalement chaque noyau par une phrase distincte7 .
La gure 6.20 illustre la structure rhetorique du texte vcr. Notons que dans cette structure le but meilleure qualite d'image a ete place avant son noyau, car il indiquait un but
optionnel. De plus, la structure rhetorique inclut maintenant la ponctuation du texte nal.
4. La realisation linguistique
Une fois la structure rhetorique construite, celle-ci est passee au module de realisation
linguistique qui se charge de selectionner la structure grammaticale et la realisation lexicale.
Ces etapes ne font pas partie de l'emphase du systeme, mais ont ete ajoutees pour verier que
la sortie du planicateur de texte est susante pour qu'un module plus complet puisse eventuellement produire un meilleur texte en langue naturelle. La realisation linguistique s'occupe
de:
(i) selectionner les formes grammaticales,
(ii) selectionner les lexemes et eectuer les exions morphologiques.
Comme il a ete mentionne au chapitre 3, les choix grammaticaux et lexicaux devraient
idealement ^etre eectues en m^eme temps. Dans spin, les decisions lexicales sont assez simples.
En eet, les concepts et des relations sont generalement lexicalises respectivement par des noms
et des verbes sans vides lexicaux. Ainsi, les decisions grammaticales sont generalement prises
avant les decisions lexicales. Seulement en cas de nominalisation d'une relation, les decisions
7 Si une c-condition contraint une op
eration O non communiquee, alors les operations enfant de Op sont
presentees dans une m^eme phrase.
118
Forme
Groupe nominal
Expressions de but comme dans les instructions
Comment + innitif
Total
objet operation
20 %
64 %
0%
10 %
0%
6%
20 %
80 %
Total
84 %
10 %
6%
100 %
Table 6.28. Formes des titres
grammaticales ont droit de regard sur le lexique, evitant ainsi un retour arriere lors d'un vide
lexical.
4.1. La realisation grammaticale
Plusieurs travaux en psychologie DFG88], en redaction technique Bin86] et en linguistique Tho85] ont etudie l'eet de dierentes structures grammaticales dans les instructions
cependant, encore une fois, le travail de Vander Linden VL93b] reste le plus complet. L'etude
de Vander Linden ne peut ^etre utilisee telle quelle car elle porte sur la realisation grammaticale
anglaise. De plus, son travail ne porte que sur les textes d'execution cependant, les sequences
d'actions dans les textes hybrides et de comprehension exhibent de nombreuses variations du
point de vue grammatical. Nous avons donc quelque peu modie ses resultats pour les adapter
a notre contexte. D'apres notre corpus, la realisation grammaticale dans les deux langues se
ressemble beaucoup, ce qui, d'apres les observations de Kittredge, n'est pas surprenant Kit82]:
Le style ecrit de l'anglais et du francais tend a ^etre plus similaire dans les
textes techniques specialises que dans les textes en langue generale : : : ] les
sous-langages parall
eles en anglais et en francais sont bien plus similaires structurellement que dierents sous-langages de la m^eme langue : : : ] On peut donc
conclure que les textes techniques en anglais et en francais sont tr
es parall
eles
parce que le but du texte est bien plus similaire ici que dans des textes descriptifs. p. 108{135.
Dans ce qui suit, nous presentons la realisation grammaticale des titres et des relations
rhetoriques dans notre corpus. En aucun cas nous ne justions le choix de l'expression grammaticale. Ce choix est eectue dans spin en se basant autant que possible sur les resultats de
VL93b] et, le cas echeant, par des decisions aleatoires suivant les proportions presentees ici8 .
4.1.1. Le titre
Le titre d'une procedure indique toujours son but. Comme l'illustre la table 6.28 les expressions de but dans les titres peuvent ^etre realisees par un plus grand eventail de formes
grammaticales que les buts dans les instructions (cf. la section 4.1.5). Dans le titre, le but peut
indiquer explicitement une operation a eectuer ou un objet9 a utiliser.
8 Nous tenons a remercierMyriam Beaucheminqui, dans le cadre de son projet de premier cycle, a contribue
a la realisation du module de realisation grammaticale de spin.
9 L'objet peut ^
etre un instrument, un mode de fonctionnement, un systeme, : : :
119
Lorsque le texte ne porte que sur un seul objet ne servant qu'a peu de buts, le titre d'une
procedure peut exprimer cet objet. Par exemple:
(99) La levure
Sur les 115 titres du corpus, 20 % suivent ce schema. Tous ces titres sont realises par un
groupe nominal.
Plus frequemment (80 %), le titre indique une operation a eectuer. Ceci se realise generalement de 3 facons:
par un groupe nominal dont la t^ete est la nominalisation de l'operation. Par exemple:
(100) Retrait de l'abat-jour
par une expression de but comme dans les instructions (cf. la section 4.1.5). Par
exemple:
(101) a. Pour selectionner les canaux
b. Pour Berline et Hatchback
par une proposition interrogative de la forme comment + innitif. Par exemple:
(102) Comment renommer un repertoire ?
D'apres le corpus, les titres indiquant un objet sont peu utilises pour des textes d'execution,
tandis que les titres indiquant une operation peuvent s'adapter a tous les buts communicatifs.
C'est pourquoi spin choisit la forme grammaticale des titres en fonction de leur but communicatif. Pour les textes hybrides et de comprehension, si l'objet principal de la procedure ne
sert pas a d'autres procedures, alors cet objet est indique dans le titre sous forme d'un groupe
nominal. Dans les autres cas, si une nominalisation de l'operation est possible, spin presente
generalement le titre par un groupe nominal sinon, les autres formes sont choisies de facon
aleatoire en suivant les proportions de la table 6.28.
4.1.2. La sequence d'actions
Dans les textes d'instructions, les noyaux des sequences peuvent suivre 4 formes grammaticales:
(i) l'actif direct: realise par un verbe a l'imperatif ou a l'innitif
(ii) l'actif impersonnel: realise par on + present ou il sut de / vous devez / il faut +
innitif.
(iii) le passif: de la forme <sujet> est / doit ^etre / peut ^etre + participe passe.
(iv) l'actif narratif: de la forme l' <agent> + present par exemple l'artisan fait O .
120
Forme
Actif direct
Actif impersonnel
Passif
Actif narratif
Total
execution hybride comprehension Exemple
96 %
1%
2%
0%
99 %
51 %
35 %
14 %
0%
100 %
27 %
68 %
5%
0%
100 %
0%
0%
42 %
58 %
100 %
Faites O.
On fait O.
O est fait.
L'agent fait O.
Table 6.29. Formes des actions
Forme
Total Exemple
Si + passif
46 %
Lorsque + passif
16 %
Dans le cas de /sur + groupe nominal
12 %
Action explicite de l'usager, au present
9%
Forme impersonnelle
7%
Action explicite de l'usager, au passe compose 6 %
S'il y a lieu de + innitif
5%
Total
101 %
si O est faite
lorsque O a ete faite
dans tel cas
si vous faites O
si on a fait O
si vous avez fait O
s'il y a lieu de faire O
Table 6.30. Formes des c-conditions
Le choix de ces formes semble dependre du but communicatif du texte. En eet, comme
l'illustre la table 6.29, les textes d'execution sont tres stereotypes tandis que les autres types
de texte utilisent une plus grande variete de formes grammaticales.
De facon generale, les preventions (actions negatives) utilisent une forme active directe ou
impersonnelle accompagnee des negations ne pas ou sans (par exemple, sans faire O / il ne faut
pas faire O ).
Pour les actions a contenu positif, la forme active directe est nettement preferee. Avec cette
forme, l'innitif et l'imperatif peuvent tous deux ^etre utilises. Dans les m^emes circonstances,
certains manuels preferent l'innitif, tandis que d'autres utilisent toujours l'imperatif. Lorsqu'il
produit cette forme, spin eectue alors le choix du temps de facon aleatoire au tout debut de la
generation. Lorsqu'il s'agit d'un texte d'execution, spin ne genere que l'actif direct cependant,
s'il doit rediger un texte hybride ou de comprehension, spin choisit de facon aleatoire dierentes
combinaisons de formes tout en suivant les proportions de la table 6.29.
4.1.3. La c-condition
Pour determiner automatiquement la forme grammaticale d'une c-condition, Vander Linden a developpe des regles assez complexes pour l'anglais VLCM92a] VL94]. Comme pour
l'anglais, le choix de la forme grammaticale en francais est assez large (cf. la table 6.30) et ne
semble pas varier en fonction du but communicatif. Ne voulant pas se commettre a des choix
complexes dont la validite pour le francais est encore a verier, spin ne produit que les formes
les plus frequentes: si + passif, si la condition peut ^etre fausse ou vraie immediatement, et
121
Forme
Total Exemple
Subordonnee innitive
82 % pour faire O
Subordonnee circonstancielle 10 % pour que O soit fait
Pour + metonymie de but
7 % pour O] ceci
Autre
1%
Total
100 %
Table 6.31. Formes des buts
lorsque + passif, si la condition peut devenir vraie dans quelque temps. Si une autre forme est
plus adequate, celle-ci est donnee de facon textuelle dans la representation conceptuelle.
4.1.4. L'elaboration
La forme de l'elaboration n'est pas tres variee. En eet, la majorite de ces expressions sont
realisees par une proposition au present avec comme sujet l'objet decrit par exemple,
(103) Un des charmes de la peinture sous verre ancienne est son dessin des contours, souple
et volontaire, d'un seul jet.
Dans spin, l'elaboration est realisee simplement par la forme: <attribut> de <objet> est
<valeur>.
4.1.5. Le but
En anglais, une expression de but peut ^etre exprimee par 4 formes grammaticales VL93b]:
(i)
(ii)
(iii)
(iv)
la forme innitive (ex. to adjust volume)
la preposition for suivie d'une metonymie de but (ex. for frequently busy numbers)
la preposition for suivie d'une nominalisation en complement (ex. for desk installation)
la preposition for suivie d'un gerondif comme complement (ex. for charging the batteries)
Ces formes grammaticales, n'ont pas toutes une correspondance en francais. En eet, dans
notre etude, les buts peuvent ^etre exprimes par:
(i') la forme innitive, qui correspond a la forme (i) anglaise
(ii') la preposition pour suivie d'une metonymie de but, correspondant a la
forme (ii)
(iii') une proposition subordonnee circonstancielle de but avec verbe au subjonctif
(ex. pour que la syntonisation soit precise )
Les formes retrouvees dans le corpus sont presentees a la table 6.31. Notons qu'en francais,
aucune nominalisation ni gerondif, formes (iii) et (iv), n'est utilise en revanche, la subordonnee
innitive, forme (i'), est nettement plus utilisee qu'en anglais et le francais utilise des propositions subordonnees circonstancielles, forme (iii').
122
Forme
Total Exemple
Present
50 %
Futur
32 %
Devrait + innitif 6 %
Doit + innitif
7%
autres
4%
Total
99 %
E se produit.
E se produira.
E devrait se produire.
E doit se produire.
Table 6.32. Formes des resultats
Les regles developpees par Vander Linden semblent assez bien s'appliquer au francais, c'est
pourquoi spin s'en inspire fortement. Si le but s'applique a plusieurs actions, la forme (i') est
toujours choisie. La metonymie de but (forme (ii')) semble aussi suivre les m^emes regles que
l'anglais elle est utilisee lorsque l'objet est plus important que le groupe verbal et ce dernier
peut ^etre omis, comme dans:
(104) Pour 10 les ecrous qui ne portent aucune marque , tourner en sens contraire.
ou le verbe devisser a ete omis.
Tout comme en anglais, si une metonymie ne peut ^etre produite, la subordonnee innitive
(i') est ensuite tentee a nouveau. Les conditions contraignant l'utilisation de la subordonnee
circonstancielle (forme (iii')) ne semblent pas claires. Cette question etant hors de notre domaine
de recherche, spin ne produit simplement pas cette forme.
4.1.6. Le resultat
En anglais, pour exprimer un resultat, generalement 2 formes sont disponibles: une proposition au present et une proposition au futur. Pour justier le choix entre ces 2 formes, Vander
Linden a remarque que lorsque le resultat est ou, peut ^etre, execute par le lecteur, le present
est utilise. Par exemple:
(105) Lorsque le 7010 est installe et la pile s'est chargee pendant 12 heures, positionnez le
bouton off/stby/talk sur stby. Le 7010 est maintenant pr^et a ^etre utilise.
Tandis que lorsque le resultat est execute par l'appareil lui-m^eme, le futur est utilise. Par
exemple:
(106) Placez le recepteur sur la base. L'indicateur de chargement de pile s'allumera.
En francais, nous avons observe les 5 formes grammaticales illustrees a la table 6.32:
une proposition au present et au futur, une proposition avec le verbe devoir au present et au
conditionnel suivi d'un innitif et d'autres formes (resultat numerique, groupe nominal, : : :).
L'utilisation du present et du futur ne semble pas justiee comme en anglais. En eet, un
10
Le symbole denote l'ellipse.
123
Forme
Total Exemple
Avec /a l'aide de /par + groupe nominal 46 % avec l'objet OB
Gerondif
41 % en faisant O
Autres
13 %
Total
100 %
Table 6.33. Formes des manieres
resultat execute par l'appareil est presque aussi souvent indique au present qu'au futur. Par
exemple, dans un texte, on retrouve:
(107) Appuyer sur la touche timer. (La minuterie est achee et le voyant s'eteint.)
ou le resultat est au present et dans un autre manuel, on retrouve le m^eme type de resultat,
mais cette fois au futur:
(108) : : :] presser le bouton mute. Le mot mute sera ache sur l'ecran .
Il semble que dans un m^eme manuel, l'utilisation d'un des deux temps soit preferee. Dans
spin, le choix de forme grammaticale decide alors de facon aleatoire entre le temps futur et le
temps present au tout debut de la generation (avec les proportions retrouvees dans le corpus).
Si par contre, une autre forme est preferee, alors celle-ci est speciee textuellement c'est le
cas de PM 11:35 (1 h 30min) dans le texte vcr. Les formes avec le verbe devoir ne sont pas
produites.
4.1.7. La maniere
Pour la maniere, le travail de Vander Linden ne peut nous guider car il inclut la maniere
dans son etude des c-conditions. La table 6.33 montre les observations de notre corpus. On
remarque que:
La forme avec/a l'aide de/par suivie d'un groupe nominal est utilisee lorsque le satellite
specie l'utilisation d'un instrument particulier. Par exemple,
(109) Retirez les ecrous avec une cle en croix.
Dans ces cas, l'instrument est considere plus important que le verbe, et celui-ci est alors
omis. En eet, sans ellipse, l'exemple (109) se lirait:
(110) Retirez les ecrous en utilisant une cle en croix.
Dans les autres cas, le gerondif est utilise. Par exemple,
(111) Selectionner le canal a regler en appuyant sur le selecteur de canal .
spin utilise donc ces deux regles pour selectionner la forme grammaticale des manieres.
124
Forme
Gerondif
Actif direct
Passif
Actif narratif
Total
%
53 %
23 %
21 %
2%
99 %
Exemple
en faisant O1
en faisant O1 ], faites O2
en faisant O1 ], O2 est fait
en faisant O1 ], l'agent fait O2
Table 6.34. Formes des concurrences
4.1.8. La concurrence
La concurrence est toujours formee d'une action a l'actif direct, narratif ou au passif et
d'un ensemble d'actions au gerondif. La table 6.34 montre les dierentes formes retrouvees
dans le corpus. Il ne semble pas evident de determiner quels noyaux de cette relation multinucleique utilisent le gerondif et quel noyau utilise la forme active/passive. A prime abord, il
semble qu'entre 2 operations co-temporelles11 Og , l'operation au gerondif, et Oap , l'operation a
la forme active/passive, ont les caracteristiques suivantes:
Oap peut ^etre ponctuelle ou durative, tandis que Og est durative,
le debut et la n de Oap sont clairs, tandis le debut ou la n de Og n'est pas toujours
clair,
l'execution de Oap est englobee par l'execution de Og , (relation temporelle during de
Allen All83]).
Par exemple, dans:
(112) Tout en le faisant tourner, eeurer la surface du verre.
on peut visualiser l'execution de ces operations par:
tourner
effleurer
Cependant, cette regle ne semble expliquer qu'une faible majorite des cas. C'est pourquoi,
spin selectionne au hasard le noyau a la forme active/passive et realise les autres noyaux par
le gerondif. Pour selectionner la forme active/passive, les regles utilisees pour les sequences
d'actions sont appliquees (cf. la section 4.1.2).
4.1.9. Resume
Gr^ace aux observations des sections precedentes et a l'analyse de Vander Linden, spin
utilise des regles assez generales pour realiser grammaticalement les relations rhetoriques. Pour
le texte vcr, les choix grammaticaux eectues par spin sont presentes a la gure 6.21. De toute
evidence, une etude plus approfondie de ces phenomenes est necessaire.
11 Aucune concurrence du corpus n'est form
ee de plus de 3 noyaux un tel groupe d'operations semble
eectivement di"cile a concevoir et a executer.
125
titre,
gn(programmer(obj: enregistrement, qual: d'1h 30 min par une touche incr
ementielle)),
paragraphe, item,
forme_pour(meilleure qualit
e d'image), virgule,
actif_direct(r
egler(obj: s
electeur de vitesse de bande, dest:SP)), point, item,
actif_direct(s
electionner(obj: canal 4)),
gerondif(appuyer(dest: touche de canal)), point, item,
actif_direct(appuyer(dest: touche OTR, qual: 3 fois)), point, nl, espace,
lorsque(enfoncer(obj: touche OTR, qual: 1 fois)]), virgule,
forme_textuelle(PM 10:35 (30min)), point, nl, espace,
lorsque(enfoncer(obj: touche OTR, qual: 2 fois)]), virgule,
forme_textuelle(PM 11:05 (1 h)), point, nl, espace,
lorsque(enfoncer(obj: touche OTR, qual: 3 fois)]), virgule,
forme_textuelle(PM 11:35 (1 h 30min)), point, nl, point, item,
actif_direct(appuyer(dest: touche TIMER, qual: dans un d
elai de 9 secondes)), point]
Figure 6.21. Liste des structures grammaticales pour le texte vcr
4.2. La realisation lexico-morphologique
Une fois le choix des formes grammaticales eectue, il faut selectionner les mots et les
decliner correctement. L'emphase de spin n'est certainement pas la realisation lexicale, c'est
pourquoi dans le systeme, un concept est directement relie a une entree lexicale. De plus, comme
on peut voir a la gure 6.14, certaines expressions sont entrees directement dans la representation conceptuelle. Pour eectuer la realisation morphologique, spin consulte un dictionnaire de
mots (dico.pl) et un specialiste des verbes (bescherelle.pl).
spin s'attarde a generer des expressions anaphoriques. Ce mecanisme est essentiel dans les
textes d'instructions car ces textes introduisent peu de referents mais s'y referent plus souvent
que dans d'autres genres textuels. Pour produire des textes naturels il est donc necessaire
d'inclure des expressions referentielles. Pour faire ceci, nous avons implante un sous-ensemble
des regles de Tutin Tut92a, KTKL93] sur les anaphores grammaticales et lexicales dans les
textes d'instructions. Par exemple, dans le texte vcr ces regles ont permis a spin de generer:
Appuyez sur la touche OTR 3 fois.
elle est
Lorsqu'
enfonc
ee 1 fois, PM 10:35 (30min).
ou le pronom elle fait reference a l'objet touche otr deja introduite dans le texte. spin
sait produire des pronoms personnels (ex. la touche OTR ) elle), des repetitions partielles (ex.
la touche OTR ) la touche) et des ellipses de groupes nominaux (ex. la touche OTR ) ).
Pour d'autres references sur les procedes referentiels, voir Dal92] et RD92].
126
5. La realisation motrice
Une fois les mots choisis, spin procede nalement a la realisation motrice. A cette etape,
certains ajustements (elisions, mises en majuscules, : : :) sont eectues puis le texte est mis
en page. Pour cette derniere etape, spin s'inspire de certains travaux en redaction technique
sur la typographie dans les textes d'instructions Har85, Har86]. Ainsi, spin organise les textes
d'executions en listes enumerees et les textes hybrides et de comprehension en paragraphes.
6. Resume
Ce chapitre a presente l'implantation du systeme spin. spin possede une architecture
lineaire. D'abord, a partir d'une representation conceptuelle du domaine composee d'une bibliotheque de schemas d'operations et d'une base de connaissance sur la nature de la t^ache, un
planicateur de t^ache developpe une hierarchie de plans formant la representation conceptuelle
de la t^ache a accomplir. spin entame ensuite la planication textuelle. D'abord un ensemble
d'elements semantiques a communiquer est selectionne et structure. Cette etape est eectuee
en appliquant les heuristiques presentees aux chapitre 4. Puis, les relations rhetoriques les plus
appropriees sont selectionnees et structurees suivant les heuristiques de presentation du chapitre 5. Pour la realisation linguistique, l'etude de Vander Linden nous a fortement inspire
cependant, cette etude a ete adaptee pour le francais. Finalement, les choix grammaticaux sont
realises lexicalement puis aches.
Le but de spin est de verier la validite des heuristiques presentees aux chapitres 4 et 5.
Le prochain chapitre est donc exclusivement consacre a l'evaluation de ces resultats.
CHAPITRE 7
E valuation
Dans ce chapitre, nous tentons d'evaluer les heuristiques de selection et de presentation enoncees
aux chapitres 4 et 5 en analysant les textes generes par spin, puis d'evaluer le projet de facon
globale.
D'abord, certaines techniques d'evaluation en generation de texte sont presentees. De ces
techniques, deux ont ete retenues pour evaluer nos heuristiques: la comparaison avec des travaux
anterieurs et la comparaison qualitative avec des textes naturels hors du corpus d'analyse. Pour
evaluer le projet, nous analysons ses points forts et ses points faibles.
1. E valuation des heuristiques
1.1. L'evaluation en generation de texte
Traditionnellement, la generation automatique de texte ne s'est pas penchee activement sur
l'evaluation mais de plus en plus, l'importance d'une telle etape se fait sentir Wal89, BHS94].
Actuellement, en generation automatique de textes, il n'existe aucune methode acceptee
pour evaluer une theorie ou un systeme. Le probleme est amplie car l'entree et quelques fois
la sortie du processus de generation ne sont pas canoniques et il est souvent dicile de denir
l'ensemble des resultats corrects. Aujourd'hui, les chercheurs conscients d'evaluer leur travail ont
a leur disposition plusieurs methodes: une comparaison mot a mot avec des textes \naturels",
une comparaison plus qualitative, une evaluation \aveugle" par des sujets et une comparaison
avec les methodes deja existantes.
Comparaison mot a mot. La comparaison mot a mot est eectuee en generant un
texte de facon automatique (par un systeme informatique ou manuellement) suivant la theorie
a valider puis en le comparant avec le texte naturel source.
Vander Linden, par exemple, a implante sa theorie dans le systeme imagene, puis a compare mot a mot les textes produits par imagene avec des textes naturels VL93b]. Toute
128
échec fort
échec
faible
texte naturel
espace de solutions
domaine
Figure 7.22. Comparaison mot a mot en generation de texte
divergence entre le texte naturel et le texte genere est considere un echec. Les echecs sont cependant classies en deux categories: les echecs faibles et les echecs forts. Lorsque le systeme
genere un texte adequat au point de vue du phenomene a evaluer, en l'occurrence la structure
grammaticale, mais qu'il ne s'agit pas du choix du redacteur humain, alors l'echec est considere
faible (soft failure). Lorsque le systeme ne peut generer un phenomene ou genere un phenomene
inacceptable, il s'agit d'un echec fort (hard failure). Cette methode compte cependant deux
points faibles importants. D'abord, elle considere que le texte naturel est l'unique forme correcte ensuite, la distinction entre echecs faibles et echecs forts semble assez subjective: comment
determiner si un phenomene est acceptable ou non ?
En fait, la reproduction mot a mot du texte naturel est une condition susante mais pas
necessaire pour valider une theorie. Comme l'illustre la gure 7.22, les echecs dits faibles ne
devraient pas ^etre consideres des erreurs car, m^eme si redacteur humain a selectionne une autre
forme linguistique, ils font tout de m^eme partie de l'espace de solutions acceptables. En fait,
ces autres formes temoignent de la richesse et de la exibilite de la langue naturelle. A notre
avis, la frontiere entre echecs faibles et echecs forts doit plut^ot demarquer la frontiere entre
resultats corrects et resultats incorrects. Nous considerons alors que l'evaluation d'une theorie
en generation de texte ne peut ^etre eectuee par une comparaison mot a mot entre textes
naturels et textes generes automatiquement.
E valuation aveugle. Une seconde methode d'evaluation consiste a donner a des sujets
un ensemble de textes naturels et un ensemble de textes generes automatiquement et leur demander de les classier selon des criteres d'evaluation precis, comme le contenu informationnel
du texte, l'adaptation du texte au niveau de connaissance du lecteur, la comprehensibilite et
la coherence generales du texte, : : :En particulier, pour les textes d'instructions, il serait interessant de demander aux sujets d'executer la t^ache prescrite. On evaluerait alors la qualite des
textes generes en comparant les erreurs d'execution de la procedure, le temps de lecture, : : : avec
129
les donnees correspondantes pour les textes naturels. Pour notre travail, cette methode serait
tres ecace cependant, elle releve d'experiences psychologiques pour lesquels nous ne sommes
pas qualiee.
Comparaison qualitative. Une methode d'evaluation moins quantitative que les autres
mais plus souvent utilisee consiste a comparer globalement des textes generes automatiquement
avec des textes naturels Dal92, Tut92a]. Avec cette methode, on genere un ensemble de textes
du corpus d'analyse et un ensemble de textes d'un corpus test et on evalue si les deux ensembles
de resultats semblent aussi raisonnables l'un que l'autre.
Comparaison aux travaux deja existants. Pour mesurer l'avancement de la science,
il est toujours interessant de comparer les resultats de l'approche courante a ceux des approches
similaires developpees precedemment.
Pour evaluer nos heuristiques, nous avons alors suivi les deux dernieres methodes d'evaluation: demontrer que notre approche est plus adequate que toute autre methode existante, et
que des textes generes hors du corpus d'analyse sont comparables aux textes naturels correspondants.
1.2. Comparaison aux methodes precedentes
Deux travaux precedents Mel88, Dal92] se sont interesses a la planication de textes
d'instruction. Toutefois, le but de ces recherches ne consistait pas a determiner le contenu
semantique et la structure rhetorique des textes d'instructions. Pour une comparaison plus
stricte, nous avons repris les exemples utilises par ces chercheurs et les avons fait generer par
spin. Les textes de spin sont comparables ou mieux que ceux generes par les autres systemes.
Nous sommes consciente que ces comparaisons ne portent que sur un exemple par systeme, mais
seuls ces exemples etaient disponibles. De plus, faire generer un texte du repertoire de spin ou
un texte hors-corpus par epicure et le systeme de Mellish nous semble inapproprie vis a vis
de ces travaux.
1.2.1. Le systeme de Mellish
Pour comparer notre approche a celle de Mellish, nous avons repris son exemple de fusible:
comment faire fonctionner une prise de courant dont le fusible est defectueux. Les schemas
d'operations et la representation conceptuelle de la t^ache de Mellish nous sont disponibles ainsi
assurant que l'entree donnee aux deux systemes sont identiques.
130
Modication a l'entree de Mellish. En fait, l'entree de Mellish a ete prise presque
telle quelle trois modications mineures ont ete apportees:
(i) La syntaxe des schemas d'operation de Mellish a ete modiee pour l'adapter a celle de
spin.
(ii) Un modele du lecteur et la nature de la t^ache ont ete denis de facon a ce que le texte
genere se rapproche le plus de celui de Mellish.
(iii) Comme la planication de t^ache de Mellish se base sur la negation par echec, certaines preconditions sont niees par defaut. Dans spin, pour nier ces preconditions, leur
negation ont ete speciees comme etant vraies.
Analyse des resultats. La gure 7.23 montre le texte de Mellish et celui de spin1.
Le texte de spin est bien plus comprehensible que celui de Mellish. En eet, rappelons que
Mellish selectionne systematiquement toutes les operations de la representation de la t^ache et
son choix de relations rhetoriques ne permet pas autant de variations que dans un texte naturel.
Analysons en detail ces deux textes:
contenu textuel:
Tout d'abord, on remarque que le systeme de Mellish, ne produit pas de titre a ces
procedures. Les instructions 2 et 3 de Mellish ne sont pas presentees dans le texte de
spin, car elles sont trop generales pour ^etre interessantes. L'instruction 4, par contre,
contient les m^emes operations sequentielles dans les deux textes, mais spin n'inclut
pas l'eet then the fuse holder will be empty. spin suppose que le lecteur, aussi
novice qu'il soit, pourra deviner qu'en enlevant le fusible, la bo^%te de fusibles sera
vide. Avec un modele du lecteur dierent, spin pourrait eventuellement considerer
l'inclusion de cet eet dans le texte. L'instruction 5 est identique dans les deux textes.
L'instruction 6 de Mellish, contient un eet qui n'est pas communique dans le texte de
spin. Ici aussi, spin suppose que le lecteur peut le deduire. Finalement les instructions
7 et 8 contiennent les m^emes operations sequentielles. L'eet and the plug will be
working n'est pas communiqu
e par spin car il s'agit du but de la procedure le lecteur
peut donc deviner qu'en eectuant la procedure, son but sera atteint.
structure rhetorique:
Du point de vue rhetorique, les deux versions presentent les m^emes elements semantiques par les m^emes relations rhetoriques. En fait, les operations sequentielles sont
toujours presentees par des sequences d'actions.
1
Le format de ces textes a ete modie pour pouvoir numeroter les instructions.
131
Version de Mellish
Traduction
1.
2.
3.
4.
5.
6.
7.
8.
Version de SPIN
Pour faire fonctionner le syst
eme
in order for you to install
the new fuse the cover must
be off and the fuse holder
must be empty.
remove the cover and remove
the old fuse. then the fuse
holder will be empty.
pour faire en sorte que la
prise de courant fonctionne
vous devez avoir installe le
nouveau fusible.
pour faire en sorte que vous
installiez le fusible le couvercle doit ^etre ^ote et la bo^te
du fusible doit ^etre vide.
enlever le couvercle et enlever l'ancien fusible. ensuite
la bo^te du fusible sera vide.
install the new fuse.
however now the cover is
nott2 on.
install the cover.
then plug the plug in and
the plug will be working.
installez le nouveau fusible.
cependant maintenant le couvercle n'est pas mis.
installez le couvercle.
ensuite branchez la prise et la
prise fonctionnera.
in order for you to get the
plug to be working you must
have installed the new fuse.
Enlever le couvercle. Enlever
l'ancien fusible.
Installez le nouveau fusible.
Installer le couvercle.
Branchez la prise.
Figure 7.23. Fonctionnement de la prise: versions de Mellish et de spin
De facon globale, il semble evident que le texte de spin possede des heuristiques de selection
d'elements semantiques plus appropriees que le systeme de Mellish. En ce qui concerne le choix
des relations rhetoriques, le texte est tel qu'aucune conclusion pour ou contre nos heuristiques
ne puisse ^etre formulee.
1.2.2. EPICURE de Dale
Le travail de Dale aussi est apparente au n^otre. Pour comparer nos deux travaux, nous
avons suivi la m^eme approche qu'avec le travail de Mellish. Cette fois, nous avons pris son
exemple de soupe aux feves retrouve au chapitre 6 de Dal92]. La representation conceptuelle
de la t^ache est presentee a la gure 7.24.
Modications a l'entree de Dale. Quatre modications mineures ont ete apportees
a l'entree de Dale pour l'adapter a spin.
(i) D'abord, spin a besoin de conna^%tre certaines caracteristiques de la t^ache. Un modele
de la nature de la t^ache a donc ete developpe de facon a ce que le resultat de spin se
rapproche le plus possible de celui de epicure.
(ii) Les operations de Dale semblent ^etre basees sur des entites lexicales plut^ot que conceptuelles. En eet son operation 20 (stir in(obj: cream)) prote que l'anglais possede
l'entree lexicale to stir in. Cependant, celle-ci n'existe pas en francais c'est pourquoi,
2
devrait ^etre not
132
HHH
HH
HHH
HH
HHH
HHH
HH
HH
n2
HH
HHH
HHH
Hn6
n5
X
X
HX
H
X
H
X
X
HXHX
HH XXX
Hn21XXXXn22
n14
n15
n16
n17
n18
n19
n20a
n20b
n
HH
HH
n1
HHH
n9
n3
n7
n8
HHH
HH
n4
;P
@P@PPPP
;
;
@ PPPP
;
@n12
Pn13
n10
n11
HH
HH
HH
n23
n24
n25
n26
n27
n28
n
n1
n2
n3
n4
n5
n6
n7
n8
n9
n10
n11
n12
n13
n14
*faire(obj: soupe)
pr
eparer(obj: ingr
edients)
cuisiner(obj: ingr
edients)
pr
eparer(obj: f
eves)
pr
eparer(obj: l
egumes)
effectuer(obj: etape cuisson1)
effectuer(obj: etape cuisson2)
*tremper(obj: f
eves)
*
egoutter(obj: f
eves)
*rincer(obj: f
eves)
pr
eparer(obj: oignon)
pr
eparer(obj: pommes de terre)
pr
eparer(obj: carottes)
*trancher(obj: c
eleri)
*faire fondre(obj: beurre)
n15
n16
n17
n18
n19
n20a
n20b
n21
n22
n23
n24
n25
n26
n27
n28
*ajouter(obj: l
egumes)
egumes)
*faire revenir(obj: l
*ajouter(obj: (f
eves, bouillon, lait))
*faire mijoter
*liqu
efier(obj: soupe)
*ajouter(obj: cr
eme)
*m
elanger(obj: soupe)
*ajouter(obj: assaisonnements)
echauffer(obj: soupe)
*faire r
*
eplucher(obj: oignon)
*hacher(obj: oignon)
*
eplucher(obj: pommes de terre)
*hacher(obj: pommes de terre)
*gratter(obj: carottes)
*hacher(obj: carottes)
Figure 7.24. Representation conceptuelle de t^ache de la soupe
aux f
eves
de Dale
cette operation a ete remplacee par ses deux operations co-temporelles sous-jacentes
(20a et 20b) ajouter(obj: creme) et melanger(obj: soupe).
(iii) Pour simplier la generation, Dale elimine de la recette originale (tiree de Bean Book
de Rose Elliot) un certain nombre de phenomenes que epicure ne peut produire.
Cependant, pour le test eectue sur spin, les conditions et les preventions d'actions ont
ete reintroduites dans la recette, car le systeme est en mesure de les generer.
(iv) Le modele du lecteur de epicure a ete etendu pour contenir des schemas entiers d'operations et les connaissances du lecteur sur la nature de la t^ache, plut^ot que seul le nom
des operations que le lecteur sait decomposer. Entre autres, les operations de base du
lecteur ont ete identiees dans la gure 7.243, celles-ci sont precedees d'un asterisque
(*). Ici aussi, le modele du lecteur a ete developpe de facon a minimiser les dierences
entre les resultats de spin et ceux de epicure ou, dans le cas des conditions et des
preventions d'actions, la recette originale.
3 Cette structure n'indique que les liens hi
erarchiques. Les operations d'un m^eme plan sont toutes reliees
sequentiellement.
133
Analyse des resultats. La gure 7.25 presente les instructions4 generees par epicure,
une traduction de ce texte, puis la version spin du texte. Ces resultats montrent bien qu'avec
un modele du lecteur et une representation de t^ache appropries, les deux systemes generent des
textes equivalents en ce qui concerne le contenu semantique et la structure rhetorique. En fait,
les dierences entre les deux textes sont:
contenu textuel:
Le contenu des deux recettes sont identiques mais les preventions d'actions Ne pas
les faire brunir et sans la faire bouillir (instructions 9 et 15) se retrouvent
dans la recette originale et la version de spin, mais pas dans celle de epicure.
Aussi, a l'instruction 13, epicure considere l'operation 20 comme etant sequentielle,
tandis que spin introduit les operations co-temporelles en melangeant la soupe,
ajouter la cr
eme.
structure rhetorique:
Tous les choix rhetoriques de spin, epicure et du texte original sont identiques. Seulement, la phrase en melangeant la soupe, ajouter la creme est presentee par une
relation de concurrence plut^ot qu'une sequence pour la raison citee ci-haut.
De facon globale, l'etape d'optimisation de Dale rend le texte plus lisible en fusionnant en
une proposition les operations consecutives ayant un verbe ou un complement d'objet direct
commun (par exemple, soak the butter beans, drain the butter beans and rinse the butter beans
! soak, drain and rinse the butter beans). spin n'eectue pas cette etape, et produit donc un
texte plus lourd.
A priori, on aurait pu croire que dans le domaine des recettes de cuisine, les textes de
epicure auraient ete plus naturels. En eet, ses strategies sont optimisees pour ce domaine,
tandis que spin utilise des strategies generales. La strategie de Dale de ne communiquer que
les operations de plus bas niveau en temps que sequences d'actions s'applique bien aux recettes de cuisine ou 90 a 100 % des ces textes est compose ainsi VL93b]. Cependant, dans
une recette requerant un plus grand nombre d'etapes, epicure ne pourra diviser le texte en
sous-recettes dans le cas de spin une decomposition sera automatiquement eectuee car les
operations intermediaires ne sont pas systematiquement rejetees.
1.3. Comparaison avec des textes naturels hors du corpus d'analyse
Le second type d'evaluation eectue consiste a selectionner des textes hors du corpus d'analyse, a les generer et a eectuer une comparaison qualitative entre les resultats de spin et les
4
Nous ne presentons pas la liste des ingredients.
134
1.
2.
Version de EPICURE
Traduction
Version de SPIN
Butter bean soup
Soupe aux feves
Comment faire la soupe aux f
eves
3.
4.
Soak, drain and rinse the
butter beans.
Peel and chop the onion.
Peel and chop the potato.
5.
6.
7.
8.
9.
Scrape and chop the carrots.
Slice the celery.
Melt the butter.
Add the vegetables.
Saute them.
10.
11.
12.
13.
Add the butter beans, the
stock and the milk.
Simmer.
Liquidise the soup.
Stir in the cream.
14.
15.
Add the seasonings.
Reheat.
Figure 7.25.
Tremper, egoutter et rincer
les feves.
Eplucher
et hacher l'oignon.
Eplucher
et hacher la pomme
de terre.
Gratter et hacher les carottes.
Trancher le celeri.
Faire fondre le beurre.
Ajouter les legumes.
Les faire revenir.
Ajouter les feves, le bouillon
et le lait.
Faire mijoter.
Liqueer la soupe.
Ajouter la creme tout en
melangeant.
Ajouter les assaisonnements.
Rechauer.
Soupe aux f
eves
Tremper les f
eves. Les egoutter.
Les rincer.
Eplucher l'oignon. Le hacher.
Eplucher la pomme de terre. La
hacher.
Gratter les carottes. Les hacher
Trancher le c
eleri.
Faire fondre le beurre.
Ajouter les l
egumes.
Les faire revenir. Ne pas les
faire brunir.
Ajouter les f
eves, le bouillon
et le lait.
Faire mijoter.
Liqu
efier la soupe.
En la m
elangeant, ajouter la
cr
eme.
Ajouter les assaisonnements.
R
echauffer la soupe. Ne pas la
faire bouillir.
: versions de epicure et de spin
textes sources. Cette comparaison a ete eectuee avec 3 textes: une recette de cuisine recette]5 ,
un texte d'utilisation d'un lecteur de disques audio-numeriques JVC] et un texte de couture
patchwork]. Ces textes et d'autres textes generes par spin sont presentes a l'appendice E. Nous
presentons ici le texte d'utilisation du lecteur de disques audio-numeriques (appele par la suite
jvc).
La version originale du texte de disque audio-numeriques et la version de spin sont presentees a la gure 7.26. A partir du texte source, nous avons identie un ensemble de schemas
d'operations que le planicateur de t^ache de spin a ensuite selectionne et organise tel que
presente a la gure 7.276. Encore une fois, le modele du lecteur a ete developpe de facon a minimiser les dierences entre les deux textes. Comparons maintenant leur contenu et leur structure
rhetorique.
contenu textuel:
Le titre et les instructions 1 et 2 sont identiques dans les deux versions. La troisieme
instruction cependant diere spin produit simplement:
Les recettes du corpus d'analyse proviennent aussi de ce livre.
Ici aussi, la gure n'indique que les liens hierarchiques. Les operations d'un m^eme plan sont toutes reliees
sequentiellement.
5
6
135
Version originale
Pour placer, ecouter et arr^eter un CD
1. Appuyer sur open/close.
2. Mettre un CD, face imprimee vers le haut, sur le plateau.
3. Pour ecouter le CD, appuyer sur Lecture/pause et ajuster le volume. Le plateau CD se ferme
automatiquement. L'a"chage indique la plage reproduite et la duree ecoulee depuis le debut.
4. Pour arr^eter le CD, appuyer sur clear. A la reprise de la lecture du CD, celle-ci commence a
partir de la plage 1.
5. Pour mettre l'appareil en mode de pause, appuyer sur Lecture/pause pendant que le CD est
reproduit, en appuyant de nouveau sur Lecture/pause le CD commence la ou il a ete laisse.
6. Pour retirer le CD, appuyer sur open/close, sortir le CD et appuyer de nouveau sur open/close,
pour fermer le plateau. Conserver le plateau ferme, sauf pendant le chargement et le retrait pour
proteger le mecanisme de la poussiere et des accidents.
Version de spin
1 2 3 4 5 6 -
Pour placer un CD, l'
ecouter puis l'arr^
eter.
Appuyez sur OPEN/CLOSE.
Mettez le CD, face imprim
ee vers le haut sur le plateau.
Appuyez sur Lecture/pause.
Ajustez le volume.
Pour arr^
eter le CD, appuyez sur CLEAR.
Pour mettre l'appareil en mode de pause, appuyez sur Lecture/pause pendant que le CD
est reproduit.
Si Lecture/pause est appuy
e de nouveau, le CD se commence l
a o
u il a et
e laiss
e.
Pour le retirer, appuyez sur OPEN/CLOSE et sortez le CD.
Appuyez sur OPEN/CLOSE de nouveau, pour fermer le plateau.
Conservez-le ferm
e, sauf pendant le chargement et le retrait pour prot
eger le
m
ecanisme de la poussi
ere et des accidents.
Figure 7.26. Texte jvc: versions originale et de spin
- Appuyez sur Lecture/pause.
- Ajustez le volume.
tandis que le texte source est:
Pour ecouter le CD, appuyer sur Lecture/pause et ajuster le volume.
Le plateau CD se ferme automatiquement.
L'achage indique la plage reproduite et la duree ecoulee depuis le debut.
spin ne produit pas pour ecouter le CD. Cette operation est obligatoire et n'inuence
pas comment ses operations-enfants sont eectuees. Il s'agit donc d'un eet. spin tente
alors de satisfaire les heuristiques d'introduction de cet element semantique cependant,
le systeme ne le considere pas necessaire, car:
{ ses operations-enfants (appuyez sur Lecture/pause et ajustez le volume) ne peuvent pas vraiment ^etre mal executees,
{ le lecteur peut comprendre pourquoi les operations-enfants doivent ^etre executees,
{ le lecteur ne peut supposer une mauvaise raison d'eectuer les operations-enfants.
136
HHH
HH
n0
HH
n5
n1
n4
n12
HH
n7
n2
n6
HH
HHH
HHH
HH
HHH
n3
PP
;
;
; @@@PPPPPP
PPPP
@@
;;
Pn11
n8
n9
n10
P PP
PP
n16;;@@n17
n13
n14
n15
n18
n19
n0
n1
n2
n3
n4
n5
n6
n7
n8
n9
n10
n11
n12
n13
n14
n15
n16
n17
n18
n19
n20
n20
(placer)(obj: CD), ecouter(obj: CD), arr^
eter(obj: CD)
placer(obj: CD)
ecouter(obj: CD)
*arr^
eter(obj: CD)
ouvrir(obj: plateau)
*mettre(obj: CD, man: face imprim
ee vers le haut, dest: plateau)
*appuyer(dest: Lecture/pause)
*ajuster(obj: volume)
*appuyer(dest: CLEAR)
*mettre(obj: appareil, mod: en mode de pause)
*commencer(obj: CD, man: l
a o
u il a e
t
e laiss
e)
*retirer(obj: CD)
*appuyer(dest: OPEN/CLOSE)
*appuyer(dest: Lecture/pause, man: pendant que le CD est reproduit)
*appuyer(man: de nouveau, dest: Lecture/pause)
*appuyer(dest: OPEN/CLOSE)
*sortir(obj: CD)
fermer(obj: plateau)
prot
eger(obj: m
ecanisme, man: de la poussi
ere et des accidents)
*appuyer(man: de nouveau, dest: OPEN/CLOSE)
*conserver(obj: plateau, man: ferm
e sauf pendant le chargement et le retrait)
Figure 7.27. Representation conceptuelle de la t^ache pour le texte jvc
137
Aussi, pour les m^emes raisons, les eets Le plateau CD se ferme automatiquement et
L'achage indique la plage reproduite et la duree ecoulee depuis le debut ne sont pas
selectionnes par spin. Communiquer ces eets pourrait ^etre justie, cependant, nous
croyons que ne pas les communiquer ne cree pas un texte incorrect.
L'instruction 4 contient la m^eme information dans le texte source et le texte de spin,
mais pour les raisons precedentes, l'eet A la reprise de la lecture du CD, celle-ci
commence a partir de la plage 1 n'est pas inclus par spin.
Finalement, les instructions 5 et 6 contiennent la m^eme information dans les deux
textes.
Analyse de la structure rhetorique
En ce qui concerne les choix rhetoriques, spin n'a pas toujours selectionne les m^emes
relations que celles utilisees dans le texte source. En eet, spin a decide d'introduire
l'operation eventuelle et son eet par une c-condition et un resultat,
- Si Lecture/pause est appuy
e de nouveau, le CD se commence l
a o
u il a
et
e laiss
e.7
tandis que le texte naturel utilise une maniere et un resultat:
en appuyant de nouveau sur Lecture/pause le CD commence la ou il a ete laisse.
Rappelons de la section 3.9 du chapitre 5 que les operations eventuelles sont presentees
soit par une c-condition, soit par une maniere. Ces deux relations semblent interchangeables s'il s'agit d'une regle generale, mais si l'operation ne doit pas ^etre executee
immediatement, alors la c-condition semble preferee. Comme l'operation appuyer de
nouveau sur Lecture/pause ne doit pas ^etre eectuee immediatement, spin a prefere la
presenter par une c-condition.
En appliquant les heuristiques sur des textes hors du corpus d'analyse, spin a pu generer
un texte assez naturel et comparable au texte source. Ce test a ete eectue sur d'autres textes
hors du corpus, cf. l'appendice E.2. Ainsi, nous sommes assez conante de la validite de nos
heuristiques.
2. E valuation du projet
2.1. Points forts
Parmi les points forts de notre travail, citons:
7 L'expression le CD se commence est bien s^
ur incorrecte. Cette erreur est due aux approximations faites
au niveau grammatical.
138
2.1.1. La distinction entre le contenu et la structure rhetorique
Le point fort le plus important de notre travail est que le modele theorique individualise
les deux questions importantes en planication textuelle. En eet, le niveau semantique (quoi
dire) et le niveau rhetorique (comment l'organiser) sont consideres separement tout en etant
relies de facon plusieurs a plusieurs. Dans les approches precedentes, la distinction entre ces
deux niveaux n'est generalement pas faite. Par exemple, en utilisant la RST ou les schemas
rhetoriques de McKeown McK85] pour eectuer la planication textuelle entiere, les questions
semantiques et rhetoriques sont considerees dans un m^eme module. Pour presenter un element
de sens par dierentes strategies rhetoriques, les m^emes contraintes semantiques doivent alors
^etre presentes dans dierents plans rhetoriques ainsi les alourdissant inutilement. Aussi, dans un
contexte de generation multilingue, si l'on considere que le contenu semantique est independant
de la langue de communication, mais que les choix rhetoriques dierent, notre approche permet
de modier les choix rhetoriques sans toucher au niveau semantique.
2.1.2. Un systeme motive linguistiquement
Habituellement, la linguistique-informatique attaquee du point de vue de la linguistique
donne lieu a des theories sur l'utilisation de la langue, mais donne rarement naissance a des systemes concrets. D'un autre c^ote, lorsqu'attaquee du point de vue informatique, la linguistiqueinformatique, donne souvent lieu a des systemes automatiques, mais ceux-ci ne sont pas toujours
bases sur des phenomenes linguistiques justies. Bien que notre expertise soit plut^ot informatique, nous nous sommes eorcee de b^atir un systeme informatique base sur des fondements
linguistiques.
2.1.3. Un systeme complet
Comme dernier point fort de notre recherche, notons que le systeme spin eectue toutes
les etapes de la generation de textes de facon automatique. La gure 7.28 reprise du chapitre 3
illustre notre vision de la generation de textes d'instructions comme une serie de choix entre
dierents niveaux de representations conceptuelles et textuelles.
Si un systeme n'eectue que quelques etapes de la generation, il est plus facile de supposer
que l'entree dont il a besoin pourra ^etre produite automatiquement, et que la sortie produite
sura au prochain module pour generer un texte naturel. spin eectue toutes les etapes de
la generation, ainsi demontrant que la redaction completement automatique de courts textes
techniques est realisable.
139
Représentation Conceptuelle du Domaine
I
Représentation Conceptuelle de la Procédure
..
.
..
.
..
.
II
Représentation Sémantique du Texte
III
Représentation Rhétorique du Texte
IV
Représentation Grammatico-Lexicale du Texte
V
Représentation Typographique du Texte
.
.
.
.
.
.
Figure 7.28. Notre approche a la planication de textes d'instructions
140
but
Pour programmer un enregistrement
Pour une meilleure qualité d’image, régler le sélecteur de vitesse de bande sur SP.
Selectionner le canal 4 en appuyant sur la touche de canal.
Appuyer sur la touche OTR.
Lorsqu’elle est enfoncée 1 fois, PM 10:35 (30min).
Lorsqu’elle est enfoncée 2 fois, PM 11:05 (1 h).
Lorsqu’elle est enfoncée 3 fois, PM 11:35 (1 h 30min).
Appuyer sur la touche TIMER dans un délai de 9 secondes.
séquence
Pour une meilleure qualité d’image,
régler le sélecteur de vitesse de bande sur SP.
Sélectionner le
canal 4 en appuyant
sur la touche de canal.
but
Pour une meilleure
qualité d’image,
régler le sélecteur de
vitesse de bande sur SP.
séquence
séquence
Appuyer sur la touche
TIMER dans un délai
de 9 secondes.
Appuyer sur la touche OTR.
Lorsqu’elle est enfoncée 1 fois, PM 10:35 (30min).
Lorsqu’elle est enfoncée 2 fois, PM 11:05 (1h)
Lorsqu’elle est enfoncée 3 fois, PM 11:35 (1h 30min)
manière
Sélectionner
le canal 4
en appuyant sur la
touche de canal.
résultat
Appuyer sur la touche OTR.
Lorsqu’elle est enfoncée 1 fois, PM 10:35 (30 min).
Lorsqu’elle est enfoncée 2 fois, PM 11:05 (1 h).
Lorsqu’elle est enfoncée3 fois, PM 11:35 (1 h 30 min).
séquence
Lorsqu’elle est enfoncée
1 fois, PM 10:35 (30 min).
c-condition
Lorsqu’elle est PM 10:35
enfoncée 1 fois (30 min)
séquence
Lorsqu’elle est enfoncée
2 fois, PM 11:05 (1 h).
c-condition
Lorsqu’elle est PM 11:05
enfoncée 2 fois (1 h)
Lorsqu’elle est enfoncée
3 fois, PM 11:35 (1 h 30 min).
c-condition
Lorsqu’elle est PM 11:35
enfoncée 3 fois (1 h 30 min)
Figure 7.29. Structure rhetorique du texte vcr par la RST
2.2. Points faibles
Bien s^ur, notre recherche possede certains points faibles.
2.2.1. Les structures semantiques et rhetoriques de SPIN
Alors que dans le modele theorique, les structures semantiques et rhetoriques sont considerees arborescentes, dans spin, ces structures sont implantees en tant que listes lineaires. En eet,
dans le modele, les representations conceptuelle, semantique et rhetorique sont arborescentes,
tandis que le texte est lineaire. Il est donc necessaire de lineariser les structures arborescentes
avant la construction du texte nal. Pour simplier l'implantation, spin eectue la linearisation
des la construction de la structure semantique. En eet, seuls les elements semantiques et les
relations rhetoriques aux feuilles des representations sont consideres. Par exemple dans le texte
vcr, l'analyse RST la plus juste, a notre avis, est illustree a la gure 7.29. Pourtant, pour ne
considerer que les feuilles de la structure, tout en analysant chaque expression linguistique, spin
utilise la structure large et peu profonde de la gure 7.30. Cette strategie est acceptable pour
des petits textes d'instructions, mais ne l'est probablement dans d'autres genres textuels ou
dans des textes d'instructions plus complexes.
141
but
Pour programmer un enregistrement
Pour une meilleure qualité d’image, régler le sélecteur de vitesse de bande sur SP.
Selectionner le canal 4 en appuyant sur la touche de canal.
Appuyer sur la touche OTR.
Lorsqu’elle est enfoncée 1 fois, PM 10:35 (30min).
Lorsqu’elle est enfoncée 2 fois, PM 11:05 (1 h).
Lorsqu’elle est enfoncée 3 fois, PM 11:35 (1 h 30min).
Appuyer sur la touche TIMER dans un délai de 9 secondes.
séquence
séquence
séquence
but
régler le sélecteur de
vitesse de bande sur SP.
Sélectionner
le canal 4
manière
en appuyant sur la
touche de canal.
Pour une meilleure
qualité d’image,
c-condition
Appuyer sur la touche OTR.
Lorsqu’elle est
enfoncée 1 fois
résultat
PM 10:35
(30 min)
c-condition
Lorsqu’elle est
enfoncée 2 fois résultat
PM 11:05
(1 h)
c-condition
Appuyer sur la touche
dans un délai
de 9 secondes.
Lorsqu’elle est
enfoncée 3 fois
résultat
PM 11:35
(1 h 30 min)
Figure 7.30. Structure rhetorique du texte vcr tel que considere par spin
2.2.2. La longueur des textes
Les textes d'instructions generes par spin sont assez courts, ils comptent en moyenne
12 relations rhetoriques. Les textes plus longs que nous avons analyses consistent en fait en
une sequence de courts textes d'instructions. Ces courts textes sont relies entre eux par une
relation de sequence8 et sont regis par les m^emes regles textuelles globales. Cependant les regles
locales pour selectionner leur contenu et leur structure rhetorique semblent independantes de
leur appartenance a un texte global plus large. Nos heuristiques de selection et de presentation
semblent donc applicables dans le cas de textes plus longs. Seulement une strategie de decoupage
de la t^ache globale en un ensemble de textes locaux devrait ^etre developpee.
3. Resume
Dans ce chapitre, nous avons tente d'evaluer notre recherche. D'abord, nous avons valide
les heuristiques presentees aux chapitres precedents. Nous croyons qu'une comparaison mot a
mot de textes generes par spin avec des textes naturels constitue une condition susante mais
non necessaire pour evaluer les heuristiques. Nous avons alors utilise deux autres methodes.
D'abord nous avons compare les resultats de spin avec les systemes similaires deja existants
Mel88, Dal92]. Ensuite, nous avons produit des textes d'instructions ne faisant pas partie du
corpus d'analyse et les avons compares aux textes sources de facon qualitative. Nous n'avons
pas considere chaque heuristique de facon individuelle, mais les avons plut^ot evalues de facon
globale. Les deux methodes semblent indiquer que les heuristiques de selection et de presentation
sont appropriees pour selectionner le contenu et la structure rhetorique des textes d'instructions.
Cependant, dans le cas des eets, spin semble bien moins explicite que les redacteurs humains.
8
Une relation d'alternative serait aussi possible.
142
Pour evaluer le projet de facon globale, nous avons note certains de ses points forts: la distinction entre les niveaux semantiques et rhetoriques et le developpement d'un systeme complet
motive linguistiquement et ses points faibles: les structures semantiques et rhetoriques lineaires
de spin et la petite taille des textes consideres.
CHAPITRE 8
Conclusion
Dans cette these, nous avons tente de repondre a deux questions fondamentales en planication
automatique de texte:
Quelle information doit ^etre communiquee dans un texte et quelle information doit ^etre
laissee implicite ?
Comment l'information communiquee doit ^etre structuree pour construire un texte
coherent ?
Pour repondre a ces questions, nous avons deni un ensemble d'elements semantiques qui
sont presentes dans le texte par des relations rhetoriques. Pour les textes d'instructions, nous
avons deni 9 elements semantiques: les operations sequentielles, co-temporelles et eventuelles,
les conditions materielles, les options, les eets, les inuences, les preventions et l'information
generale. Ces elements semantiques sont presentes par 7 relations rhetoriques: les sequences
temporelles, les buts, les c-conditions, les resultats, la concurrence, la maniere et l'elaboration.
Gr^ace a une analyse de corpus, nous avons constate que le choix des elements semantiques
et des relations rhetoriques depend de plusieurs facteurs: le contenu et la structure des representations conceptuelles du domaine et de la t^ache, des contraintes de cooccurrences d'elements
semantiques et de relations rhetoriques, les connaissances et intentions du lecteur, la nature de
la procedure et le but communicatif du texte. En se basant sur ces contraintes, nous avons developpe des heuristiques d'introduction, gerant l'inclusion d'elements semantiques dans le texte,
et des heuristiques de presentation, gerant le choix des relations rhetoriques. Ces heuristiques
ont ete implantes dans le systeme informatique spin qui a servi a valider la theorie.
1. Avenues de recherche
Cette these ne s'est penchee que sur certains aspects particuliers de la planication de textes
d'instructions. Plusieurs questions n'ont pas ete abordees et de nombreuses extensions seraient
144
possibles. Nous avons divise ces questions en trois categories: les extensions a l'implantation,
les extensions au modele theorique et les extensions generales de la these.
1.1. Extensions a l'implantation
spin n'est qu'un systeme prototype. Parmi les extensions possibles citons, l'implantation
de structures semantiques et rhetoriques arborescentes au niveau du planicateur de texte et
l'extension des autres modules: la gree d'un planicateur de t^ache plus standard, d'un module
de realisation grammaticale plus variee et mieux motivee et d'un module de realisation motrice
permettant une mise en page plus elaboree.
1.2. Extensions au modele theorique
1.2.1. Les repetitions et les alternatives
Les phenomenes de repetitions et d'alternatives n'ont pas ete abordes dans cette these. Bien
que ces phenomenes soient frequents dans les textes d'instructions, ils requierent une representation conceptuelle qui ne s'adapte pas facilement a une hierarchie de plans. Pour les repetitions,
un genre de boucle au niveau des plans est necessaire (voir par exemple l'approche adoptee par
le systeme noah Sac77]), et les alternatives requierent des liens de disjonctions entre noeuds
d'un m^eme plan. Pour une analyse de ces phenomenes dans les textes d'instructions, se referer
a Kar88] et a Roc92].
1.2.2. Une representation conceptuelle de la t^ache plus elaboree
Dans notre modele, la representation conceptuelle de la t^ache est une hierarchie de plans.
Cette representation, basee sur des resultats en psychologie Dix87a, BVDGH90], indique les
operations a eectuer dans la procedure mais ne represente pas les operations a ne pas eectuer.
Pour generer des imperatifs negatifs notre approche se base alors sur un modele de l'usager et
la nature de la t^ache. Une representation conceptuelle basee sur la trace du planicateur de
t^ache indiquerait non seulement quoi faire et quoi ne pas faire, mais aussi pourquoi ne pas faire
certaines operations.
1.2.3. La selection de contenu comme question non binaire
Cette these a aborde la question de selection de contenu comme question binaire: un element semantique est communique ou laisse implicite. La representation conceptuelle de la t^ache
utilise donc des blocs d'information correspondants a un element semantique. La question de
selection de contenu, idealement, ne devrait pas supposer des blocs d'information bien pratiques
a inclure ou non dans le texte, mais plut^ot devrait considerer des blocs d'information bien plus
petits de facon a construire un element semantique a partir de blocs primitifs. Ceci permettrait
145
de generer de facon naturelle des phenomenes comme les repetitions. En eet, la representation
conceptuelle d'une repetition doit bien identier sa portee et son cas d'arr^et. Pourtant les instructions pour un lecteur humain n'ont pas a ^etre aussi strictes. C'est le cas, par exemple dans
des instructions pour utiliser un shampooing:
(113) Appliquer sur les cheveux mouilles, faire mousser, rincer et repeter.
Ici, bien que la representation conceptuelle doit specier la portee et le cas d'arr^et de la
repetition, le texte ne les specie pas.
1.2.4. L'inuence du domaine de discours
Notre modele ne considere que des heuristiques generales a tous les domaines de discours.
Pourtant, les recettes de cuisines semblent exhiber un contenu et une structure rhetorique bien
plus stereotypes que les autres textes analyses. Nous avons explique ce phenomene par le but
communicatif du texte pourtant, Mellish ME89] et Dale Dal92] semblent justier certains
choix de la planication textuelle par le domaine de discours. Il serait tres interessant de verier si eectivement le domaine de discours inuence la planication textuelle ou bien si ces
variations peuvent ^etre expliquees uniquement par le but communicatif.
1.3. Extensions generales
1.3.1. L'application des heuristiques a d'autres langues
Plus la generation de discours descend du niveau conceptuel vers le niveau linguistique,
plus la langue de transmission inuence les decisions a prendre. En eet, la representation
conceptuelle du discours est par denition independante de la langue de transmission cependant
l'intonation, la mise en page1 , le choix des mots et des structures grammaticales dependent
fortement de la langue. Qu'en est-t-il alors du contenu semantique et de la structure rhetorique
du discours ?
A prime abord, il semblerait que le contenu textuel soit independant de la langue de
transmission. En eet, dans les manuels techniques, le domaine de discours et le contenu ont
precedence sur le style textuel. Cependant, Hervey et Higgins HH92] considerent les manuels
d'instructions comme un genre de texte publicitaire, fortement oriente vers le consommateur.
C'est pourquoi, ils notent que dans certains manuels, le contenu semantique des textes dans
dierentes langues n'est pas le m^eme. Ils citent en particulier le manuel d'une Renault 5 ou la
version francaise et anglaise ne decrivent pas les m^emes phenomenes. Hervey et Higgins justient
cette dierence de contenu par la dierence culturelle entre francophones et anglophones. En
1
par exemple, ecriture vers la droite ou vers la gauche, paragraphes ou listes enumerees HH92]
146
eet, dierentes cultures reagissent dieremment a des m^emes phenomenes linguistiques et
possedent des niveaux de connaissances dierents. C'est pourquoi, une recette de cuisine peut
s'adresser a un lecteur anglais en supposant un niveau d'expertise faible, tandis que cette m^eme
attitude ousquerait un francais. La langue de communication semble donc jouer un r^ole indirect
dans la determination du contenu textuel d'instructions car elle est une composante importante
dans la culture du lecteur. D'autres facteurs comme le statut social du lecteur, son mode de
vie, sa situation geographique, etc inuencent aussi au m^eme titre le contenu textuel.
Nos heuristiques de selection ne sont pas inuencees par la langue de communication,
ni par d'autres facteurs culturels. Dans spin, pour prendre en consideration les dierences
culturelles des lecteurs, le modele du lecteur devrait ^etre etendu pour inclure non seulement ses
connaissances sur le domaine, mais aussi sa culture. De plus, des heuristiques devraient ^etre
developper pour prendre en consideration l'inuence des dierences culturelles.
A l'inverse du contenu semantique, la structure textuelle est directement inuencee par la
langue de communication. Kittredge note que l'organisation textuelle d'un sous-langage technique est virtuellement identique en francais et en anglais Kit82]. Cependant, Scott et son
equipe remarquent que la structure textuelle preferee pour exprimer une m^eme representation
semantique varie d'une langue a l'autre DSH93, Sco93, DHP+ 94]. Par exemple, dans:
(114) a. The stepping load can be altered by loosening the locking lever and changing the
position of the cylinder foot.
La charge d'appui peut ^etre modiee en desserrant le levier et en changeant la
position des verins.]
b. Pour modier la charge d'appui, desserrer les leviers puis deplacer le pied des verins.
c. Nach Lockern der Klemmhebl kann durch Verschierben des Zylinderfu)es die Tretbelastung ver$adert werden.
Apres avoir desserre les leviers, en poussant les verins, la charge d'appui peut ^etre
modiee.]
ce qui en anglais est presente par une relation de maniere (by loosening : : :), est presente en
francais par un but (pour modier : : :) et en allemand par une circonstance (Nach Lockern : : :).
Le niveau rhetorique etant le predecesseur immediat du niveau grammatical, il n'est pas
etonnant de retrouver des variations entre les langues. Bien que generalement les choix rhetoriques se ressemblent beaucoup entre langues voisines, nos heuristiques de presentation devraient
^etre ajustees pour ^etre applicables a la generation multilingue.
1.3.2. L'application des heuristiques a d'autres genres textuels
Le travail presente ici ne s'est penche que sur les textes d'instructions. Ce genre textuel
exhibent peu de diversite semantique et rhetorique, permettant ainsi leur formalisation. Nous
147
speculons que dans la plupart des textes, le genre textuel et son but communicatif sont tres lies
au choix du contenu, mais bien moins au choix rhetorique. Dans le cas des textes d'instructions,
ce phenomene est illustre par les gures 4.7, 4.8 et 5.9. Nous speculons que dans d'autres genres
textuels ce phenomene est aussi valide. Nos heuristique de selection serait donc presque inutiles
dans un autre genre textuel, tandis que les heuristiques de presentation seraient probablement
re-utilisables sous reserve d'une adaptation.
1.3.3. Validation par des methodes psychologiques
Finalement, la question d'evaluation reste peu developpee. Nous avons verie les heuristiques de selection et de presentation par des comparaisons qualitatives cependant il serait tres
interessant de valider les heuristiques par des methodes de psychologie. En eet, en mesurant
le temps de lecture des textes generes automatiquement et des textes naturels et le temps et
les erreurs d'execution des procedures decrites, la comprehension et la coherence de ces textes
pourraient ^etre evaluees.
2. Discussion et Motivation
Au chapitre 1, nous avons motive cette recherche en mentionnant ses contributions a la
science:
du point de vue theorique: l'interpretation d'instructions et le developpement d'un
modele de planication textuelle motive linguistiquement
du point de vue pratique: l'automatisation de la redaction de textes d'instructions.
Les contributions theoriques ont ete demontrees tout au long de la these. Penchons-nous
maintenant sur le point de vue pratique. Reiter, Mellish et Levine ont demontre que la production de documentation technique est un processus assez co^uteux et peu automatise dans
l'industrie RML95]. Pourtant, dans des domaines ou des specications d'appareils existent
deja, l'automatisation de ce processus implique de nombreux avantages. Entre autres:
La reduction de l'entretien de la documentation: L'entretien et les mises a jour
d'un document peuvent, en eet, ^etre plus co^uteux que sa production initiale. Avec une generation automatique, seule une modication dans les specications conceptuelles est necessaire
et les nouveaux documents peuvent ^etre produits automatiquement. Avec l'approche manuelle,
il est necessaire de chercher dans tous les documents les references au phenomene modie, ce
qui est long, co^uteux, et non a l'epreuve des erreurs.
La consistance entre la documentation et l'appareil: Idealement, le concepteur de
l'appareil et le redacteur technique partagent une m^eme base de specications. La production
148
automatique assure ainsi la consistance entre la documentation et l'appareil ce qui ne peut ^etre
garanti avec une redaction manuelle.
La conformite aux standards de redaction: Generalement les documents techniques
doivent se soumettre a des standards de redaction grammaticaux, lexicaux et typographiques.
Manuellement, ces standards sont diciles a satisfaire car ils ne sont pas naturels, mais ils sont
d'autant plus faciles a satisfaire automatiquement.
Nous croyons que des systemes de redaction technique automatique ou d'assistance a la
redaction seront un jour realite. Cette recherche n'a certainement pas developpe un systeme de
redaction de manuels d'instructions completement automatique. Cependant, nous osons esperer
qu'il y contribuera.
APPENDICE A
Corpus
1. Bibliographie
1.1. Corpus d'analyse
1.1.1. Textes d'execution
armoire] J. Crochemore. Meubles utiles a construire, 3. Lits, Commodes, Armoires.
Eyrolles, Paris, 1989.
auto] Shell. Guide d'intervention entretien automobile. Shell Canada Limited.
bouche] Selection du Reader's Digest. Solutions pratiques a 4000 problemes quotidiens.
Selection du Reader's Digest, Montreal, 1989.
elect] Shell. Guide d'intervention urgences en electricite. Shell Canada Limited.
recette] J. Benoit. La Nouvelle Encyclopedie De La Cuisine. Les Messageries du
Saint Laurent, Montreal, edition deluxe, 1974.
tele] Toshiba. Mode d'emploi, televiseur couleur CX21349. Toshiba.
vcr] Toshiba. Mode d'emploi, magnetoscope a cassette M-5100C. Toshiba.
1.1.2. Textes hybrides
mazda] Mazda. Mazda 323, Conduite et Entretien. Mazda Motor Corporation, 1988.
ordi] I. Virga. Organisez votre disque dur. Marabout, Belgique, 1987.
photo] H. Champollion et D. Champollion. La photographie. Les guides pratiques.
Ouest-France, Rennes, France, 1991.
rotin] A. Bauta. Technique du rotin. Mains agiles. H. Dessain & Tolra, Paris, 1970.
1.1.3. Textes de comprehension
antique] R. Le Corre. Comment restaurer les meubles antiques. Renouveau Pedagogique,
Montreal, 1970.
peint] R. Moser. Peinture sous verre. Savoir Creer. Fleurus, Paris, 1984.
150
soue] J. Valiere. Le souage du verre, art perdu et retrouve. Lemeac, Ottawa, 1979.
vin] A. Beaucage. Faire son vin soi-m^eme, des petits moyens pour de grands vins.
Les editions de L'homme, Montreal, 1984.
1.2. Corpus test
JVC] JVC. Manuel d'instructions: Mini chaine compacte.
patchwork] de ls en aiguille. Montreal, 1975.
recette] J. Benoit. La Nouvelle Encyclopedie De La Cuisine. Les Messageries du
Saint Laurent, Montreal, edition deluxe, 1974.
2. Caracteristiques des types de textes
texte
armoire]
auto]
bouche]
elec]
recette]
tele]
vcr]
mazda]
ordi]
photo]
rotin]
antique]
peint]
sou$e]
vin]
longueur moyenne des dexterite/jugement instruments specialisation mise en
procedures (mots)
requis
requis
des termes
page
270
100
50
100
370
70
55
120
200
200
255
820
550
120
250
moyen
peu
moyen
moyen
peu
peu
peu
peu
peu
moyen
moyen
grand
grand
moyen
grand
moyen
beaucoup
peu
peu
moyen
peu
peu
peu
peu
moyen
moyen
beaucoup
beaucoup
beaucoup
beaucoup
peu
peu
peu
peu
peu
peu
peu
peu
moyen
moyen
moyen
moyen
moyen
grand
grand
beaucoup
beaucoup
beaucoup
beaucoup
moyen
beaucoup
beaucoup
beaucoup
moyen
moyen
moyen
peu
peu
peu
moyen
151
3. Reference des exemples
exemple reference
(1)
(2)
(3)
(4a)
(4b)
(5a-b)
(6a-b)
(7)
(8)
(9a-b)
(10)
(11)
(12)
(13)
(14)
(15a-c)
(16)
(17)
(18)
(19)
(20)
(21)
(22)
(23)
(24)
(25)
(26)
(27)
(28)
(29)
(30)
(31)
(32)
(33)
(34a)
(34b)
(34c)
(35)
(36)
(37a)
(37b)
(38a)
(38b)
(39)
(40)
(41a)
(41b)
vcr, p.8]
non-retrouve
non-retrouve
vcr, p.8]
variation de vcr, p.8]
Dix87a, p.84]
Dix87a, p.81]
Dix87b, p.24]
Dix87b, p.34]
Bal92b, p.296]
DE93b, p187]
DE93b, p187]
DE93b, p49]
DE93b, p49]
DE93b, p49]
DHP+94, p.61]
tele, p.14]
elec, p.19]
elec, p.17]
vcr, p.23]
bouche, p.342]
mazda, p2-15]
peint, p.17]
variation de elec, p.17]
vcr, p.23]
DEW95]
non-retrouve
non-retrouve
non-retrouve
non-retrouve
auto, p.14]
sou$e, p.73]
tele, p.12]
peint, p.108]
vcr, p.16]
non-retrouve
non-retrouve
ordi, p.197]
peint, p.30-31]
elec, p.17]
vcr, p.4]
auto, p.14]
auto, p.8]
auto, p.9]
peint, p.30-31]
recette, p.139]
auto, p.14]
exemple reference
(41c)
(42)
(43)
(44)
(45)
(46)
(47)
(48)
(49)
(50a)
(50b)
(50c)
(51)
(52)
(53a)
(53b)
(54)
(55)
(56)
(57)
(58a)
(58b)
(59)
(60)
(61)
(62)
(63)
(64)
(65)
(66)
(67)
(68a)
(68b)
(69a)
(69b)
(70)
(71)
(72a)
(72b)
(73)
(74)
(75)
(76)
(77)
(78)
(79a)
(79b)
photo, p150-151]
auto, p.8]
vcr, p.4]
vcr, p.4]
ordi, p.198]
ordi, p.199]
vcr, p.23]
variation de sou$e, p.76]
auto, p.12]
elec, p.18]
DE93b, p6]
rotin, p.33]
sou$e, p.77]
sou$e, p.73]
peint, p.31]
auto, p.10]
elec, p.18]
auto, p.8]
non-retrouve
DE93b, p187]
peint, p.32]
auto, p.14]
tele, p.14]
recette, p.515]
RS92, p.205]
elec, p.17]
sou$e, p.75]
RS92, p.206]
bouche, p.342]
RS92, p.206]
non-retrouve
non-retrouve
non-retrouve
sou$e, p.31
non-retrouve]
vcr, p.8]
elec, p.19]
elec, p.17-19]
vcr, p.16]
elec, p.21]
elec, p.17]
auto, p.8]
elec, p.22]
auto, p.8]
vcr, p.14]
non-retrouve
non-retrouve
exemple reference
(80a)
(80b)
(81)
(82)
(83a-f)
(84a-f)
(85a)
(85b)
(85c)
(86a)
(86b)
(86c)
(87)
(88)
(89)
(90a)
(90b)
(90c)
(91)
(92)
(93a)
(93b)
(94)
(95a)
(95b)
(96)
(97)
(98a)
(98b)
(99)
(100)
(101a)
(101b)
(102)
(103)
(104)
(105)
(106)
(107)
(108)
(109)
(110)
(111)
(112)
(113)
(114a-c)
vcr, p.4]
auto, p.14]
elec, p.20]
tele, p.15]
non-retrouve
non-retrouve
sou$e, p.76]
elec, p.19]
mazda, p.2-13]
auto, p.12]
vcr, p.23]
peint, p.32]
non-retrouve
vcr, p.8]
non-retrouve
peint, p.32]
sou$e, p.75]
sou$e, p.78-79]
auto, p.10]
peint, p.31]
sou$e, p.73]
elec, p.18]
vin, p.98]
tele, p.14]
peint, p.32]
peint, p.32]
recette, p.707]
non-retrouve
non-retrouve
non-retrouve
elec, p.141]
tele, p.14]
mazda, p.2-11]
ordi, p.100]
peint, p.31]
auto, p.9]
VL93b, p.75]
VL93b, p.102]
vcr, p.15]
tele, p.16]
auto, p.10]
non-retrouve
vcr, p.8]
sou$e, p.72]
non-retrouve
DHP+94, p.61]
APPENDICE B
Exemple d'analyse de corpus
1. Texte source
source: peint, p. 31]
Pour obtenir avec le pinceau a poils courts une ligne ne et nette 1], glisser rapidement
sur le verre 2] si l'on souhaite une ligne plus large 3], alors s'attarder sur le verre 4] de facon
a laisser s'ecouler plus de couleur 5].
Pour realiser la ligne tourbillonnante rouge 6], le \tra^%nard" est ideal 7] puisqu'il contient
assez de couleur pour tracer toute la ligne 8], a defaut 9] un pinceau no 1 a poils longs fera
l'aaire 10]. En tenant le pinceau a la verticale, dresse sur la pointe 11] on obtient des lignes
nes 12] lorsqu'on le couche doucement sur le verre 13], la ligne s'epaissit progressivement14].
153
2. Analyse textuelle
2
7-10
4
1
3
10
6
5
8
7
expression semantique
1
2
3
4
5
6
7
8
9
10
11
12
13
14
12
11
option
operation sequentielle
option
operation sequentielle
in uence
option
operation sequentielle
autre (non analysee)
condition materielle
operation sequentielle
operation eventuelle
eet
operation eventuelle
eet
10
9
rhetorique
but
sequence
c-condition
sequence
but
but
sequence
autre (non analysee)
c-condition
sequence
maniere
resultat
maniere
resultat
13
APPENDICE C
Resultats complets de l'analyse de corpus
1. Frequence des elements semantiques
source
mazda]
tele]
auto]
vcr]
ordi]
soue]
peint]
recette]
bouche]
rotin]
armoire]
vin]
photo]
elec]
antique]
total
%
E lement semantique
total
oper. cond. attribut eet inuoper. option preven- oper. autre
seq. mat. d'objet
ence co-temp.
tion event.
45
6
1 17
4
0
7
1
2
0
83
46
4
3 22
6
0
11
0
4
0
96
114
30
7 11
19
0
1
3
1
0 186
83
7
5 15
16
0
2
1
1
0 130
31
14
37 11
2
0
0
0
2
0
97
28
15
16
4
11
7
0
1
2
12
96
30
6
15
5
8
4
7
1
3
0
79
94
1
2
1
10
6
0
1
0
0 115
40
16
0
2
4
4
0
3
0
0
69
40
7
1
5
2
9
2
0
0
0
66
21
2
1
0
3
0
0
0
0
0
27
15
2
34 13
0
5
0
2
0
0
71
20
13
10 13
12
2
1
4
0
0
75
124
30
3
9
14
2
2
1
0
0 185
31
11
23
8
13
6
1
3
0
0
96
762 164
158 136 124
45
34
21
15
12 1471
52% 11%
11% 9% 8%
3%
2%
1%
1% 1% 99%
155
2. Frequence des relations rhetoriques
source
mazda]
tele]
auto]
vcr]
ordi]
soue]
peint]
recette]
bouche]
rotin]
armoire]
vin]
photo]
elec]
antique]
total
%
Relation rhetorique
total
sequence c-condition elaboration but resultat maniere concurrence
46
8
1 15
12
1
0
83
45
8
3 21
16
3
0
96
118
29
7 14
5
13
0 186
83
10
5 7
14
11
0 130
30
17
37 0
10
3
0
97
29
14
28 1
5
12
7
96
31
6
15 9
5
9
4
79
95
1
2 8
1
2
6 115
42
15
0 1
3
4
4
69
40
6
1 8
1
1
9
66
21
1
1 2
0
2
0
27
15
2
34 4
7
4
5
71
22
13
10 7
11
10
2
75
120
30
3 14
5
11
2 185
33
12
23 8
3
11
6
96
770
172
170 119
98
97
45 1471
52%
12%
12% 8%
7%
7%
3% 101%
3. Correspondances element semantique { relation rhetorique
3.1. Resume
element
semantique
Relation rhetorique
total
sequence c-condition elaboration but resultat maniere concurrence
op. sequentielle
749
6
- 7
- 762
cond. materielle
3
148
- 7
6
- 164
attribut d'objet
158 - 158
eet
- 39
92
5
- 136
inuence
- 39
85
- 124
op. co-temporelle
45
45
option
7
- 27
34
prevention
18
- 3
21
op. eventuelle
11
4
15
autre
12 12
total
770
172
170 119
98
97
45 1471
156
3.2. Resultats detailles
mazda]
sequence c-condition
operation sequentielle
45
condition materielle
6
attribut d'objet
eet
in uence
operation co-temporelle
option
prevention
1
operation eventuelle
2
total
46
8
tele]
sequence c-condition
operation sequentielle
45
condition materielle
4
attribut d'objet
eet
in uence
operation co-temporelle
option
prevention
operation eventuelle
4
total
45
8
auto]
sequence c-condition
operation sequentielle
114
condition materielle
1
27
attribut d'objet
eet
in uence
operation co-temporelle
option
1
prevention
3
operation eventuelle
1
total
118
29
vcr]
sequence c-condition
operation sequentielle
80
3
condition materielle
2
5
attribut d'objet
eet
in uence
operation co-temporelle
option
1
prevention
1
operation eventuelle
1
total
83
10
Relation rhetorique
elaboration but resultat maniere concurrence
1
5
12
3
1
7
1 15
12
1
0
Relation rhetorique
elaboration but resultat maniere concurrence
1
3
5
16
1
4
2
- 11
3 21
16
3
0
Relation rhetorique
elaboration but resultat maniere concurrence
2
7
7
3
1
7
12
7 14
5
13
0
Relation rhetorique
elaboration but resultat maniere concurrence
5
1
14
5
11
1
5
7
14
11
0
total
45
6
1
17
4
0
7
1
2
83
total
46
4
3
22
6
0
11
0
4
96
total
114
30
7
11
19
0
1
3
1
186
total
83
7
5
15
16
0
2
1
1
130
157
ordi]
sequence c-condition
operation sequentielle
30
1
condition materielle
14
attribut d'objet
eet
in uence
operation co-temporelle
option
prevention
operation eventuelle
2
total
30
17
soue]
sequence c-condition
operation sequentielle
28
condition materielle
14
attribut d'objet
eet
in uence
operation co-temporelle
option
prevention
1
operation eventuelle
autre
total
29
14
peint]
sequence c-condition
operation sequentielle
30
condition materielle
4
attribut d'objet
eet
in uence
operation co-temporelle
option
1
prevention
1
operation eventuelle
1
total
31
6
recette]
sequence c-condition
operation sequentielle
94
condition materielle
1
attribut d'objet
eet
in uence
operation co-temporelle
option
prevention
1
operation eventuelle
total
95
1
Relation rhetorique
elaboration but resultat maniere concurrence
37
10
1
2
37
0
10
3
0
Relation rhetorique
elaboration but resultat maniere concurrence
1
16
4
1
10
7
2
12
28
1
12
5
7
Relation rhetorique
elaboration but resultat maniere concurrence
2
15
2
3
1
7
4
6
2
15
9
5
9
4
Relation rhetorique
elaboration but resultat maniere concurrence
2
1
8
2
6
2
8
1
2
6
total
31
14
37
11
2
0
0
0
2
97
total
28
15
16
4
11
7
0
1
2
12
96
total
30
6
15
5
8
4
7
1
3
79
total
94
1
2
1
10
6
0
1
0
115
158
bouche]
sequence c-condition
operation sequentielle
39
condition materielle
15
attribut d'objet
eet
in uence
operation co-temporelle
option
prevention
3
operation eventuelle
total
42
15
rotin]
sequence c-condition
operation sequentielle
40
condition materielle
4
attribut d'objet
eet
in uence
operation co-temporelle
option
2
prevention
operation eventuelle
total
40
6
armoire]
sequence c-condition
operation sequentielle
21
condition materielle
1
attribut d'objet
eet
in uence
operation co-temporelle
option
prevention
operation eventuelle
total
21
1
vin]
sequence c-condition
operation sequentielle
15
condition materielle
2
attribut d'objet
eet
in uence
operation co-temporelle
option
prevention
operation eventuelle
total
15
2
Relation rhetorique
elaboration but resultat maniere concurrence
1
1
2
4
4
0
1
3
4
4
Relation rhetorique
elaboration but resultat maniere concurrence
3
1
4
1
1
1
9
1
8
1
1
9
Relation rhetorique
elaboration but resultat maniere concurrence
1
1
1
2
1
2
0
2
0
Relation rhetorique
elaboration but resultat maniere concurrence
34
4
7
2
5
2
34
4
7
4
5
total
40
16
0
2
4
4
0
3
0
69
total
40
7
1
5
2
9
2
0
0
66
total
21
2
1
0
3
0
0
0
0
27
total
15
2
34
13
0
5
0
2
0
71
159
photo]
Relation rhetorique
total
sequence c-condition elaboration but resultat maniere concurrence
operation sequentielle
19
1
20
condition materielle
13
13
attribut d'objet
10
10
eet
2
11
13
in uence
3
9
12
operation co-temporelle
2
2
option
1
1
prevention
3
1
4
operation eventuelle
0
total
22
13
10
7
11
10
2
75
elec]
Relation rhetorique
total
sequence c-condition elaboration but maniere resultat concurrence
operation sequentielle
119
1
4
- 124
condition materielle
28
2
30
attribut d'objet
3
3
eet
4
5
9
in uence
3
11
14
operation co-temporelle
2
2
option
1
1
2
prevention
1
1
operation eventuelle
0
total
120
30
3 14
11
5
2 185
antique]
Relation rhetorique
total
sequence c-condition elaboration but resultat maniere concurrence
operation sequentielle
30
1
31
condition materielle
10
1
11
attribut d'objet
23
23
eet
5
3
8
in uence
2
11
13
operation co-temporelle
6
6
option
1
1
prevention
3
3
operation eventuelle
0
total
33
12
23
8
3
11
6
96
APPENDICE D
Entree de SPIN
1. Representation conceptuelle du domaine
%%%%%%%%%%%%%%%%%%%%%%%%%%%%% -*- Mode: Prolog -*- %%%%%%%%%%%%%%%%%%%%%%%%%%%%
%% vcr_spec.pl --- Specifications de la tache
%% Author
: Leila Kosseim
%% Created On
: Thu Jan 12 14:35:46 1995
%% Last Modified By: Leila Kosseim
%% Last Modified On: Thu Feb 2 17:52:04 1995
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%% charge les schemas et la nature de la tache
:-
consult('vcr_nature.pl'),
consult('vcr_schemas.pl').
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%% vcr_spec.pl --- end of file
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
161
1.1. Schemas d'operations
%%%%%%%%%%%%%%%%%%%%%%%%%%%%% -*- Mode: Prolog -*- %%%%%%%%%%%%%%%%%%%%%%%%%%%%
%% vcr_schemas.pl --- schemas d'operations pour VCR
%% Author
: Leila Kosseim
%% Created On
: Tue Aug 18 11:14:23 1992
%% Last Modified By: Leila Kosseim
%% Last Modified On: Tue Feb 7 10:00:35 1995
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
% declarations pour que Quintus ne se plaigne pas
% si le predicat n'est pas defini
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
:- dynamic(op/1).
:- dynamic(during/2).
:- dynamic(before/2).
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
% schemas d'operations
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
op(mettre(obj: cassette, lieu: vid
eo)) :precond(]),
corps(]),
succes(ajout(dans(obj:cassette, lieu:vid
eo))]),
echec(]).
op(programmer(obj: X, qual: 'd''1h 30min par une touche incr
ementielle')) :precond(dans(obj: cassette, lieu:vid
eo)]),
corps(r
egler(obj: 's
electeur de vitesse de bande', dest : 'SP'),
s
electionner(obj: 'canal 4'),
sp
ecifier(obj: 'heure d''enregistrement d''1h 30min'),
appuyer(dest:'touche TIMER',qual:'dans un d
elai de 9 secondes')]),
e(obj: X, qual: 'd''1h 30min par une touche incr
ementielle'))]),
succes(ajout(programm
echec(ajout(neg,programm
e(obj: X))]).
op(r
egler(obj: 's
electeur de vitesse de bande', dest: 'SP')) :precond('meilleure qualit
e d''image']),
corps(]),
succes(ajout(r
egl
e(obj: 's
electeur de vitesse de bande', dest: 'SP'))]),
echec(]).
op(s
electionner(obj: 'canal 4')):precond(]),
corps(appuyer(dest: 'touche de canal')]),
succes(ajout(s
electionn
e(obj: 'canal 4'))]),
echec(ajout(neg,s
electionn
e(obj: 'canal 4'))]).
op(sp
ecifier(obj: 'heure d''enregistrement d''1h 30min')):precond(]),
corps(appuyer(dest: 'touche OTR', qual: '3 fois')]),
succes(ajout(sp
ecifi
e(obj: 'heure d''enregistrement d''1h 30min'))]),
echec(ajout(neg, sp
ecifi
e(obj: 'heure d''enregistrement d''1h 30min'))]).
op(appuyer(dest: 'touche
precond(]),
corps(enfoncer(obj:
enfoncer(obj:
enfoncer(obj:
OTR', qual: '3 fois')) :'touche OTR', qual: '1 fois'),
'touche OTR', qual: '2 fois'),
'touche OTR', qual: '3 fois')]),
162
succes(ajout(sp
ecifi
e(obj: 'heure d''enregistrement'))]),
echec(ajout(neg,sp
ecifi
e(obj: 'heure d''enregistrement'))]).
op(enfoncer(obj: 'touche OTR', qual: '2 fois')) :precond(]),
corps(]),
succes(ajout('PM 11:05 (1 h)')]),
echec(ajout('PM 10:35 (30 min))']).
op(enfoncer(obj: 'touche OTR', qual: '3 fois')) :precond(]),
corps(]),
succes(ajout('PM 11:35 (1 h 30min)')]),
echec(ajout('PM 11:05 (1 h)')]).
op(enfoncer(obj: 'touche OTR', qual: '1 fois')) :precond(]),
corps(]),
succes(ajout('PM 10:35 (30min)')]),
echec(ajout('PM 10:05')]).
op(appuyer(dest: 'touche TIMER', qual: _)) :precond(]),
corps(]),
succes(ajout(activ
e(obj: enregistrement))]),
echec(ajout(neg, activ
e(obj: enregistrement))]).
op(appuyer(dest: 'touche de canal')):precond(]),
corps(]),
succes(ajout(chang
e(obj: canal))]),
echec(ajout(neg,chang
e(obj: canal))]).
%%%%%%%%%%%%%%%%%%%%%%%%%%%%
% contraintes temporelles
%%%%%%%%%%%%%%%%%%%%%%%%%%%%
before(_, appuyer(dest: 'touche TIMER', qual: _)).
before(r
egler(obj: _, dest : 'SP'), appuyer(dest: 'touche TIMER', qual: _)).
before(r
egler(obj: _, dest : 'SP'), appuyer(dest: 'touche OTR', qual: _)).
before(s
electionner(obj: 'canal 4'), appuyer(dest: 'touche OTR', qual: _)).
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%% vcr_schemas.pl --- end of file
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
163
1.2. Nature de la t^ache
%%%%%%%%%%%%%%%%%%%%%%%%%%%%% -*- Mode: Prolog -*- %%%%%%%%%%%%%%%%%%%%%%%%%%%%
%% vcr_nature.pl --- Nature de la tache pour VCR
%% Author
: Leila Kosseim
%% Created On
: Thu Jan 12 14:35:46 1995
%% Last Modified By: Leila Kosseim
%% Last Modified On: Wed Mar 15 11:15:38 1995
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
% declarations pour que quintus ne se plaigne pas,
% si le predicat n'est pas defini
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
% predicats generaux
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
:- dynamic(agent/2).
:- dynamic(procedures/2).
:- dynamic(type/1).
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
% operations
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
:::::::::::::::::::::-
dynamic(dangereux/1).
dynamic(dependant/2).
dynamic(desirable/1).
dynamic(dont/1).
dynamic(durative/1).
dynamic(ensemble_discriminant/2).
dynamic(erreur/1).
dynamic(facile_a_mal_executer/1).
dynamic(facilite_tache/1).
dynamic(fausse_deduction/1).
dynamic(flou/1).
dynamic(futur/1).
dynamic(habitude/1).
dynamic(irreversible/1).
dynamic(mentale/1).
dynamic(methode_normale/2).
dynamic(nefaste/1).
dynamic(negtc/1).
dynamic(optionel/1).
dynamic(preparation/1).
dynamic(regle_generale/1).
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
% etats
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
::::::::-
dynamic(desirable/1).
dynamic(difficile/1).
dynamic(equivalent/2).
dynamic(externe/1).
dynamic(interne/1).
dynamic(materielle/1).
dynamic(modifiable/1).
dynamic(option/2).
164
:- dynamic(textuel/1).
:- dynamic(type_appareil/1).
:- dynamic(vrai_bientot/1).
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
% objets
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
:- dynamic(attribut/3).
:- dynamic(justifie_operation/2).
:- dynamic(plus_important/2).
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
% nature de la tache
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
% predicats generaux
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
agent(]).
procedures('touche OTR', programmer,autre_chose]).
type(generique).
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
% operations
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
ensemble_discriminant(O, O).
optionel('r
egler'(obj:'s
electeur de vitesse de bande',dest:'SP')).
dont(appuyer(dest:'touche REC')).
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
% etats
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
option('meilleure qualit
e d''image', probable).
desirable(r
egler(obj:'s
electeur de vitesse de bande',dest:'SP')).
desirable('meilleure qualit
e d''image').
interne('l''
emission sera enregistr
ee jusqu
a l''heure sp
ecifi
ee').
interne('sp
ecifier'(obj: 'heure d''enregistrement d''1h 30 min')).
interne(changer(obj: canal)).
externe('PM 11:05 (1 h)').
externe('PM 11:35 (1 h 30min)').
externe('PM 10:35 (30min)').
vrai_bientot(enfoncer(obj:'touche OTR',qual:'1 fois')).
vrai_bientot(enfoncer(obj:'touche OTR',qual:'2 fois')).
vrai_bientot(enfoncer(obj:'touche OTR',qual:'3 fois')).
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
% objets
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
attribut('s
electeur de vitesse de bande', position, '
a gauche de l''appareil').
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%% vcr_nature.pl --- end of file
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
165
2. Modele du lecteur novice
%%%%%%%%%%%%%%%%%%%%%%%%%%%%% -*- Mode: Prolog -*- %%%%%%%%%%%%%%%%%%%%%%%%%%%%
%% novice.pl --- Modele d'un lecteur novice
%% Author
: Leila Kosseim
%% Created On
: Thu Jan 12 14:35:46 1995
%% Last Modified By: Leila Kosseim
%% Last Modified On: Wed Feb 1 11:05:22 1995
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%% charge les schemas et la nature de la tache
:-
consult('novice_nature.pl'),
consult('novice_schemas.pl').
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%% novice.pl --- end of file
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
166
2.1. Schemas d'operations
%%%%%%%%%%%%%%%%%%%%%%%%%%%%% -*- Mode: Prolog -*- %%%%%%%%%%%%%%%%%%%%%%%%%%%%
%% novice_schema.pl --- modele de l'usager pour VCR
%% Author
: Leila Kosseim
%% Created On
: Tue Aug 18 11:14:23 1992
%% Last Modified By: Leila Kosseim
%% Last Modified On: Tue Feb 7 10:02:21 1995
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
% declarations pour que quintus ne se plaigne pas,
% si le predicat n'est pas defini
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
:- dynamic(lecteur/1).
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
% schemas d'operations
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
lecteur(enfoncer(obj: _, qual: _)) :precond(]),
corps(]),
succes(]),
echec(]).
lecteur(appuyer(dest: 'touche OTR', qual: '3
precond(]),
corps(enfoncer(obj: 'touche OTR', qual:
enfoncer(obj: 'touche OTR', qual:
enfoncer(obj: 'touche OTR', qual:
succes(]),
echec(]).
fois')) :'1 fois'),
'2 fois'),
'3 fois')]),
lecteur(appuyer(dest: 'touche TIMER', qual: _)) :precond(]),
corps(]),
succes(]),
echec(]).
lecteur(appuyer(dest: 'touche de canal')) :precond(]),
corps(]),
succes('chang
e'(obj: canal)]),
echec(]).
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%% novice_schemas.pl --- end of file
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
167
2.2. Nature de la t^ache
%%%%%%%%%%%%%%%%%%%%%%%%%%%%% -*- Mode: Prolog -*- %%%%%%%%%%%%%%%%%%%%%%%%%%%%
%% novice_nature.pl --- modele de l'usager pour VCR
%% Author
: Leila Kosseim
%% Created On
: Tue Aug 18 11:14:23 1992
%% Last Modified By: Leila Kosseim
%% Last Modified On: Tue Feb 7 15:36:15 1995
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
% declarations pour que quintus ne se plaigne pas,
% si le predicat n'est pas defini
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
% operations
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
:- dynamic(base/1).
:- dynamic(croit_ordre/1).
:- dynamic(etrange/1).
:- dynamic(peut_etre_mal_execute/1).
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
% etats
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
:- dynamic(lecteut_sait_desirable/1).
:- dynamic(lecteur_sait_equivalente/2).
:- dynamic(lecteur_sait_verifier/1).
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
% objets
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
:- dynamic(attribut_lecteur/3).
:- dynamic(utilisation_rare/1).
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
% nature de la tache
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
% operations
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
base(r
egler(obj: 's
electeur de vitesse de bande', dest: _)).
base(s
electionner(obj: 'canal 4')).
base(appuyer(dest: _)).
base(appuyer(dest: _, qual: _)).
base(mettre(obj: cassette, lieu: vid
eo)).
etrange(appuyer(dest: 'touche OTR', qual: _)).
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
% etats
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
lecteur_sait_desirable(sp
ecifier(obj:'heure d''enregistrement
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
% objets
d''1h 30 min')).
168
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
connu(canal).
connu(agent).
connu('vid
eo').
connu('s
electeur de vitesse de bande').
connu('canal 4').
connu('heure d''enregistrement').
connu('touche de canal').
connu('touche OTR').
connu('touche TIMER').
connu('touche REC').
utilisation_rare('touche OTR').
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%% novice_nature.pl --- end of file
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
APPENDICE E
Textes generes par SPIN
1. Textes du corpus d'analyse
1.1. Programmation d'un enregistrement
1.1.1. Version originale, vcr, p.16]
Programmation d'enregistrement par une touche incrementielle
(1) Reglez le selecteur de vitesse de bande sur \SP".
(2) Selectionnez le canal 4 en appuyant sur la touche de canal.
(3) Appuyez sur la touche OTR pour specier l'heure d'enregistrement.
Lorsque la touche est enfoncee une fois, PM 10:35 (30mn).
Lorsque la touche est enfoncee deux fois, PM 11:05 (1 h).
Lorsque la touche est enfoncee trois fois, PM 11:35 (1 h 30mn).
(4) Appuyez sur la touche TIMER dans un delai de 9 secondes.
1.1.2. Versions de SPIN
note: Pour verier l'inclusion de certains elements semantiques, deux elements ont ete
ajoutees a la representation conceptuelle de spin:
l'option pour une meilleure qualite d'image et
l'information generale le selecteur est a gauche
de l'appareil
Lecteur novice, texte d'execution
Programmation d'un enregistrement d'1h 30 min par une touche incr
ementielle
-
-
Pour une meilleure qualit
e d'image,
S
electionnez le canal 4 en appuyant
Appuyez sur la touche OTR 3 fois.
Lorsqu'elle est enfonc
ee 1 fois, PM
Lorsqu'elle est enfonc
ee 2 fois, PM
Lorsqu'elle est enfonc
ee 3 fois, PM
Appuyez sur la touche TIMER dans un
r
eglez le s
electeur de vitesse de bande sur SP.
sur la touche de canal.
10:35
11:05
11:35
d
elai
(30min).
(1 h).
(1 h 30min).
de 9 secondes.
170
Lecteur novice, texte hybride
Programmation d'un enregistrement d'1h 30 min par une touche incr
ementielle
Pour une meilleure qualit
e d'image, r
eglez le s
electeur de vitesse de bande sur
SP. S
electionnez le canal 4 en appuyant sur la touche de canal. Appuyez sur la
touche OTR 3 fois. Lorsqu'elle est enfonc
ee 1 fois, PM 10:35 (30min). Lorsqu'elle
est enfonc
ee 2 fois, PM 11:05 (1 h). Lorsqu'elle est enfonc
ee 3 fois, PM 11:35
(1 h 30min). Appuyez sur la touche TIMER dans un d
elai de 9 secondes.
Lecteur novice, texte de comprehension
Pour programmer un enregistrement d'1h 30 min par une touche incr
ementielle
Pour une meilleure qualit
e d'image, r
eglez le s
electeur de vitesse de bande sur
SP. Le s
electeur est a gauche de l'appareil. S
electionnez le canal 4 en appuyant
sur la touche de canal. Appuyez sur la touche OTR 3 fois pour sp
ecifier l'heure
d'enregistrement d'1h 30 min. Lorsque la touche est enfonc
ee 1 fois, PM 10:35
(30min). Lorsqu'elle est enfonc
ee 2 fois, PM 11:05 (1 h). Lorsqu'elle est enfonc
ee
3 fois, PM 11:35 (1 h 30min). Appuyez sur la touche TIMER dans un d
elai de 9 secondes.
Lecteur moyen, texte d'execution
Programmation d'un enregistrement d'1h 30 min par une touche incr
ementielle
-
-
N'appuyez pas sur la touche REC.
Pour une meilleure qualit
e d'image,
S
electionnez le canal 4 en appuyant
Appuyez sur la touche OTR 3 fois.
Lorsqu'elle est enfonc
ee 1 fois, PM
Lorsqu'elle est enfonc
ee 2 fois, PM
Lorsqu'elle est enfonc
ee 3 fois, PM
Appuyez sur la touche TIMER dans un
r
eglez le s
electeur de vitesse de bande sur SP.
sur la touche de canal.
10:35
11:05
11:35
d
elai
(30min).
(1 h).
(1 h 30min).
de 9 secondes.
Lecteur moyen, texte hybride
ementielle
Programmation d'un enregistrement d'1h 30 min par une touche incr
Il ne faut pas appuyer sur la touche REC. Pour une meilleure qualit
e d'image,
r
egler le s
electeur de vitesse de bande sur SP. Le s
electeur est a gauche de l'appareil.
S
electionner le canal 4 en appuyant sur la touche de canal. Appuyer sur la touche
OTR 3 fois. Lorsqu'elle est enfonc
ee 1 fois, PM 10:35 (30min). Lorsqu'elle est
enfonc
ee 2 fois, PM 11:05 (1 h). Lorsqu'elle est enfonc
ee 3 fois, PM 11:35 (1
h 30min). Appuyer sur la touche TIMER dans un d
elai de 9 secondes.
Lecteur moyen, texte de comprehension
Programmation d'un enregistrement d'1h 30 min par une touche incr
ementielle
Il ne faut pas appuyer sur la touche REC. Pour une meilleure qualit
e d'image,
r
eglez le s
electeur de vitesse de bande sur SP. Le s
electeur est a gauche de l'appareil.
S
electionnez le canal 4 en appuyant sur la touche de canal. Appuyez sur la touche
OTR 3 fois pour sp
ecifier l'heure d'enregistrement d'1h 30 min. Lorsque la touche
est enfonc
ee 1 fois, PM 10:35 (30min). Lorsqu'elle est enfonc
ee 2 fois, PM 11:05
(1 h). Lorsqu'elle est enfonc
ee 3 fois, PM 11:35 (1 h 30min). Appuyez sur la touche
TIMER dans un d
elai de 9 secondes.
171
Lecteur expert, texte d'execution
Programmation d'un enregistrement d'1h 30 min par une touche incr
ementielle
-
Pour une meilleure qualit
e d'image, r
egler le s
electeur de vitesse de bande sur SP.
S
electionner le canal 4.
Appuyer sur la touche OTR 3 fois.
Appuyer sur la touche TIMER dans un d
elai de 9 secondes.
Lecteur expert, texte hybride
Programmation d'un enregistrement d'1h 30 min par une touche incr
ementielle
Pour une meilleure qualit
e d'image, r
egler le s
electeur de vitesse de bande sur
SP. S
electionner le canal 4. Appuyer sur la touche OTR 3 fois. Appuyer sur la
touche TIMER dans un d
elai de 9 secondes.
Lecteur expert, texte de comprehension
Programmation d'un enregistrement d'1h 30 min par une touche incr
ementielle
Pour une meilleure qualit
e d'image, r
egler le s
electeur de vitesse de bande sur
SP. S
electionner le canal 4. Appuyer sur la touche OTR 3 fois. Appuyer sur la
touche TIMER dans un d
elai de 9 secondes.
1.2. Souage de verre
1.2.1. Version originale, verre, p.73]
La premiere bulle
Avant que le verre ne devienne trop froid, on y sou$e une premiere bulle d'air. En
tenant la canne horizontalement ou legerement inclinee vers le sol, on y envoie un jet
d'air rapide. Immediatement, on glisse le pouce sur l'embout pour emprisonner l'air.
1.2.2. Versions de SPIN
Lecteur novice, texte d'execution
Comment cr
eer la premi
ere bulle
-
Avant que le verre ne devienne trop froid, souffler la bulle en soufflant l'air
dans la canne et en l'emprisonnant.
En tenant la canne horizontalement ou l
eg
erement inclin
ee vers le sol envoyer
un jet d'air rapide.
Glisser le pouce sur l'embout.
Lecteur novice, texte hybride
Pour cr
eer la premi
ere bulle
Avant que le verre ne devienne trop froid, il faut souffler la bulle en soufflant
l'air dans la canne puis en l'emprisonnant. En tenant la canne horizontalement
ou l
eg
erement inclin
ee vers le sol envoyez un jet d'air rapide. Glissez le pouce
sur l'embout pour emprisonner l'air.
172
Lecteur novice, texte de comprehension
Pour cr
eer la premi
ere bulle
Avant que le verre ne devienne trop froid, on souffle la bulle en soufflant l'air
dans la canne puis en l'emprisonnant. En tenant la canne horizontalement ou l
eg
erement
inclin
ee vers le sol envoyez un jet d'air rapide. Glissez le pouce sur l'embout
pour emprisonner l'air.
Lecteur moyen, texte d'execution
Comment cr
eer la premi
ere bulle
-
Avant que le verre ne devienne trop froid, soufflez la bulle.
En tenant la canne horizontalement ou l
eg
erement inclin
ee vers le sol envoyez
un jet d'air rapide.
Emprisonnez l'air en glissant le pouce sur l'embout.
Lecteur moyen, texte hybride
Comment cr
eer la premi
ere bulle
Avant que le verre ne devienne trop froid, on souffle la bulle. En tenant la canne
horizontalement ou l
eg
erement inclin
ee vers le sol un jet d'air rapide est envoy
e.
Il faut emprisonner l'air en glissant le pouce sur l'embout.
Lecteur moyen, texte de comprehension
Pour cr
eer la premi
ere bulle
Avant que le verre ne devienne trop froid, soufflez la bulle. En tenant la canne
horizontalement ou l
eg
erement inclin
ee vers le sol envoyez un jet d'air rapide.
L'air est emprisonn
e en glissant le pouce sur l'embout.
Lecteur expert, texte d'execution
Pour cr
eer la premi
ere bulle
-
Avant que le verre ne devienne trop froid, soufflez la bulle.
En tenant la canne horizontalement ou l
eg
erement inclin
ee vers le sol envoyez
un jet d'air rapide.
Emprisonnez l'air.
Lecteur expert, texte hybride
Pour cr
eer la premi
ere bulle
Avant que le verre ne devienne trop froid, il faut souffler la bulle. En tenant
la canne horizontalement ou l
eg
erement inclin
ee vers le sol envoyez un jet d'air
rapide. Emprisonnez l'air.
Lecteur expert, texte de comprehension
Comment cr
eer la premi
ere bulle
Avant que le verre ne devienne trop froid, on souffle la bulle. En tenant la canne
horizontalement ou l
eg
erement inclin
ee vers le sol envoyer un jet d'air rapide.
On emprisonne l'air.
173
1.3. Desserrage d'une roue de voiture
1.3.1. Version originale, auto, p.8]
Desserrage des ecrous
Utilisez une cle en croix, pour desserrer les ecrous de la roue. S'ils portent la marque L,
ils ont le letage a gauche et vous devez les devisser en tournant dans le sens des aiguilles
d'une montre. Pour les ecrous qui ne portent aucune marque, tournez en sens contraire.
Si les ecrous sont di"ciles a devisser, mettez un peu d'huile penetrante,attendez quelques
minutes, puis essayer de nouveau. N'enlevez pas completement les ecrous.
1.3.2. Versions de SPIN
Lecteur novice, texte d'execution
Desserrage des ecrous de la roue
-
D
evisser les e
crous avec une cl
e en croix.
S'ils portent la marque L, les ecrous ont le filetage a gauche, tourner les ecrous
dans le sens des aiguilles d'une montre.
S'ils ne portent pas de marque, tourner les e
crous en sens contraire.
Si les ecrous sont difficiles a d
evisser, mettre un peu d'huile p
en
etrante, attendre
quelques minutes, essayer de nouveau.
Lecteur novice, texte hybride
Desserrage des ecrous de la roue
On d
evisse les ecrous avec une cl
e en croix. S'ils portent la marque L, les ecrous
ont le filetage a gauche, tournez les ecrous dans le sens des aiguilles d'une
montre. S'ils ne portent pas de marque, les ecrous sont tourn
es en sens contraire.
a d
evisser, on met un peu d'huile p
en
etrante, attendez
Si les ecrous sont difficiles quelques minutes, on essaye de nouveau.
Lecteur novice, texte de comprehension
Desserrage des ecrous de la roue
Il faut d
evisser les ecrous avec une cl
e en croix. S'ils portent la marque L,
les ecrous ont le filetage a gauche, vous tournez les ecrous dans le sens des
aiguilles d'une montre. S'ils ne portent pas de marque, vous tournez les e
crous
en sens contraire. Si les e
crous sont difficiles a d
evisser, vous mettez un peu
d'huile p
en
etrante, vous attendez quelques minutes, il faut essayer de nouveau.
Lecteur moyen, texte d'execution
Desserrage des ecrous de la roue
-
N'enlevez pas les e
crous compl
etement.
D
evissez-les avec une cl
e en croix.
S'ils portent la marque L, les ecrous ont le filetage a gauche, tournez les ecrous
dans le sens des aiguilles d'une montre.
S'ils ne portent pas de marque, tournez les e
crous en sens contraire.
Si les ecrous sont difficiles a d
evisser, facilitez le d
evissage en mettant un
peu d'huile p
en
etrante.
174
Lecteur moyen, texte hybride
Desserrage des ecrous de la roue
Vous n'enlevez pas les e
crous compl
etement. D
evissez-les avec une cl
e en croix.
S'ils portent la marque L, les ecrous ont le filetage a gauche, les ecrous sont
tourn
es dans le sens des aiguilles d'une montre. S'ils ne portent pas de marque,
tournez les ecrous en sens contraire. Si les e
crous sont difficiles a
d
evisser,
facilitez le d
evissage en mettant un peu d'huile p
en
etrante.
Lecteur moyen, texte de comprehension
Desserrage des ecrous de la roue
Vous n'enlevez pas les e
crous compl
etement. Il faut les d
evisser avec une cl
e
en croix. S'ils portent la marque L, les e
crous ont le filetage a gauche, les
ecrous sont tourn
es dans le sens des aiguilles d'une montre. S'ils ne portent
pas de marque, il faut tourner les ecrous en sens contraire. Si les ecrous sont
difficiles a d
evisser, vous facilitez le d
evissage en mettant un peu d'huile p
en
etrante.
Lecteur expert, texte d'execution
Pour desserrer les ecrous de la roue
-
D
evisser les e
crous avec une cl
e en croix.
Si les ecrous sont difficiles a d
evisser, mettre un peu d'huile p
en
etrante.
Lecteur expert, texte hybride
Desserrage des ecrous de la roue
Les e
crous sont d
eviss
es avec une cl
e en croix. Si les ecrous sont difficiles
a d
evisser, un peu d'huile p
en
etrante est mise.
Lecteur expert, texte de comprehension
Desserrage des ecrous de la roue
Il faut d
evisser les ecrous avec une cl
e en croix. Si les ecrous sont difficiles
d
a
evisser, vous mettez un peu d'huile p
en
etrante.
2. Textes du corpus test
2.1. Friture d'oignons
2.1.1. Version originale, recette, p.360]
Oignons frits dans la p^ate a cr^epes
liste d'ingredients]
1. Trancher les oignons en morceaux d'1/3 de pouce d'epaisseur. Defaire en anneaux.
2. Melanger la farine a cr^epes avec l'oeuf, l'huile a salade et le consomme ou l'eau.
3. Faire chauer assez d'huile dans un po^elon pour en avoir 1 pouce d'epaisseur.
4. Trempez les anneaux d'oignons un par un dans la p^ate. Les egoutter un instant et les
faire frire dans l'huile pendant 3 minutes. Retournez-les une fois pendant la cuisson.
Garder dans un endroit chaud a mesure qu'ils sont cuits.
175
2.1.2. Versions de SPIN
Lecteur novice, texte d'execution
Friture des oignons dans la p^
ate a
cr^
epes
-
Tranchez les oignons en morceaux d'1/3 de pouce d'
epaisseur.
D
efaites-les en anneaux.
M
elangez la farine a cr^
epes, l'oeuf, l'huile a salade et le consomm
e.
Faites chauffer assez d'huile a frire dans un po^
elon pour en avoir 1 pouce d'
epaisseur.
Trempez les anneaux d'oignons un par un dans la p^
ate.
Egouttez-les un instant.
Faites-les frire dans l'huile a
frire pendant 3 minutes.
Retournez-les une fois pendant la cuisson.
Gardez-les dans un endroit chaud a
mesure qu'ils sont cuits.
Lecteur novice, texte hybride
Friture des oignons dans la p^
ate a
cr^
epes
Tranchez les oignons en morceaux d'1/3 de pouce d'
epaisseur. D
efaites-les en anneaux.
M
elangez la farine a cr^
epes, l'oeuf, l'huile a salade et le consomm
e. Faites chauffer
assez d'huile a frire dans un po^
elon pour en avoir 1 pouce d'
epaisseur. Trempez
les anneaux d'oignons un par un dans la p^
ate. Egouttez-les un instant. Faites-les
frire dans l'huile a frire pendant 3 minutes. Retournez-les une fois pendant la
cuisson. Gardez-les dans un endroit chaud a mesure qu'ils sont cuits.
Lecteur novice, texte de comprehension
Friture des oignons dans la p^
ate a
cr^
epes
Trancher les oignons en morceaux d'1/3 de pouce d'
epaisseur. Les d
efaire en anneaux.
M
elanger la farine a cr^
epes, l'oeuf, l'huile a salade et le consomm
e. Faire chauffer
assez d'huile a frire dans un po^
elon pour en avoir 1 pouce d'
epaisseur. Tremper
les anneaux d'oignons un par un dans la p^
ate. Les e
goutter un instant. Les faire
frire dans l'huile a frire pendant 3 minutes. Les retourner une fois pendant la
cuisson. Les garder dans un endroit chaud a mesure qu'ils sont cuits.
Lecteur moyen, texte d'execution
Friture des oignons dans la p^
ate a
cr^
epes
-
Pr
eparez les oignons en les tranchant en morceaux d'1/3 de pouce d'
epaisseur puis
en les d
efaisant en anneaux.
M
elangez la farine a
cr^
epes, l'oeuf, l'huile a
salade et le consomm
e.
Faites chauffer assez d'huile a frire dans un po^
elon pour en avoir 1 pouce d'
epaisseur.
Trempez les anneaux d'oignons un par un dans la p^
ate. Ne les trempez pas tous en
m^
eme temps.
Egouttez-les un instant.
Faites-les frire dans l'huile a
frire pendant 3 minutes.
Retournez-les une fois pendant la cuisson.
Gardez-les dans un endroit chaud a mesure qu'ils sont cuits.
176
Lecteur moyen, texte hybride
Friture des oignons dans la p^
ate a
cr^
epes
Pr
eparez les oignons en les tranchant en morceaux d'1/3 de pouce d'
epaisseur et
en les d
efaisant en anneaux. M
elangez la farine a cr^
epes, l'oeuf, l'huile a salade
et le consomm
e. Faites chauffer assez d'huile a
frire dans un po^
elon pour en avoir
1 pouce d'
epaisseur. Trempez les anneaux d'oignons un par un dans la p^
ate. Il
ne faut pas les tremper tous en m^
eme temps. Egouttez-les un instant. Faites-les
frire dans l'huile a frire pendant 3 minutes. Retournez-les une fois pendant la
cuisson. Gardez-les dans un endroit chaud a mesure qu'ils sont cuits.
Lecteur moyen, texte de comprehension
Friture des oignons dans la p^
ate a
cr^
epes
Pr
eparer les oignons en les tranchant en morceaux d'1/3 de pouce d'
epaisseur et
en les d
efaisant en anneaux. M
elanger la farine a cr^
epes, l'oeuf, l'huile a salade
et le consomm
e. Faire chauffer assez d'huile a
frire dans un po^
elon pour en avoir
1 pouce d'
epaisseur. Tremper les anneaux d'oignons un par un dans la p^
ate. Il
ne faut pas les tremper tous en m^
eme temps. Les e
goutter un instant. Les faire
frire dans l'huile a frire pendant 3 minutes. Les retourner une fois pendant la
cuisson. Les garder dans un endroit chaud a mesure qu'ils sont cuits.
Lecteur expert, texte d'execution
Friture des oignons dans la p^
ate a
cr^
epes
-
Pr
eparer les oignons.
Pr
eparer la p^
ate.
Faire chauffer assez d'huile a frire dans un po^
elon pour en avoir 1 pouce d'
epaisseur.
Tremper les anneaux d'oignons un par un dans la p^
ate.
Les egoutter un instant.
Les faire frire dans l'huile a
frire pendant 3 minutes.
Les retourner une fois pendant la cuisson.
Les garder dans un endroit chaud a
mesure qu'ils sont cuits.
Lecteur expert, texte hybride
Friture des oignons dans la p^
ate a
cr^
epes
Pr
eparez les oignons. Pr
eparez la p^
ate. Faites chauffer assez d'huile a frire
dans un po^
elon pour en avoir 1 pouce d'
epaisseur. Trempez les anneaux d'oignons
un par un dans la p^
ate. Egouttez-les un instant. Faites-les frire dans l'huile
a frire pendant 3 minutes. Retournez-les une fois pendant la cuisson. Gardez-les
dans un endroit chaud a
mesure qu'ils sont cuits.
Lecteur expert, texte de comprehension
Pour frire les oignons dans la p^
ate a
cr^
epes
Pr
eparez les oignons. Pr
eparez la p^
ate. Faites chauffer assez d'huile a frire
dans un po^
elon pour en avoir 1 pouce d'
epaisseur. Trempez les anneaux d'oignons
un par un dans la p^
ate. Egouttez-les un instant. Faites-les frire dans l'huile
a frire pendant 3 minutes. Retournez-les une fois pendant la cuisson. Gardez-les
dans un endroit chaud a
mesure qu'ils sont cuits.
177
2.2. Finition d'un patchwork
2.2.1. Version originale, patchwork, p.276]
Finitions.
Lorsque tous les morceaux sont assembles, repasser sur l'envers. Si l'endroit a aussi
besoin d'^etre repasse, enlever les ls de b^ati et repassez sans appuyer. Retirer ensuite les
gabarits de papier et b^atir les bords sur l'endroit, pour maintenir les coutures. Repasser
de nouveau sur l'envers pour eacer les marques des b^atis. Le repassage est important,
il facilitera par la suite le lavage et le repassage.
2.2.2. Versions de SPIN
Texte d'execution
Comment faire les finitions
-
Lorsque les morceaux sont assembl
es, repassez sur l'envers.
Si l'endroit a aussi besoin d'^
etre repass
e, enlevez les fils de b^
ati, repassez.
N'appuyez pas.
Retirez les gabarits de papier.
B^
atissez les bords sur l'endroit pour maintenir les coutures.
Repassez de nouveau sur l'envers pour effacer les marques des b^
atis.
Texte hybride
Comment faire les finitions
Lorsque les morceaux sont assembl
es, repassez sur l'envers. Si l'endroit a aussi
besoin d'^
etre repass
e, enlevez les fils de b^
ati, repassez. Le repassage est important,
il facilitera par la suite le lavage et le repassage. Vous n'appuyez pas. Retirez
les gabarits de papier. B^
atissez les bords sur l'endroit pour maintenir les coutures.
Repassez de nouveau sur l'envers pour effacer les marques des b^
atis.
Texte de comprehension
Pour faire les finitions
Lorsque les morceaux sont assembl
es, repassez sur l'envers. Le repassage est important,
il facilitera par la suite le lavage et le repassage. Si l'endroit a aussi besoin
d'^
etre repass
e, enlevez les fils de b^
ati, repassez. On n'appuye pas. Retirez les
gabarits de papier. B^
atissez les bords sur l'endroit pour maintenir les coutures.
Repassez de nouveau sur l'envers pour effacer les marques des b^
atis.
2.3. Utilisation d'un lecteur de disques audio-numeriques
2.3.1. Version originale, JVC, p.10]
Pour placer, ecouter et arr^eter un CD
1. Appuyer sur open/close.
2. Mettre un CD, face imprimee vers le haut, sur le plateau.
3. Pour ecouter le CD, appuyer sur Lecture/pause et ajuster le volume.
Le plateau CD se ferme automatiquement.
L'a"chage indique la plage reproduite et la duree ecoulee depuis le debut.
4. Pour arr^eter le CD, appuyer sur CLEAR. A la reprise de la lecture du CD, celle-ci
commence a partir de la plage 1.
5. Pour mettre l'appareil en mode de pause, appuyer sur Lecture/pause pendant que le CD
est reproduit, en appuyant de nouveau sur Lecture/pause le CD commence la ou il a ete
laisse.
6. Pour retirer le CD, appuyer sur open/close, sortir le CD et appuyer de nouveau sur
open/close, pour fermer le plateau. Conserver le plateau ferme, sauf pendant le chargement et le retrait pour proteger le mecanisme de la poussiere et des accidents.
178
2.3.2. Versions de SPIN
Texte de d'execution
Comment placer un CD, l'
ecouter puis l'arr^
eter
-
Appuyez sur OPEN/CLOSE.
Mettez le CD face imprim
ee vers le haut sur le plateau.
Appuyez sur Lecture/pause.
Ajustez le volume.
Pour arr^
eter le CD, appuyez sur CLEAR.
Pour mettre l'appareil en mode de pause, appuyez sur Lecture/pause pendant que
le CD est reproduit.
Si Lecture/pause est appuy
e de nouveau, le CD se commence l
a o
u il a e
t
e laiss
e.
Pour le retirer, appuyez sur OPEN/CLOSE, sortez le CD.
Appuyez sur OPEN/CLOSE de nouveau pour fermer le plateau.
Conservez-le ferm
e, sauf pendant le chargement et le retrait pour prot
eger le
m
ecanisme de la poussi
ere et des accidents.
Texte hybride
Pour placer un CD, l'
ecouter et l'arr^
eter
Appuyez sur OPEN/CLOSE. Mettez le CD face imprim
ee vers le haut sur le plateau.
Appuyez sur Lecture/pause. Ajustez le volume. Pour arr^
eter le CD, appuyez sur
CLEAR. Pour mettre l'appareil en mode de pause, appuyez sur Lecture/pause pendant
que le CD est reproduit. Si Lecture/pause est appuy
e de nouveau, le CD se commence
l
a o
u il a et
e laiss
e. Pour le retirer, appuyez sur OPEN/CLOSE, sortez le CD.
Appuyez sur OPEN/CLOSE de nouveau pour fermer le plateau. Conservez-le ferm
e,
sauf pendant le chargement et le retrait pour prot
eger le m
ecanisme de la poussi
ere
et des accidents.
Texte de comprehension
Comment placer un CD, l'
ecouter puis l'arr^
eter
Appuyez sur OPEN/CLOSE. Mettez le CD face imprim
ee vers le haut sur le plateau.
Appuyez sur Lecture/pause. Ajustez le volume. Pour arr^
eter le CD, appuyez sur
CLEAR. Pour mettre l'appareil en mode de pause, appuyez sur Lecture/pause pendant
que le CD est reproduit. Le CD se commencera l
a o
u il a et
e laiss
e. Pour le retirer,
appuyez sur OPEN/CLOSE en appuyant sur Lecture/pause de nouveau sortez le CD.
Appuyez sur OPEN/CLOSE de nouveau pour fermer le plateau. Conservez-le ferm
e,
sauf pendant le chargement et le retrait pour prot
eger le m
ecanisme de la poussi
ere
et des accidents.
2.4. Soupe aux feves de Dale
2.4.1. Version originale, Dal92]
Soupe aux feves
Tremper, egoutter et rincer les feves.
E plucher et hacher l'oignon.
E plucher et hacher la pomme de terre.
Gratter et hacher les carottes.
Trancher le celeri.
Faire fondre le beurre.
Ajouter les legumes.
Les faire revenir.
Ajouter les feves, le bouillon et le lait.
Faire mijoter.
Liqueer la soupe.
179
Ajouter la creme tout en melangeant.
Ajouter les assaisonnements.
Rechauer.
2.4.2. Versions de SPIN
Texte d'execution
Comment faire la soupe aux f
eves
-
Tremper les f
eves.
Les egoutter.
Les rincer.
Eplucher l'oignon.
Le hacher.
Eplucher la pomme de terre.
La hacher.
Gratter les carottes.
Les hacher.
Trancher le c
eleri.
Faire fondre le beurre.
Ajouter les l
egumes.
Les faire revenir. Ne pas les faire brunir.
Ajouter les f
eves, le bouillon et le lait.
Faire mijoter.
Liqu
efier la soupe.
En la m
elangeant ajouter la cr
eme.
Ajouter les assaisonnements.
R
echauffer la soupe. Ne pas la faire bouillir.
Texte hybride
Comment faire la soupe aux f
eves
Tremper les f
eves. Les e
goutter. Les rincer. Eplucher
l'oignon. Le hacher. Eplucher
la pomme de terre. La hacher. Gratter les carottes. Les hacher. Trancher le c
eleri.
Faire fondre le beurre. Ajouter les l
egumes. Les faire revenir. Il ne faut pas
les faire brunir. Ajouter les f
eves, le bouillon et le lait. Faire mijoter. Liqu
efier
la soupe. En la m
elangeant ajouter la cr
eme. Ajouter les assaisonnements. R
echauffer
la soupe. On ne la fait pas bouillir.
Texte de comprehension
Comment faire la soupe aux f
eves
Tremper les f
eves. Les e
goutter. Les rincer. Eplucher l'oignon. Le hacher. Eplucher
la pomme de terre. La hacher. Gratter les carottes. Les hacher. Trancher le c
eleri.
egumes. Les faire revenir. Il ne faut pas
Faire fondre le beurre. Ajouter les l
les faire brunir. Ajouter les f
eves, le bouillon et le lait. Faire mijoter. Liqu
efier
la soupe. En la m
elangeant ajouter la cr
eme. Ajouter les assaisonnements. R
echauffer
la soupe. Vous ne la faites pas bouillir.
180
2.5. Prise electrique de Mellish
2.5.1. Version originale
pour faire en sorte que la prise de courant fonctionne vous devez avoir installe le nouveau
fusible.
pour faire en sorte que vous installiez le fusible le couvercle doit ^etre ^ote et la bo^!te du
fusible doit ^etre vide.
enlever le couvercle et enlever l'ancien fusible. ensuite la bo^!te du fusible sera vide.
installez le nouveau fusible.
cependant maintenant le couvercle n'est pas mis.
installez le couvercle.
ensuite branchez la prise et la prise fonctionnera.
2.5.2. Versions de SPIN
Texte d'execution
Comment faire fonctionner le syst
eme
-
Enlevez le couvercle.
Enlevez l'ancien fusible.
Installez un nouveau fusible.
Installez le couvercle.
Branchez la prise.
Texte hybride
Comment faire fonctionner le syst
eme
Enlever le couvercle. Enlever l'ancien fusible. Installer un nouveau fusible.
Installer le couvercle. Brancher la prise.
Texte de comprehension
Comment faire fonctionner le syst
eme
Enlever le couvercle. Enlever l'ancien fusible. Installer un nouveau fusible.
Installer le couvercle. Brancher la prise.
RE FE RENCES
AKPT91]
All83]
All91]
App85]
AR95]
Bal92a]
Bal92b]
BHS94]
Bin86]
Bri86]
BVDGH90]
Car92]
CGB88]
Dah88]
Dah89]
J. Allen, H. Kautz, R. Pelavin et J. Tenenberg. Reasoning about Plans. Morgan
Kaufmann, San Mateo, Californie, 1991.
J. Allen. Maintaining knowledge about temporal intervals. Communications of
the ACM, 26(11):832{843, 1983.
J. Allen. Temporal Reasoning and Planning. Dans J. Allen, H. Kautz, R. Pelavin
et J. Tenenberg, editeurs, Reasoning about Plans, chapitre 1, pages 2{68. Morgan
Kaufmann, San Mateo, Californie, 1991.
D. Appelt. Planning English Sentences. Studies in Natural Language Processing.
Cambridge University Press, 1985.
E. Andre et T. Rist. Generating Coherent Presentations Employing Textual and
Visual Material. 1995. a para^%tre.
C. Balkanski. Action Relations in Rationale Clauses and Means Clauses. Dans
Proceedings of the 15th International Conference on Computational Linguistics
(COLING-92), volume 1, pages 266{273, Nantes, ao^ut 1992.
C. Balkanski. Actions, Beliefs and Intentions in Rationale Clauses and Means
Clauses. Proceedings of the Tenth National Conference on Articial Intelligence,
AAAI, pages 196{301, juillet 1992.
L. Bates, E. Hovy et S. Senne. (panelistes invites). Panel discussion: Evaluating Generation Systems, 7th International Workshop on Natural Language
Generation. non publie, juin 1994.
E. Bingham. Pocketbook for Technical and Professional Writers. Wadsworth,
Belmont, Californie, 1986.
B. K. Britton. Capturing Art to Improve Text Quality. Educational Psychologist, Special Issue: Design of Instructional Text, 21(4):333{356, automne 1986.
B. K. Britton, L. Van Dusen, S. M. Glynn et D. Hemphill. The Impact of
Inferences on Instructional Text. The Psychology of Learning and Motivation,
25:53{70, 1990.
D. Carcagno. Text generation in industry: the technological transfer is still to
come. Dans Expert Systems Conference, Avignon, 1992. Table ronde: Automatic
text generation, A tool for the business world?
J. Corter, M. Gluck et G. Bower. Basic Levels in Hierarchically Structured
Categories. Dans Proceedings of the 10th Annual Conference of the Cognitive
Science Society, pages 118{124, Montreal, ao^ut 1988.
K. Dahlgren. Naive Semantics for Natural Language Understanding. Kluwer
Academic Publishers, 1988.
K. Dahlgren. Coherence Relation Assignment. Dans Proceedings of the 11th
Annual Conference of The Cognitive Science Society, pages 588{596, Michigan,
ao^ut 1989.
182
Dal88]
Dal89a]
Dal89b]
Dal92]
Dan63]
Dan65]
Dan73]
Dan85]
DBFD92]
DE92]
DE93a]
DE93b]
DEW92]
DEW95]
DFG88]
DH93]
DHP+ 94]
Dix87a]
Dix87b]
DSH93]
R. Dale. Generating Referring Expressions in a Domain of Objects and Processes. These de doctorat, University of Edinburgh, 1988.
R. Dale. Cooking up Referring Expressions. Proceeding of the 27th Annual Meeting of the Association for Computational Linguistics, juin 1989.
R. Dale. Generating Recipes: An Overview of Epicure. Extended Abstracts of
the Second European Natural Language Generation Workshop, avril 1989.
R. Dale. Generating Referring Expressions: Constructing Descriptions in a Domain of Objects and Processes. ACL{MIT Press Series in Natural Language
Processing. The MIT Press, 1992.
A. Danto. What can we do. The Journal of Philosophy, LX(15):435{445, juillet
1963.
A. Danto. Basic Actions. American Philosophical Quarterly, II:141{148, 1965.
A. Danto. Analytical Philosophy of Action. Cambridge at the University Press,
1973.
L. Danlos. Generation automatique de texte en langue naturelle. Masson, 1985.
J. Donin, R. Bracewell, C. Frederiksen et M. Dillinger. Students' Strategies
for Writing Instructions, Organizing Conceptual Information in Text. Written
Communication, 9(2):209{236, apr 1992.
B. Di Eugenio. Understanding Natural Language Instructions: The Case of Purpose Clauses. Dans Proceedings of the 30th Annual Meeting of the Association
for Computational Linguistics (ACL-92), pages 120{127, University of Delaware, juin 1992.
B. Di Eugenio. Speaker's Intention and Beliefs in Negative Imperatives. Dans
O. Rambow, editeur, Proceedings of the ACL Workshop on Intentionality and
Structure in Discourse Relations, pages 11{14, Ohio State University, juin 1993.
B. Di Eugenio. Understanding Natural Language Instructions: A Computational
Approach to Purpose Clauses. These de doctorat, University of Pennsylvania,
1993.
B. Di Eugenio et M. White. On the Interpretation of Natural Language Instructions. Dans Proceedings of the 15th International Conference on Computational
Linguistics (COLING-92), volume IV, pages 1147{1151, Nantes, aug 1992.
B. Di Eugenio et B. L. Webber. Pragmatic overloading in Natural Language
instructions. soumis pour publication, 1995. disponible aupres des auteurs.
P. Dixon, J. Faries et G. Gabrys. The Role of Explicit Action Statements in
Understanding and Using Written Directions. Journal of Memory and Language,
27(6):649{667, dec 1988.
H. Dalianis et E. Hovy. Aggregation in Natural Language Generation. Dans
Proceedings of the Fourth European Workshop on Natural Language Generation,
pages 67{78, Pise, Italie, avril 1993.
J. Delin, A. Hartley, C. Paris, D. Scott et K. Vander Linden. Expressing Procedural Relationships in Multilingual Instructions. Dans Proceedings of the 7th
International Workshop on Natural Language Generation, pages 61{70, Kennebunkport, Maine, juin 1994.
P. Dixon. Actions and Procedural Directions. Dans R. S. Tomlin, editeur, Coherence and Grounding in Discourse, pages 69{89. John Benjamins, Amsterdam,
1987.
P. Dixon. The Processing of Organizational and Component Step Information
in Written Directions. Journal of Memory and Language, 26(1):24{35, feb 1987.
J. Delin, D. Scott et T. Hartley. Knowledge, Intention, Rhetoric: Levels of Variation in Multilingual Instructions. Dans O. Rambow, editeur, Proceedings of the
183
ACL Workshop on Intentionality and Structure in Discourse Relations, pages
DSK91]
7{10, Ohio State University, juin 1993.
K. De Smedt et G. Kempen. Segment Grammar: a Formalism for Incremental Sentence Generation. Dans C. Paris, W. Swartout et W. Mann, editeurs,
Natural Language Generation in Articial Intelligence and Computational Linguistics, The Kluwer International Series in Engineering and Computer Science,
FN71]
Fri79]
GAB86]
GC78]
Gol70]
GS86]
Ham89]
Har85]
Har86]
HH92]
Hob79]
Hob82]
Hob85]
Hob90]
Hov90a]
Hov90b]
Hov93]
HR80]
Kar88]
chapitre 13, pages 329{349. Kluwer Academic Publisher, Boston, 1991.
R. Fikes et N. Nilsson. STRIPS: A new approach to the application of theorem
proving to problem solving. Articial Intelligence, 2:189{208, 1971.
P. E. Friedland. Knowledge{based experiment design in molecular genetics.
These de doctorat, Computer Science Dept., Stanford University, 1979.
S. Glynn, T. Andre et B. Britton. The Design of Instructional Text: Introduction to the Special Issue. Educational Psychologist, Special Issue: Design of
Instructional Text, 21(4):245{251, automne 1986.
M. Gregory et S. Carroll. Language and Situation: Language Varieties and their
Social Contexts. Routledge Kegan Paul, London, 1978.
A. Goldman. A Theory of Human Action. Princeton University Press, Princeton,
NJ, 1970.
B. J. Grosz et C. L. Sidner. Attention, Intentions, and The Structure of Discourse. Computational Linguistics, 12(3):175{204, juillet{septembre 1986.
K. Hammond. Case{Based Planning: Viewing Planning as a Memory Task.
Academic Press, 1989.
J. Hartley. Designing Instructional Text. Nichols, New York, 2 edition, 1985.
J. Harltey. Planning the Typographical Structure of Instructional Text. Educational Psychologist, Special Issue: Design of Instructional Text, 21(4):315{332,
automne 1986.
S. Hervey et I. Higgins. Thinking Translation. Routledge, London, 1992.
J. Hobbs. Coherence and Coreference. Cognitive Science, 3(1):67{90, janvier{
mars 1979.
J. Hobbs. Towards an Understanding of Coherence in Discourse. Dans W. Lehnert et M. Ringle, editeurs, Strategies for Natural Language Processing, chapitre 8, pages 223{244. Lawrence Erlbaum Associates, New-Jersey, 1982.
J. Hobbs. On the Coherence and Structure of Discourse. Rapport technique
CSLI-85-37, Centre for the Study of Language and Information, octobre 1985.
J. Hobbs. Litterature and Cognition. Center for the Study of Language and
Information, Stanford, Californie, 1990.
E. Hovy. Pragmatics and Natural Language Generation. Articial Intelligence,
43:153{197, 1990.
E. Hovy. Unresolved Issues in Paragraph Planning. Dans R. Dale, C. Mellish et
M. Zock, editeurs, Current Research in Natural Language Generation, Cognitive
Science Series, chapitre 2, pages 17{45. Academic Press, 1990.
E. Hovy. Automated Discourse Generation Using Discourse Structure Relations.
Articial Intelligence, 63(1{2):341{385, octobre 1993.
B. Hayes-Roth. Human planning process. Rapport technique R{2670{ONR,
Rand Corp., Santa Monica, Californie, 1980.
R. Karlin. Dening the Semantics of Verbal Modiers in the Domain of Cooking
Tasks. Dans Proceedings of the 26th Annual Meeting of the Association for Computational Linguistics (ACL-88), pages 61{67, State University of New-York at
Bualo, juin 1988.
184
Kay92]
KE91]
Kem87]
KH82]
Kit82]
Kit83]
KK93]
KL82]
KL94]
KL95]
Kla63]
Kor94]
KTKL93]
McD84]
McK85]
ME89]
MEF+ 90]
Mel88]
Mel90]
M. Kay. Industrial potential of text generators. Dans Expert Systems Conference, Avignon, 1992. Table ronde: Automatic text generation, A tool for the
business world?
P. Konoske et J. Ellis. Cognitive Factors in Learning and Retention of Procedural Tasks. Dans R. Dillon et J. Pellegrino, editeurs, Instruction: Theoretical
and Applied Perspectives, chapitre 3, pages 47{70. Praeger, New York, 1991.
G. Kempen, editeur. Natural Language Generation. NATO ASI Series. Martinus
Nijho Publishers, Dordrecht, 1987.
G. Kempen et E. Hoenkamp. Incremental sentence generation: implications for
the structure of a syntactic processor. Dans Proceedings of the 9th International
Conference on Computational Linguistics (COLING-82), pages 151{156, 1982.
R. Kittredge. Variation and Homogeneity of Sublanguages. Dans R. Kittredge
et J. Lehrberger, editeurs, Sublanguage, Studies of Language in Restricted Semantic Domains, chapitre 4, pages 107{137. Walter de Gruyter, Berlin, 1982.
R. Kittredge. Semantic Processing of Texts in Restricted Sublanguages. Computers and Mathematics with Applications, 9(1):45{58, 1983.
T. Korelsky et R. Kittredge. Towards stratication of RST. Dans O. Rambow,
editeur, Proceedings of the ACL Workshop on Intentionality and Structure in
Discourse Relations, pages 52{55, Ohio State University, juin 1993.
R. Kittredge et J. Lehrberger, editeurs. Sublanguage, Studies of Language in
Restricted Semantic Domains. Walter de Gruyter, Berlin, 1982.
L. Kosseim et G. Lapalme. Content and Rhetorical Status Selection in Instructional Texts. Dans Proceedings of the 7th International Workshop on Natural
Language Generation, pages 53{60, Kennebunkport, Maine, juin 1994.
L. Kosseim et G. Lapalme. Choosing Rhetorical Relations in Instructional Texts:
The Case of Eects and Guidances. Dans Proceedings of the 5th European Workshop on Natural Language Generation, Leiden, Hollande, mai 1995.
G. Klare. The Measure of Readability. Iowa State University Press, 1963.
T. Korelsky. communication personnelle, 1994.
L. Kosseim, A. Tutin, R. Kittredge et G. Lapalme. Generating Anaphora in
Assembly Instruction Texts. Dans Proceedings of the Fourth European Workshop
on Natural Language Generation, pages 43{54, Pise, Italie, avril 1993.
D. McDonald. Natural Language Generation as a Computational Problem: an
Introduction. Dans M. Brady et R. Berwick, editeurs, Computational Models of
Discourse, chapitre 4, pages 209{269. MIT Press, Cambridge, 1984.
K. McKeown. Discourse Strategies for Generating Natural{Language Text. Articial Intelligence, 27:1{41, 1985.
C. Mellish et R. Evans. Natural Language Generation From Plans. Computational Linguistics, 15(4):233{249, decembre 1989.
K. McKeown, M. Elhadad, Y. Fukumoto, J. Lim, C. Lombardi, J. Robin et
F. Smadja. Natural Language Generation in COMET. Dans R. Dale, C. Mellish et M. Zock, editeurs, Current Research in Natural Language Generation,
Cognitive Science Series, chapitre 5, pages 103{139. Academic Press, 1990.
C. Mellish. Natural Language Generation from Plans. Dans M. Zock et G. Sabah, editeurs, Advances in Natural Language Generation, Communications in
Articial Intelligence Series, chapitre 7, pages 131{145. Pinter Publishers, London, 1988.
C. Mellish. Generating Natural Language Explanations from Plans. Dans
L. Sterling, editeur, The Practice of Prolog, chapitre 6, pages 181{223. The
MIT Press, Cambridge, 1990.
185
MH93]
Moo95]
MP88]
MP92]
MP93]
MT88]
Par91]
Par93]
PK93]
Pol86]
Pol88]
Pol90]
PR90]
PR94]
PS94]
PSM91]
Pus89]
PVLF+ 95]
PW80]
E. Maier et E. Hovy. Organising Discourse Structure Relations Using Metafunctions. Dans H. Horacek et M. Zock, editeurs, New Concepts in Natural Language
Generation. Pinter, London, 1993.
J. Moore. Participating in Explanatory Dialogues, Interpreting and Responding
to Questions in Context. the MIT Press, Cambridge, Massachusetts, 1995.
J. Moore et C. Paris. Constructing Coherent Text using Rhetorical Relations.
Dans Proceedings of the 10th Annual Conference of The Cognitive Science Society, pages 637{643, Montreal, ao^ut 1988.
J. Moore et M. Pollack. A Problem for RST: The Need for Multi-Level Discourse
Analysis. Computational Linguistics, 18(4):537{544, dec 1992.
J. Moore et C. Paris. Planning Text for Advisory Dialogues: Capturing Intentional, and Rhetorical Information. Computational Linguistics, 19(4):651{694,
decembre 1993.
W. Mann et S. Thompson. Rhetorical Structure Theory: Towards a functional
theory of text organization. TEXT, 8(3):243{281, 1988.
C. Paris. The role of the user's domain knowledge in generation. Computational
Intelligence, 7:71{93, 1991.
C. Paris. User Modelling in Text Generation. Frances Pinter, London, England,
1993.
J. Price et H. Korman. How to Communicate Technical Information, A Handbook of Software and Hardware Documentation. Benjamin/Cummings, 1993.
M. Pollack. Inferring Domain Plans in Question-Answering. These de doctorat,
University of Pensnylvania, 1986. SRI rapport technique SRIN-403.
L. Polanyi. A formal Model of the Structure of Discourse. Journal of Pragmatics,
12(5/6):601{638, decembre 1988.
M. Pollack. Plans as Complex Mental Attitudes. Dans Intentions in Communication, chapitre 5. The MIT Press, Cambridge, MA, 1990.
S. Peters et W. Rapaport. Superordinate and Basic Level Categories in Discourse: Memory and Context. Dans Proceedings of the 12th Annual Conference
of the Cognitive Science Society, pages 157{165, Cambridge, Massachusetts,
juillet 1990.
G. Peter et D. R$osner. User-Model-Driven Generation of Instructions. User
Modeling and User-Adapted Interaction, 3:289{319, 1994.
C. Paris et D. Scott. Stylistic Variation in Multilingual Instructions. Dans Proceedings of the 7th International Workshop on Natural Language Generation,
pages 45{52, Kennebunkport, Maine, juin 1994.
C. Paris, W. Swartout et W. Mann. Preface. Dans C. Paris, W. Swartout et
W. Mann, editeurs, Natural Language Generation in Articial Intelligence and
Computational Linguistics, The Kluwer International Series in Engineering and
Computer Science, pages xv{xix. Kluwer Academic Publisher, Boston, 1991.
M. L. Puscas. A Survey of Technical Computer Users Resulting in Guidelines
for the Development of Technical Computer Documentation. Dans Conference
Proceedings of SIGDOC, pages 49{65, Baltimore, MD, november 1989. ACM.
C. Paris, K. Vander Linden, M. Fischer, T. Hartley, L. Pemberton, R. Power
et D. Scott. A Support Tool for Writing Multilingual Instructions. Dans Proceedings of the 14th International Joint Conference on Articial Intelligence
(IJCAI-95), Montreal, Canada, 1995.
F. Pereira et D. Warren. Denite Clause Grammars for Language Analysis { A
Survey of the Formalism and a Comparison with Augmented Transition Networks. Articial Intelligence, 13:231{278, 1980.
186
RD92]
Rei78]
Rei92]
Rei94]
RMG+76]
RML95]
Roc92]
Ros78]
R$os93]
RS89]
RS92]
RS94]
Sac74]
Sac77]
Saw91]
Sco93]
SG82]
Tat76]
TD90]
E. Reiter et R. Dale. A Fast Algorithm for the Generation of Referring Expressions. Dans Proceedings of the 15th International Conference on Computational
Linguistics, (COLING-92), volume I, pages 232{238, Nantes, ao^ut 1992.
R. Reichman. Conversational Coherency. Cognitive Science, 2(4):283{327, 1978.
N. Reithinger. The Performance of an Incremental Generation Component
for Multi-Modal Dialog Contributions. Dans R. Dale, E. Hovy, D. R$osner et
O. Stock, editeurs, Aspects of Automated Natural Language Generation, Lecture
Notes in Articial Intelligence, pages 263{276. Springler{Verlag, avril 1992.
E. Reiter. Has a Consensus NL Generation Architecture Appeared, and is it Psycholinguistically Plausible? Dans Proceedings of the 7th International Workshop
on Natural Language Generation, pages 163{170, Kennebunkport, Maine, juin
1994.
E. Rosch, C. Mervis, W. Gray, D. Johnson et P. Boyes-Braem. Basic Objects in
Natural Categories. Cognitive Psychology, 8:382{439, 1976.
E. Reiter, C. Mellish et J. Levine. Automatic Generation of Technical Documentation. Applied Articial Intelligence, 9, 1995.
S. Rock. Understanding Repetition in Natural Language Instructions { The
Semantics of Extent. Dans Proceedings of the 30th Annual Meeting of the Association for Computational Linguistics (ACL-92), pages 279{281, University of
Delaware, juin 1992.
E. Rosch. Principles of Categorization. Dans E. Rosch et B. Lloyd, editeurs,
Cognition and Categorization, pages 27{48. Lawrence Erlbaum, Hillsdale, NJ,
1978.
D. R$osner. Intention, rhetoric or discourse relations ? { a case from multilingual document generation. Dans O. Rambow, editeur, Proceedings of the ACL
Workshop on Intentionality and Structure in Discourse Relations, pages 106{
109, Ohio State University, juin 1993.
C. K. Riesbeck et R. C. Schank. Inside Case{based Reasoning. Lawrence Earlbaum Associates, 1989.
D. R$osner et M. Stede. Customizing RST for the Automatic Production of
Technical Manuals. Dans R. Dale, E. Hovy, D. R$osner et O. Stock, editeurs,
Aspects of Automated Natural Language Generation, Lecture Notes in Articial
Intelligence, pages 199{214. Springler{Verlag, avril 1992.
D. R$osner et M. Stede. Generating Multilingual Documents from a Knowledge Base: The TECHDOC Project. Dans Proceedings of the 15th International
Conference on Computational Linguistics (COLING-94), Kyoto, Japon, 1994.
E. D. Sacerdoti. Planning in a Hierarchy of Abstraction Spaces. Articial Intelligence, 5:115{135, 1974.
E. D. Sacerdoti. A Structure for Plans and Behavior. Elsevier, New York, 1977.
M. H. Sawyer. A Review of Research in Revising Instructional Text. Journal of
Reading Behavior, XXIII(3):307{333, sep 1991.
D. Scott. Generating Multilingual Instructions. Contribution a \Panel: Instruction { Language and Behavior". Dans Proceedings of the International Joint
Conference on Articial Intelligence (IJCAI-93), volume 2, Chambery, France,
1993.
E. Smith et L. Goodman. Understanding instructions: The role of explanatory
material. Bolt Beranek & Newman, Cambridge, Massachusetts, 1982.
A. Tate. Project Planning using a Hierarchical Non{linear Planner. Dissertation
abstracts international report 25, University of Edinburgh, 1976.
L. Timbal-Duclaux. La communication ecrite scientique et technique. ESFEntreprise Moderne d'E dition, Paris, 1990.
187
Tho21]
Tho77]
Tho85]
Tut92a]
Tut92b]
VL92]
VL93a]
VL93b]
VL94]
VLCM92a]
VLCM92b]
VLM95]
WAF+ 93]
Wal89]
Wei91]
ZL91]
E. L. Thorndike. The Teacher's Word Book. Columbia University, Teacher's
College, New York, 1921.
H. Thompson. Strategy and Tactics: A Model for Language Production. Papers
from the Thirteenth Regional Meeting, Chicago Linguistic Society, 13:651{668,
avril 1977.
S. A. Thompson. Grammar and written discourse: Initial vs. nal purpose
clauses in English. Text, 5(1/2):55{84, 1985.
A. Tutin. Etude des anaphores grammaticales et lexicales pour la generation
automatique de textes de procedures. These de doctorat, Departement de linguistique et philologie, Universite de Montreal, 1992.
A. Tutin. Lexical choice in context: generating procedural texts. Dans Proceedings of the 15th International Conference on Computational Linguistics,
(COLING-92), volume II, pages 763{769, Nantes, ao^ut 1992.
K. Vander Linden. The Expression of Local Rhetorical Relations in Instructional Text. Dans Proceedings of the 30th Annual Meeting of the Association for
Computational Linguistics (ACL-92), pages 318{320, University of Delaware,
juin 1992.
K. Vander Linden. Rhetorical Relations in Instructional Text eneration. Dans
O. Rambow, editeur, Proceedings of the ACL Workshop on Intentionality and
Structure in Discourse Relations, pages 140{143, Ohio State University, juin
1993.
K. Vander Linden. Speaking of Actions: Choosing Rhetorical Status and Grammatical From in Instructional Text Generation. These de doctorat, University
of Colorado, 1993.
K. Vander Linden. Generating Precondition Expressions in Instructional Text.
Dans Proceedings of the 32th Annual Meeting of the Association for Computational Linguistics (ACL-94), pages 42{49, Las Cruces, New Mexico, juin 1994.
K. Vander Linden, S. Cumminget J. Martin. The Expression of Local Rhetorical
Relations in Instructional Text. Rapport technique CU-CS-585-92, University
of Colorado, 1992.
K. Vander Linden, S. Cumming et J. Martin. Using System Networks to Build
Rhetorical Structures. Dans R. Dale, E. Hovy, D. R$osner et O. Stock, editeurs,
Aspects of Automated Natural Language Generation, Lecture Notes in Articial
Intelligence, pages 183{198. Springler{Verlag, 1992.
K. Vander Linden et J. Martin. Expressing Rhetorical Relations in Instructional Text: A Case Study of the Purpose Relation. Computational Linguistics,
21(1):29{57, mars 1995.
W. Wahlster, E. Andre, W. Finkler, H.-J. Protlich et T. Rist. Plan-based Integration of Natural Language and Graphics Generation. Articial Intelligence,
63(1{2):387{427, octobre 1993. aussi disponible en rapport technique Deutsches
Forschungszentrum f$ur K$ustliche Intelligenz, DFKI-RR-93-02.
M. Walker. Evaluating Discourse Processing Algorithms. Dans Proceedings of
the 27th Annual Meeting of the Association for Computational Linguistics
(ACL-89), Vancouver, juin 1989.
E. H. Weiss. How To Write Usable User Documentation. Oryx Press, Phoenix,
2 edition, 1991.
M. Zock et A. Laroui. Visualising results of choices in language generation: the
use of the intermediate structures. Dans Proceedings of the Machine Learning
Workshop (IJCAI-91), Sidney, 1991.
188
Zoc90a]
Zoc90b]
Zoc91a]
Zoc91b]
Zoc92]
Zoc93]
ZZ82]
M. Zock. If you can't open a black box, open a window ! or, how to visualize
dependency relationships when mapping meaning into form ? Dans Proceedings
of the COGNITIVA, Madrid, 1990.
M. Zock. La generation interactive de langage: comment visualiser le passage de
l'idee a la phrase. Dans J. Anis et J-L. Labrave, editeurs, Texte et Ordinateur,
Les Mutations du Lire-Ecrire, pages 201{220. E dition de l'espace Europeen, juin
1990.
M. Zock. Comment transformer une bo^%te noire en bo^%te de verre ? ou l'utilite
des structures intermediares comme moyen d'explication du fonctionnement du
francais. Dans M. G. Sere et A. Weil-Barais, editeurs, Proceedings of the Journees de Cachan, L'explication dans l'enseignement et l'E.I.A.O., pages 131{140.
E ditions Paris Onze, 1991.
M. Zock. SWIM or Sink: The Problem of Communicating Thought. Dans Bridge
to International Communication: Intelligent Tutoring Systems for Second{
Language Learning. Springer, New York, 1991.
M. Zock. La generation automatique de texte: Trente ans deja, ou presque. Dans
J. Anis, editeur, Numero Special sur la generation, Langue, no. 106, pages 8{35.
Larousse, 1992.
M. Zock. Is content generation a one{shot process or a cyclical activity of gradual renement ? the case of lexical choice. Dans H. Horacek et M. Zock, editeurs, New Concepts in Natural Language Generation: Planning, Realisation
and Systems, Communication in Articial Intelligence. Pinter, London, 1993.
A. M. Zwicky et A. D. Zwicky. Register as a Dimension of Linguistic Variation.
Dans R. Kittredge et J. Lehrberger, editeurs, Sublanguage, Studies of Language
in Restricted Semantic Domains, chapitre 9, pages 213{218. Walter de Gruyter,
Berlin, 1982.
Index d'auteurs
Allen 100, 124
Allen, Kautz, Pelavin et Tenenberg 4
Andre et Rist 23
Appelt 6
Hayes-Roth 100
Hervey et Higgins 145
Hobbs 32
Hovy 6, 32, 35
Hovy et McCoy 35
Balkanski 7, 19
Bates, Hovy et Senne 127
Bingham 9, 14, 118
Britton 11
Britton, Van Dusen, Glynn et Hemphill 15,
144
Karlin 144
Kay 4
Kempen et Hoenkamp 6
Kempen 6
Kittredge 3, 31, 39, 118, 146
Klare 11
Konoske et Ellis 4, 15
Korelsky 52
Korelsky et Kittredge 35, 39
Kosseim et Lapalme 7, 46
Kosseim, Tutin, Kittredge et Lapalme 125
Carcagno 4
Corter, Gluck et Bower 51
Dahlgren 32
Dale 24, 26, 36, 65, 101, 106, 107, 125, 129,
131, 141, 145
Dalianis et Hovy 117
Danlos 38
Danto 52
De Smedt et Kempen 6
Delin, Hartley, Paris, Scott et Vander Linden 17, 29, 81, 84, 86
Delin, Scott et Hartley 29, 37, 146
Di Eugenio 7, 20, 25, 36, 39, 65, 68, 69, 93
Di Eugenio et Webber 46, 47
Di Eugenio et White 20
Dixon 12, 13, 14, 15, 25, 78, 144
Dixon, Faries et Gabrys 12, 14, 115, 118
Donin, Bracewell, Frederiksen et Dillinger
15, 78
Maier et Hovy 32
Mann et Thompson 7, 23, 32, 33, 77
McDonald 6
McKeown 4, 6, 22, 32, 138
McKeown, Elhadad, Fukumoto, Lim, Lombardi, Robin et Smadja 22
Mellish 25, 36, 61, 65, 101, 129, 141
Mellish et Evans 25, 36, 145
Moore 35
Moore et Paris 35, 38
Moore et Pollack 32, 35
Paris 32, 54
Paris et Scott 29
Paris, Swartout et Mann 5
Paris, Vander Linden, Fischer, Hartley, Pemberton, Power et Scott 4, 29
Pereira et Warren 98
Peter et R$osner 27, 54
Peters et Rapaport 51
Polanyi 32
Pollack 20, 51
Price et Korman 10, 31, 38
Puscas 9
Faries et Gabrys 78
Fikes et Nilsson 24
Friedland 99
Glynn, Andre et Britton 10
Goldman 16, 52, 103
Gregory et Carroll 3
Grosz et Sidner 32
Hammond 100
Hartley 38, 126
R$osner 4
189
190
R$osner et Stede 27, 32, 58, 74, 75, 76
Reichman 32
Reiter 6
Reiter et Dale 125
Reiter, Mellish et Levine 9, 147
Reithinger 6
Riesbeck et Schank 100
Rock 76, 144
Rosch 51, 53
Rosch, Mervis, Gray, Johnson et Boyes-Braem
52
Sacerdoti 4, 35, 101, 103, 105, 144
Sawyer 11
Scott 4, 29, 37, 146
Smith et Goodman 14, 25, 55
Tate 25, 101
Thompson 5, 115, 118
Thorndike 11
Timbal-Duclaux 9
Tutin 4, 32, 39, 112, 125, 129
Vander Linden 7, 25, 28, 32, 36, 37, 39, 44,
58, 61, 74, 83, 86, 92, 101, 115, 118,
119, 127, 133,
Vander Linden et Martin 4
Vander Linden, Cumming et Martin 28, 120
Wahlster, Andre, Finkler, Protlich et Rist
23
Walker 127
Weiss 9
Zock 4, 5, 6
Zock et Laroui 4
Zwicky et Zwicky 3
191
Typeset by AMS-LATEX
192
Document Log:
Manuscript Version 0
Typeset by AMS-LATEX | 12 September 1995
Planication de textes d'instructions:
Selection du contenu et
de la structure rhetorique
Leila Kosseim
Departement d'informatique et de recherche operationnelle
Universite de Montreal
C.P. 6128, succ. Centre-Ville, Montreal
E-mail address : kosseim@IRO.UMontreal.CA
Was this manual useful for you? yes no
Thank you for your participation!

* Your assessment is very important for improving the work of artificial intelligence, which forms the content of this project

Download PDF

advertising