Téléthèses de communication par voix synthétiques Analyse des divers modes de codage des mots, phrases et actes de langageJean-Claude Gabus, Fondation Suisse pour les Téléthèses, Neuchâtel, Suisse - PRE-ISAAC-1996 1. POURQUOI CODER ? Pour pouvoir restituer son contenu, une téléthèse de communication a notamment besoin que l'opérateur lui signifie quel mot ou quel message elle doit prononcer. Si l'on considère un vocabulaire fondamental de 500 mots, il faudrait, entre autres choses et sans faire appel à u n codage, un clavier d'au minimum 500 touches... Par ailleurs, certaines machines utilisant un synthétiseur (et non une voix digitale) capable de constituer le message parlé à partir de l'écrit demandent des connaissances et un niveau intellectuel que tous les utilisateurs n'ont pas, du moins initialement. Dans ce cas, un codage permet parfois à une personne ne maîtrisant qu'insuffisamment l'écriture de mémoriser les fichiers, les actes de langages, les mots, les phrases entières, qui seront ultérieurement utilisés par la personne sans langage verbal. Outre une incapacité ergonomique de coder un corpus important directement (un mot = une touche; signifie un clavier d'environ 500 touches), un codage bien fait présente une intéressante particularité; l'accélération linéaire. Les personnes utilisant les téléthèses de communication éprouvent souvent de la difficulté, sur le plan ergonomique, à opérer les sélections de touches nécessaires rapidement. Il en résulte malheureusement une grande lenteur dans la production "d'événements communicatifs parlés". Un codage permet généralement de réduire le nombre de sélections devant être faites pour composer le message que l'on souhaite. C'est le processus que nous proposons d'appeler "accélération linéaire". Quand à cette lenteur motrice s'ajoute une difficulté langagière (à évoquer les mots ou les phonèmes composant les mots, par exemple), alors le codage adapté peut "contourner" la difficulté langagière en proposant des stratégies basées sur d'autres stratégies d'accès à l'information. Dès lors, le codage, ou plus exactement la stratégie utilisée pour coder, devient déterminante. 2. COMMENT ? Chaque stratégie consiste, dans les grandes lignes, à faire des compromis, des choix stratégiques ou tactiques entre deux tendances. La première favorise la rapidité de l'accès aux occurrences, la seconde considère que la charge cognitive (l'effort à fournir pour maîtriser le codage) doit être la plus faible possible. Malheureusement, ces deux approches sont actuellement et généralement incompatibles. Dans un premier temps, voyons et comparons les principaux modes de codage, leur forces et faiblesses respectives. Dans une seconde partie, décrivons un système de codage basé sur le classement sémantique et/ou grammatical utilisant les abréviations (abréviations classées) . En conclusion, nous ferons quelques considérations relatives à l'application de la méthode. 3. LE MODE DIRECT Dans ce cas, chaque occurrence dispose d'une touche en particulier; il ne s'agit en fait pas vraiment d'un codage.... Tant que le nombre de messages est restreint, le système est idéal, tant sur le plan de la convivialité que de l'efficacité. Ce mode est généralement utilisé dans la première phase d'un projet de communication augmentative. Plus tard, il ne peut s'utiliser, comme nous le verrons plus tard, qu'en combinaison avec d'autres modes. La représentation du contenu des touches (label des touches permettant de les identifier) peut être fait de diverses manières, en fonction du niveau de connaissance de l'utilisateur. Pour une personne ne sachant ni lire ni écrire, le label des touches est une photo, un pictogramme ou un symbole. La combinaison de divers modes susmentionnés peut s'avérer indispensable. Par exemple, il est idéal de représenter les personnes par leur photographie, les objets par un pictogramme et les contenus plus abstraits par un symbole. Le mode direct s'assimile également à l'utilisation d'un tableau de communication simple. Il présente l'avantage de rendre "parlant" le tableau et, de ce fait, contribue à un auto-apprentissage du contenu des touches par le feed back vocal qu'il produit. Il représente également une première expérience propre aux particularités de la voix synthétique relativement à tous les autres moyens de communication, augmentatif ou non, utilisés par les personnes sans expression verbale, comme par exemple que la voix porte et qu'elle ne requière dès lors impérativement pas une position face à face avec l'interlocuteur (pourquoi la voix - le point de la situation - Gabus 1986-89-94 *). A notre avis, il n'est pas nécessaire d'analyser les avantages et inconvénients du codage direct. De toutes les manières, il est nécessaire de l'utiliser en combinaison avec pratiquement n'importe quelle méthode de codage; il reste la meilleure approche pour tous les types de contenus devant être rapidement et souvent utilisables dans une conversation. Cette désignation simple peut être utilisées avec les tout petits, à partir du moment, ou même encore avant, où ils ont compris la relation de communication. C'est en sélectionnant des touches qu'il vont notamment apprendre. Au hasard d'abord. Par contre, les applications interactives avec des jeux, des bruits, des sons, des histoires à se raconter dans tous les sens sont multiples et nécessaires à l'intégration de l'aide technique de communication dans l'acte de communiquer et dans la compréhension par le jeune des mécanismes mêmes de la communication. 4. LES DEUX GRANDS TYPES DE CODAGE Les diverses approches du codage se classent dans deux catégories principales. L'une favorise l'apprentissage, l'autre l'efficacité. La première à la particularité de documenter automatiquement l'utilisateur (écrans dynamiques). L'effort de mémorisation est donc très réduit. En l'espace de quelques minutes et sous réserve d'un accès ergonomique adéquat, un utilisateur de niveau moyen peut commencer d'utiliser son système. Par contre, comme nous le verrons plus loin, le prix à payer pour cette convivialité se situe dans le temps global d'accès; les machines de ce type sont certes attrayantes par la maîtrise quasi immédiate par leur utilisateur. Leur lenteur intrinsèque est cependant, à moyen et à long terme, inassumable à notre avis. Appelons cette approche "l'approche documentée". La seconde approche fait appel à un codage proprement dit des occurrences (mots, phrases et/ou acte de langage). Elle nécessite un effort de mémorisation important mais procure, à moyen et à long terme, et sous la réserve d'être maîtrisée, une efficacité maximum. Appelons cette approche "l'approche codée". Comme nous le verrons plus loin, chaque approche groupe plusieurs méthodes. 5. EVALUATION ET COMPARAISON Afin d'être en mesure de comparer entre elles ces diverses approches et méthodes, définissons tout d'abord les critères utilisés. A. Charge cognitive: Considère globalement les efforts et/ou pré-requis nécessaires à l'utilisation de la méthode de codage. B. Puissance d'évocation: Concerne essentiellement la qualification de la méthode à une expression très différenciée, permettant "de tout dire". C. Adaptabilité: Détermine la capacité de la méthode d'évoluer afin de suivre l'évolution des besoins et des aptitudes de l'utilisateur. D. Flexibilité: Qualifie la possibilité de la méthode de gérer les exceptions qui la caractérisent. E. Temps d'accès: Permet de mesurer le facteur d'accélération linéaire obtenu, combiné avec l'aspect ergonomique lié aux nombres de touches. F. L'ergonomie motrice: Considère la qualité de l'interface ergonomique entre l'homme et sa machine = nombre de touches nécessaires à la représentation de l'information. G. Méthode de classement/sémantique: Décrit la méthode de classement la plus utilisée ou dominante, considérée entre, classement: sémantique/grammatical/ les deux/par fréquence d'utilisation de l'occurrence. Il est difficile de comparer, dans le détail et d'une façon exhaustive, les diverses approches de codage utilisée aujourd'hui. Il faut voir dans le présent travail une tentative de le faire. L'objectif consiste à décrire tant que faire se peut les modes différents et, selon les critères mentionnés ci-dessus, essayer d'en faire une comparaison RELATIVE. L'échelle utilisée, pour cette comparaison, est la suivante: très favorable/favorable/acceptable/moyen/satisfaisant/faible/insatisfaisant. 6. APPROCHE DOCUMENTÉE Il y en a plusieurs: 6.1 Codage prédictif Un ordinateur peut tenir une statistique des mots les plus fréquemment utilisés. Dès lors, taper la ou les premières lettres d'un mot peut automatiquement en faire apparaître une liste, classée selon leur fréquence d'utilisation. Il suffit alors de cliquer celui dont on a besoin. Ce système de codage est séduisant, à condition de savoir lire évidemment. Le nombre de manipulations ou le temps nécessaires à la consultation de la liste de mots et sa sélection rendent son accès parfois trop long, sans compter l'attention visuelle constamment portée sur les listes successives qui apparaissent et la distraction visuelle provoquée par la lecture d'autres mots. Corpus entre 1 et 50 Corpus entre 50 et 1000 (période initiale) (avec expérience) _______________ _________________ A. Effort de mémorisation: favorable très favorable A CONDITION DE SAVOIR LIRE, pas d'effort de mémorisation. B. Puissance d'évocation: très favorable très favorable Illimitée (2/2 de corpus limité) C. Adaptabilité: très favorable très favorable Illimité, généralement automatique. D. Flexibilité: très favorable très favorable Illimité, un mot qui apparaît pour la première fois est simplement écrit puis automatiquement mémorisé. E. Temps d'accès: satisfaisant satisfaisant Faible; si le nombre de manipulations est faible (en général une ou deux lettres puis le chiffre correspondant à la position du mot dans la liste, le temps de consultation et de lecture des listes est long... F. L'ergonomie: satisfaisant satisfaisant L'ergonomie est moyenne, il faut impérativement un nombre d'occurrences contenant tout ce qui est nécessaire pour écrire, lettres, chiffres, ponctuation.. G. Méthode de classement/sémantique généralement orthographique, classé par fréquence d'utilisation Au départ, le corpus existant dans le système contient un vocabulaire pouvant être considéré comme fondamental (environ 500 à 1000 mots, classé selon leur poids statistique). Au fur et à mesure de l'utilisation, les valeurs statistiques changent automatiquement. 6.2 Codage par pages (écran dynamique) Il s'agit d'un "parcours guidé" dans le lexique de la machine. Une procédure par étapes successives a lieu. Chaque étape peut être considérée comme un champ sémantique. Au premier niveau, divers choix relatifs par exemple à la nourriture, l'habillement, les soins, les rapports humains ou autres apparaissent à l'écran. Si ce que l'utilisateur veut communiquer est en rapport avec la nourriture, il sélectionne (par exemple avec la souris) l'occurrence relative. Cette action entraîne le changement du contenu de l'écran; ce dernier propose alors des éléments exclusivement en rapport avec le sujet choisi. Ainsi, d'étapes en étapes, l'utilisateur finit par isoler, parmi des milliers, l'information qu'il recherche. Cette méthode de codage présente l'avantage d'une charge cognitive relativement faible offrant l'accès à un grand nombre d'occurrences. Cependant, le temps nécessaire à la sélection de l'occurrence recherchée est très long... et constant! Avantage : devant une difficulté d'évocation du nom des mots, l'utilisateur peut ici se balader dans des champs sémantiques (ne présentant pas trop de difficulté cognitive). Corpus entre 1 et 50 Corpus entre 50 et 1000 (période initiale) (avec expérience) _______________ _________________ A. Effort de mémorisation: favorable très favorable Entre une et 50 occurrences, la méthode est en concurrence avec un codage direct, donc pas vraiment intéressante. Au-delà, la convivialité devient très intéressante. B. Puissance d'évocation: satisfaisant satisfaisant En principe, et à la condition de savoir programmer un tel dispositif, celui-ci a une puissance d'évocation intéressante. Il ne faut pas oublier cependant que programmer un tel système demande des connaissances devant être régulièrement entretenues. Lorsque les occurrences sont représentées par des symboles, il faut être en mesure de créer ceux qui ne seraient pas initialement présents dans la banque de données de l'appareil. C. Adaptabilité: insatisfaisant (lourd) insatisfaisant (lourd) Par définition, on ne peut dire que ce qui est déjà programmé; si, à ce niveau là, le système est satisfaisant, il est loin d'être favorable, relativement à d'autres méthodes. D. Flexibilité: insatisfaisant insatisfaisant En principe faible, selon les caractéristiques de la machine; généralement, la méthode par niveaux ou par pages ne facilite pas une approche directe, par l'écriture par exemple (à vérifier lors du choix d'une machine). E. Temps d'accès: satisfaisant faible Le temps d'accès est lent; il implique un déplacement dans les pages qui fait appel à une observation attentive de chaque page et une sélection correspondante. De 5 à 50 occurrences, il est même franchement insatisfaisant (en concurrence avec d'autre méthodes plus adaptées). Au-delà, la situation s'améliore. Mais, un nombre constant d'étapes (passage d'une page à l'autre) est toujours nécessaire. F. L'ergonomie: favorable favorable En général, les machines utilisant cette méthode de codage (SYSTEME 2000, DYNAVOX) ont un écran présentant entre 10 et 40 cases. Ils peuvent être accessibles par divers modes ergonomiques tels que l'accès direct (touch screen), balayage par joystick ou ligne-colonne. D'une façon générale, un faible nombre de cases (touches) à l'écran est favorable ergonomiquement. Il est plus facile d'utiliser un clavier de 20 touches qu'un clavier de 100... G. Méthode de classement/sémantique Chaque page ou niveau correspond à un degré de précision sémantique plus important. 7. APPROCHE CODÉE Les deux méthodes codées que nous analysons ici s'articulent toutes deux sur une catégorisation sémantique et/ou grammaticale du corpus, sans pourtant l'imposer. Elles ont pour but de donner accès au lexique en proposant des codes contenant un nombre aussi faible que possible d'éléments, tout en reposant sur des moyens mnémotechniques devant favoriser, tant que faire se peu, leur mémorisation ou de faciliter, selon le trouble du langage, l'accès à l'information. Généralement les approches codées reposent sur des stratégies devant rendre l'effort de mémorisation le plus faible possible. Il s'agit donc essentiellement d'élaborer des règles (le plus petit nombre possible pour chaque méthode) afin , une fois les avoir assimilées, de pouvoir en déduire le code ou une partie du code du fichier dont on a besoin. La stratégie utilisée dans les deux méthodes fait également appel à des "marqueurs". Se basant notamment sur la "logique" appliquée dans la construction de l'Espéranto, un mot comme nourriture devient manger si son code est suivi du marqueur verbe et comestible, si le marqueur est l'adjectif. Par ailleurs, les occurrences sont classées dans des catégories grammaticales et sémantiques. 7.1 Codage Minspeak ® (polysémique) - Minspeak® est une marque déposée de PRC, Ohio, USA Mis au point aux Etats-Unis (1984 - PRC) , le codage Minspeak® repose non sur des lettres, mais sur des symboles. Ce type de codage considère à juste titre qu'un symbole est plus chargé de sens qu'une lettre. Par exemple, le symbole du soleil peut avoir plusieurs significations (polysémie du symbole). L'astre bien sûr, mais aussi l'été, la lumière, la chaleur, pour ne citer que les plus évidentes. Par ailleurs, combiner des symboles entre eux peut être mnémotechniquement plus facile que des lettres. Les expériences anglo-saxonnes le démontrent. Il nous semble que ce système est réellement plus favorable que les lettres pour un corpus de quelques centaines de mots ou d'occurrences. Au delà (le niveau étant cependant difficile à fixer d'une manière générale), les codages par abréviations ou de type Minspeak® sont, l'un comme l'autre, difficiles à mémoriser, relativement à un codage documenté. Par ailleurs, les téléthèses de communication utilisant Minspeak® sont munies d'un clavier de 128 touches; comme nous le verrons, cet important nombre de touches, relativement à un clavier d'ordinateur (HECTOR a 46 touches) permet des codes courts, d'où gain de temps. Corpus entre 1 et 50 Corpus entre 50 et 1000 (période initiale) (avec expérience) _______________ _________________ A. Effort de mémorisation: favorable satisfaisant Le symbole est considéré comme plus fortement évocateur que la lettre caractérisant une catégorie et/ou les initiales d'un mot (aspect polysémique). Corpus entre 1 et 50 Corpus entre 50 et 1000 (période initiale) (avec expérience) _______________ _________________ B. Puissance d'évocation: favorable acceptable Facile à programmer, le contenu d'une occurrence peut varier à l'infini. De plus, l'accès à l'écriture d'un mot ne se trouvant pas dans la mémoire du système est généralement très facile. C. Adaptabilité: très favorable favorable Facile à programmer, donc facilement adaptable. D. Flexibilité: favorable favorable Fichiers basés sur l'écriture donc, si la machine utilisée le permet, elle devrait être suffisamment flexible. E. Temps d'accès: favorable très favorable (actuellement, le meilleur) Le grand nombre de touches (128) autorise un important corpus d'occurrences codées avec une moyenne de 2 caractères environ. Un utilisateur expérimenté code à un rythme moyen de 2,2 occurrences. Contrairement à une méthode documentaire, le "temps d'accès" moyen à l'une des occurrences du corpus ne dépend pas de la taille de ce dernier, contrairement à un système à écran dynamique par exemple. F. L'ergonomie: favorable faible L'ergonomie n'a pas de bons points, ce type de codage se basant sur un clavier de 128 touches (généralement plus difficile à atteindre qu'un clavier à 46 touches...). G. Méthode de classement/sémantique : généralement par champ sémantique et grammaticaux - Possibilité de classer aussi certaines occurrences par fréquence de leur utilisation. Néanmoins, actuellement, Minspeak® est, de loin, le système le plus utilisé par les personnes de niveau moyen à bon. Ceci est cependant actuellement valable particulièrement pour l'anglais. En effet, en allemand et en français, les machines actuellement disponibles présentent (actuellement et sous réserve de changement par les fabricants) une faiblesse lorsqu'il faut passer de l'utilisation du corpus à l'écriture; il faut, à chaque fois, changer de niveau. De plus, le français et l'allemand étant beaucoup plus complexes que l'anglais quant à leur forme, il est difficile de comparer les accélération obtenues : en français beaucoup de cases sont, dès le départ, consacrées aux flexions de la langue plutôt qu'aux sons. On va donc forcément moins vite, puisqu'on a moins de cases symboliques au départ. Les machines actuellement typiquement utilisées avec Minspeak® sont Touch Talker, Light Talker, DeltaTalker, Alpha Talker Walker Talker et Introtalker (Prentke Romich Company, USA- Europe, Liberator). 7.2 Codage par abréviations classées (lettres) Dans ce cas, chaque occurrence fait l'objet d'un codage pouvant, par exemple, correspondre au classement et à l'abréviation du mot ou de la phrase que l'utilisateur cherche à exprimer. Dans la langue française, le nombre moyen de caractères nécessaire à la composition d'un texte simple étant de 6.7 environ, un codage par abréviations devient intéressant, dans la mesure où, comme les autres types de codages, il permet une économie de manipulations par rapport à un message écrit en toutes lettres (accélération linéaire). Dans le codage par abréviations, il est rapidement difficile de trouver suffisamment de codes mnémotechniquement logiques et ne comptant que peu de caractères. Généralement et pour les utilisateurs performants, le nombre moyen de caractères d'un code est d'environ 3,2 par mots; par contre, pour atteindre ce résultat, les stratégies mises en place sont actuellement souvent subtiles et obscures à toute autre personne que l'utilisateur du système. L'inconvénient réside donc dans la charge cognitive; seuls des utilisateurs de bon niveau sont en mesure d'en profiter pleinement. Si, initialement, un classement est fait selon les 3 critères fréquence, grammatical, sémantique, ce mode de codage est plus accessible. Relativement à Minspeak® cependant, il semble probable que, la lettre n'ayant pas le pouvoir évocateur d'un symbole, l'effort à fournir par l'utilisateur pour assimiler les codes soit plus important. Il est à noter que, concernant ce dernier point, aucune étude ne l'a, à notre connaissance et à ce jour, démontré. Le codage par abréviations classées est typiquement celui utilisable par les utilisateurs de la machine FST - HECTOR. Corpus entre 1 et 50 Corpus entre 50 et 1000 (période initiale) (avec expérience) _______________ _________________ A. Effort de mémorisation: favorable - faible faible - favorable Initialement, tous les deux systèmes de codages sont identiques. Dès que le nombre d'occurrences augmente (par exemple entre 50 et 300), le système devient plus complexe, relativement à Minspeak®. Au-delà, les deux types de codage présentent, à notre avis, un degré de difficulté comparable. B. Puissance d'évocation: favorable favorable Particulièrement favorable, toute la stratégie reposant sur l'écrit (à la condition de savoir lire et écrire...). C. Adaptabilité: favorable très favorable Particulièrement favorable, toute la stratégie reposant sur l'écrit. D. Flexibilité: favorable favorable Particulièrement favorable, toute la stratégie reposant sur l'écrit. De plus, une machine telle que HECTOR permet le passage du mode "utilisation de fichiers" au mode "écrit" directement, sans changer de niveau. E. Temps d'accès: favorable favorable Malheureusement, le temps d'accès, relativement à Minspeak® est environ 30% moins favorable. Un bon utilisateur d'HECTOR utilise en moyenne des codes de 3,2 caractères, contre 2,2 pour Minspeak®. Cela est la résultante d'un nombre de touches limité à 46 et non 128... Corpus entre 1 et 50 Corpus entre 50 et 1000 (période initiale) (avec expérience) _______________ _________________ F. L'ergonomie: acceptable acceptable L'avantage de ce qui précède se situe au niveau ergonomique. Un clavier de 46 touches suffit. Il est forcément plus facile d'accès qu'un clavier contenant plus de 100 touches. G. Méthode de classement/sémantique généralement par champ sémantique et grammaticaux - Possibilité de classer aussi certaines occurrences par fréquence de leur utilisation. Méthode de classement comparable à Minspeak®. EXEMPLE DE STRATEGIE DE CODAGE DANS "HECTOR": Nous reproduisons ici l'extrait d'une lettre destinée à une utilisatrice de la téléthèse "HECTOR", écrite dans le but de l'aider à la mise en place d'une stratégie de codage: ....... Voilà certainement la partie la plus difficile. Tu vois, à ce moment de ma lettre, j'ai écrit 4'853 caractères (espace inclus) et 845 mots. Cela représente une moyenne de 5.7 caractères par mots. Si je prends des textes rédactionnels tels qu'il m'arrive d'en écrire (voir "Le point de la situation 1994" que je t'envoie en annexe), le nombre moyen de caractères par mots oscille entre 6.6 et 6.8. Prenons un chiffre moyen de 6,5 caractères. La meilleure utilisatrice d'Hector, actuellement, a besoin de 3,2 caractères (codes) en moyenne par mots. Cela signifie que, par rapport à toi, elle est environ 2 fois plus rapide. A Paris, j'ai vu une gosse de dix ans utiliser HECTOR avec un nombre moyen de caractères de 3,6 ! Je te transmets ces informations afin que tu disposes d'éléments pour TE CONVAINCRE qu'il faut absolument faire un effort dans ce sens. Comment? Coder "anticonstitutionnellement" avec un seul caractère est certes spectaculaire, mais ne rapporte rien. Par contre, coder des "mots" qui reviennent très souvent, tels les articles, les pronoms, pour ne citer que ceux-là, peut être très intéressant. "Le" par exemple; il ne comporte que trois caractères L+E+ESPACE. Si tu le codes sous un seul caractère, il représente un gain de 1 à 3, donc TROIS FOIS PLUS RAPIDE... De plus, sur le plan de la mémoire, le code n'importe pas vraiment, dans la mesure où tu l'utilises souvent. Groupe 1 : les petits mots (codage direct) LE, LA, LES, UN, UNE, DES, CE, CETTE, CES , JE, TU, IL, ELLE, NOUS, VOUS, ILS, ELLES, LEQUEL, LAQUELLE, CELUI-CI, CELUI LA , ETC.... Tu pourrais par exemple programmer : T = le, Z = la, U = les G = un, H = une, J = des V = ce, B = cette, N = ces etc.... Choisis des zones de ton clavier faciles à atteindre. Et code ainsi tous tes petits mots. Groupe 2: les mots outils et les actes de langage. Ils sont aussi fréquemment utilisés dans toutes conversations. Il s'agit par exemple de: OUI/NON, JE NE SAIS PAS, VRAIMENT, NATURELLEMENT, A PROPOS, JE N'AI PAS COMPRIS, MERCI/NON MERCI, S'IL VOUS PLAIT, JE SUIS D'ACCORD/JE NE SUIS PAS D'ACCORD, IL ME FAUT RÉFLÉCHIR, POURQUOI, COMMENT, UN INSTANT S'IL VOUS PLAIT, HELLO!, BONJOUR/AU REVOIR, A BIENTOT/etc... Tu peux les coder sous un caractère. Dans ce cas, il n'est pas très important de choisir "stratégiquement"; comme tu les utilise souvent, tu t'en rappelleras. Souviens-toi que, pour toi, le temps nécessaire à taper une fois une touche donnée n'est pas beaucoup plus long que de taper plusieurs fois la même touche. Par exemple, pour ces petits mots des groupes 1 et 2, tu pourrais décider que "le contraire de ..." est la même touche deux fois . Par exemple: B = bonjour, BB = au revoir. Groupe 3 : tes textes et autres rédactions Ces textes ou rédactions, tu ne les utilises pas souvent. Donne leur un code clair. HECTOR t'offre la possibilité d'avoir des codes contenant jusqu'à 8 caractères. Si tu écris un texte sur ta peinture par exemple, n'hésite pas à le coder "PEINTURE" CERTES, IL EST LONG. Par contre, il te sera relativement facile de le retrouver. A ce propos, n'oublies pas la fonction "FIND"; tu donnes un mots du fichier que tu cherches, et HECTOR te fait défiler, sur ton ordre, tous les fichiers contenant ce mot. Par rapport aux groupes 1, 2 et 3, les groupes 4 et suivants doivent être le plus facile à retenir; pour ces groupes, il y aura beaucoup de codes (je pense environ 500 à 700). Groupe 4: les nom et adresses des personnes Pour les noms, je te propose la règle : N suivi des initiales, par exemple NJCG = Jean-Claude Gabus. Si tu mets A devant (soit ANJCG), tu obtiens mon nom et mon adresse. Si tu appliques cette règle à tous les noms que tu connais, tu t'en souviendras. Groupe 5 : les verbes C'est beaucoup plus compliqué. Tu pourrais par exemple systématiquement les faire commencer par la lettre V, suivie de un ou deux caractères: MANGER = VMG. Si tu veux les conjuguer, tu peux par exemple: VMG1 : je mange VMG2 : tu manges - variante: VMG11 = tu manges (1 est doublé, comme deuxième personne) etc.... 1VMG: je mangeais 2VMG: tu mangeais etc...Si maintenant, tu commences par le ?, alors ?VMG1 = est ce que je mange ? (forme interrogative) Groupe 6 : les adjectifs et les substantifs, à partir des verbes Un verbe peut-être "dévié" d'au moins deux façons. MANGER peut devenir l'adjectif MANGEABLE ou le nom NOURRITURE. Si un verbe, un nom ou un adjectif se trouve dans la mémoire, pourquoi pas dire: VMG : verbe manger à l'infinitif AMG : adjectif MANGEABLE SMG : NOURRITURE Groupe 7 : les substantifs, autre approche Tu décides de partir des substantifs, pour ensuite en déduire les verbes, adjectifs, adverbes qui leur sont éventuellement liés. Dans ce cas, tu pourrais créer ce que l'on appelle des champs sémantiques; tu les classes selon leur genre (attention, dans ce cas, je te conseille de créer un fichier "REGLE" dans lequel tu mets les règles que tu suis, afin de ne pas les oublier. Cette remarque est également valable pour les groupes 5 et 6). Tu commences par la lettre que tu as choisi pour classer tes mots, suivie du code abrégé du mot. Par exemple, tu crées des champs tels que: CHAMP SÉMANTIQUE EXEMPLE A : adresses - AA: adjectifs ANJCG: MON NOM ET ADRESSE B : boire et boissons BVR: VIN ROUGE D : dormir DR: DRAP/DPJ: PYJAMA E : étudier ELD: LIVRE DE DROIT F : finances FBD: BUDGET G : géographie (villes, lieux) GZH: ZUERICH H : habillement HMT: MANTEAU I : libre J : jeux JCR: JEU DE CARTE K : libre L : lecture, littérature LDD: LIVRE DE DROIT M : manger et boire MPL: POULET N : noms des personnes NJCG: JEAN-CLAUDE GABUS O : libre P : libre Q : libre R : libre S : santé SMV: MAL AU VENTRE T : libre U : libre V : verbes VMG: MANGER (VOIR PLUS HAUT) W : libre/X:libre/ Y:libre /Z: libre PAR CONTRE, TU NE CODES PAS DES MOTS DE MOINS DE 5 LETTRES, CELA NE VAUT PAS LA PEINE. Méthode de travail A chacun sa méthode. Tu trouveras certainement la tienne. Quand j'ai dû, tout comme toi, le faire (lorsque j'ai dû apprendre l'allemand, le suisse-allemand ou l'anglais), il m'a fallu : a) Etre très motivé d) Me donner le temps de réfléchir b) Progresser pas à pas e) Mesurer le gain que j'obtiens c) Me déterminer sur ma stratégie d'apprentissage Si cette lettre te donne des idées, il faut, comme tu le mentionnes dans ta dernière lettre, mettre de l'ordre dans le b....l des mémoires de ta machine. ..... 8. CONCLUSIONS : le concept "QuickWrite" Idéalement, un système de codage devrait être d'accès facile (faible charge cognitive) et rapide (facteur élevé d'accélération linéaire). Cette analyse montre une inhérente incompatibilité entre ces deux qualités. Soit on favorise la charge cognitive (approche documentée) soit le temps d'accès; mais pas les deux !... Depuis quelques années, la FST considère qu'une stratégie de codage combinant ces deux qualités est possible. Il s'agirait de proposer un système qui permette un "libre passage " entre les deux méthodes susmentionnées, combiné avec un accès direct à l'écrit. L'utilisateur opérerait lui-même le choix d'un type d'accès: a) L'écrit : si ce que l'utilisateur veut dire ne se trouve pas encore dans la mémoire ou, le cas échéant, s'il ne doit être prononcé qu'une fois. b) L'approche documentée : Si l'accès au corpus fait appel à un code dont l'utilisateur ne se souvient pas. c) l'approche codée : S'il connaît le code de l'occurrence dont il a besoin. Le principe "QuickWrite" Il s'agit réellement de "fondre" trois systèmes, soit l'écrit libre, l'approche documentée et celle qui est codée. En fait, même si la réalisation dans le détail n'est pas très simple, le principe, lui, l'est! Faire apparaître à l'écran, au fur et à mesure que l'on donne des informations au clavier (lettres du mot, champs sémantique, etc..), une succession de listes d'occurrences, en fonction soit du champ sémantique et des règles de grammaire (syntaxe) soit, plus simplement, en fonction de la statistique des mots et, pour chaque occurrence ainsi affichée, montrer le code lettre (ou symbole) correspondant. Dès lors, il est possible de le sélectionner par une lettre, un chiffre ou encore, lorsque cela est possible, par la souris . Si par exemple un mot est utilisé plusieurs fois dans un bref laps de temps, il sera possible de l'utiliser par son code directement, SANS FAIRE APPEL A LA LISTE DOCUMENTAIRE. C'est donc librement que l'utilisateur fait appel à l'une ou l'autre des approches proposées, en fonction de ce qu'il a à dire, du type de mot, et de la connaissance momentanée ou durable du code correspondant. Nous sommes actuellement toujours en train d'explorer les diverses approches. Le point sur l'état de nos recherches sera fait lors du colloque. Mars 1997/GB
|