Retour à 'Textes chinois annotés'

Textes chinois annotés : Info sur le site

 

Objectifs du site

Vue de Suzhou

Le site 'Textes chinois annotés' (ou ramou.net) vise à : Renaud Bouret
Webmestre de ramou.net
Août 2020

  给我写信 - Écrivez-moi - Scrivetemi - Escríbanme

 

Confidentialité

 

Origine du site

(Le texte qui suit date de 2002, et retrace la vocation originelle de ramou.net.)

D'accord, le chinois c'est passionnant, mais on perd beaucoup de temps à chercher des caractères dans le dictionnaire. Même si on est rapide, on tombe toujours sur un sinogramme coriace qui fait tomber la moyenne. Tant qu'on ne maîtrise pas suffisamment de caractères, on est esclave de cette recherche et on lit peu de choses en beaucoup de temps. Or, chacun le sait, ce n'est qu'après avoir réussi à absorber quelques centaines de pages d'une langue étrangère qu'on peut commencer à lire couramment et à progresser sans beaucoup d'efforts. Combien de temps faut-il pour atteindre ce seuil critique du décollage? Quelques mois vite passés pour une langue latine, plusieurs dures années pour le chinois.

Dans le premier enthousiasme, on recopie les caractères du dictionnaire dans un cahier, que l'on feuillettera ensuite avec nostalgie, et on oublie la plupart de ces caractères. L'activité n'est pas dépourvue de charme, mais peu efficace. Si seulement on pouvait accumuler une fois pour toutes, dans sa mémoire, tous les caractères qu'on rencontre! Ou si, au moins, on pouvait titiller un caractère récalcitrant avec la pointe de son crayon pour le forcer à se dévoiler. Eh bien, tout cela est possible avec l'informatique.
 

Les textes annotés

Il y a aussi les fameuses fiches cartonnées, outil fort populaire pour apprendre les caractères chinois (ou les mots de n'importe quelle langue), mais ces fiches demandent beaucoup de manipulations. Et si les fiches sortaient toutes seules de leur boîte pour s'afficher sur le mur de la cuisine pendant qu'on prend le petit déjeuner? Ne serait-ce pas merveilleux? Il faudrait bien sûr qu'elles le fassent intelligemment : on aime les fiches pas trop faciles, pas trop difficiles, et on veut se débarrasser automatiquement de celles qu'on maîtrise bien. Encore l'ordinateur (le mur de la cuisine étant remplacé par un écran)! Ce fut notre premier programme concernant le chinois, à l'époque où les polices de caractère Unicode n'existaient pas encore. Nous nous sommes rapidement retrouvés en possession d'une substantielle liste de caractères et de mots chinois : un début de dictionnaire.

Internet est arrivé et, avec lui, des textes chinois que l'on peut recopier et imprimer, avant de les déchiffrer tranquillement à tête reposée, dictionnaire en main. Comme l’a si bien observé le grand sage Ben Shagua, l'innovation vient du croisement des savoirs. Nous avons donc écrit un programme qui associe ces textes avec notre dictionnaire de caractères déjà existant. Mais pourquoi nous arrêter en si bon chemin? Autant traduire les mots plutôt que les caractères isolés. Les mots chinois ne sont pas clairement séparés les uns des autres, malheureusement, mais, au moins, ils sont invariables. Et voilà les premiers textes annotés qui déferlent les uns après les autres.

C'est là que le travail devient intéressant. Plutôt que de remplir fastidieusement notre dictionnaire de A à Z, nous partons d'un texte déjà annoté et nous trouvons la plupart des mots manquants, que nous ajoutons aussitôt à notre base de données. L'opération est agréable, instructive et surtout productive, puisqu'un mot rencontré une seule fois est inscrit pour toujours dans la mémoire de l’ordinateur (pas dans la nôtre, hélas).

Les textes annotés sont créés automatiquement par notre programme maison (en format XML et HTML). Les mots et caractères retenus sont filtrés selon des degrés de difficulté variables. Pour des textes accompagnés d'un vocabulaire plus large (niveau débutant), rendez-vous sur la page Textes pour débutants. Le dictionnaire utilisé pour la traduction des mots et caractères est constamment enrichi, mais il demeure incomplet. Quoiqu'il en soit, les annotations présentes permettront au lecteur de s'épargner une bonne partie de la tâche fastidieuse de recherche de caractères dans un dictionnaire.
 

Les autres outils

Pour retenir plus facilement le vocabulaire d'une langue, il faut travailler par associations. Pour chaque caractère, on aimerait par exemple connaître tous les mots dont il fait partie (et pas uniquement ceux par lequel il commence, comme dans les dictionnaires), tous ses homophones, ses antonymes, etc. C'est le principe des fiches de caractères chinois, qui récoltent toute l'information pertinente dans la base de données. [Note : On peut, depuis 2010, créer ses propres fiches de caractères, à partir d’une petite base de données contenant 4000 caractères et 15 000 mots chinois environ.]

Le même principe peut s'appliquer à un mot français. On peut obtenir tous les mots et caractères chinois qui contiennent le mot chien par exemple. Et pourquoi pas les mots niche, os et canidé par la même occasion? Il suffit de créer un petit dictionnaire analogique qu'on enrichit et qu'on épure au fur et à mesure. Le triple croisement qui en résulte (toujours selon le principe de Ben Shagua) permet de créer des fiches analogiques presque aussi rapidement qu'on est capable de taper le mot chien. [Note : On peut, depuis 2018, créer ses propres fiches à partir de mots français.]

Certains textes annotés portent sur un sujet particulier. L'économie par exemple. En annotant automatiquement ces textes, on fait une bonne récolte de mots reliés au domaine choisi. En y ajoutant quelques fiches analogiques et quelques fiches de caractères sur le même sujet, on se retrouve rapidement en possession d'un vaste vocabulaire qu'il suffit de trier et de classer un peu.

Toujours dans le même esprit d'association par thème, nous avons construit (grâce à un autre programme maison) des tables de caractères ou cartes grand format, que l'on peut imprimer et découper. Le regroupement se fait selon le sujet (oiseaux), la prononciation (shi), l'aspect du caractère (qing-jing), sa nature (clé), sa signification (antonymes), etc.
 

Les textes interactifs

Les textes interactifs constituent la deuxième partie du miracle. On peut désormais obtenir la définition de n'importe quel caractère sélectionné à l'écran. C'est simple à utiliser, sobre et peu encombrant (les définitions se trouvent dans la base de données et non dans chacun des textes). À notre connaissance, aucun site Internet, dans quelque langue que ce soit, ne propose un outil aussi performant.

 

Mais qui fait tout ça?

Pour en savoir plus sur l'auteur du site, visitez sa page de publications et, si vous êtes vraiment indiscret, l'album de famille.
 

Renaud Bouret - 2002

Avis : nous avons fait les plus grands efforts pour obtenir la permission de reproduire les extraits de textes présentés sur ce site. Si vous jugez que la publication de certains textes enfreint vos droits, veuillez nous contacter.