30.11.2005, 23:09
Je vais laisser de côté les problématiques discutables de l'intelligence artificielle, qui nous entrainent trop loin du sujet initial de ce fuseau, auquel je voudrais revenir.
Je voudrais vous faire part de ma réflexion en généralisant la question de la restitution d'une langue A donnée depuis une transcription "latine" vers un système d'écriture phonétique B.
En posant:
A = sindarin, quenya, anglais, français, etc.
B = Tengwar, Cirth mais aussi Sarati (*)
Alors l'approche algorithmique du problème pourrait être de décomposer le processus en plusieurs étapes (**), à savoir (au moins):
1. Un module "frontal" transcrivant la langue A en IPA (phonétique) annoté (i.e. avec des extensions).
2. Un module "intermédiaire" transcrivant cet IPA enrichi en écriture B
3. Un module "final" assurant la représentation graphique de l'écriture B.
L'étape 2 est très aisée à réaliser, vu qu'elle est adéquate avec la nature des Cirth, Tengwar et Sarati. Je ne dis pas qu'elle ne pose pas quelques problèmes (dont souffrent déjà les transcripteurs actuels), mais elle demeure d'une complexité simple.
L'étape 3 correspond à la mise en forme, par exemple:
- Dans le cas des Sarati: écriture de gauche à droite ou de droite à gauche, verticale ou horizontale, en boustrophedon, etc.
- Dans le cas des Tengwar: "mode" vocalique (voyelles comme diacritiques apposées sur la consonne précédente ou suivante, voyelles indépendantes), variantes, etc.
Cette étape est d'une complexité moyenne, mais reste abordable. (C'est la seule à poser, en fait, un problème de portabilité / de dépendance à un système d'exploitation, puisqu'elle effectue la représentation graphique.)
L'étape 1 est évidemment la plus complexe dans le cas général. Pour les langues elfiques, dont la transcription latine est globalement phonétique, elle est aisée, pour d'autres langues elle nécessite fort probablement de recourir à un dictionnaire et à une analyse grammaticale. Complexité élevée dans le cas général (***), je ne vous le cache pas ("les poules du couvent couvent").
L'intérêt d'un "logiciel" conçu de cette manière serait de clairement distinguer les différentes étapes (ce que ne font aucun des transcripteurs actuels, qui fonctionnent en "une seule passe") et de les rendre indépendantes, i.e. réutilisables. Ce serait, je pense, beaucoup plus puissant qu'un TengScribe, YaTT, oTT ou autre: d'une part cela ouvre la porte à l'écriture de nouveaux "frontaux" (e.g. pour nos langues "réelles", non sans efforts), comme à celle de nouveaux "finaux" (e.g. Sarati, ou encore autres systèmes phonétiques "imaginaires").
Ce serait un logiciel autrement plus novateur et intéressant à réaliser qu'un énième transcripteur Tengwar basé sur les mêmes concepts que les précédents...
Ma vision d'un tel projet est qu'il faudrait d'abord coder les étapes 2 et 3, avant d'aborder la première (à contrario de ce qu'ont fait les développeurs des transcripteurs actuels, sans doute!).
Joli projet collaboratif, pour qui s'en sentirait le courage. (Pour ma part, j'ai de gros doutes - je parle d'expérience - sur la capacité de la communauté tolkienienne à mener de tels projets communautaires, et je ne me sens pas les tripes de l'aborder seul...).
Didier, féru de divagations inutilement hasardeuses.
Notes:
(*) Car les Sarati, autant sinon plus que les Tengwar, sont "the universal Eldarin alphabet system" (selon une grammaire "Qenya" ancienne, mais on le vérifie facilement en consultant les diverses tables publiées à ce jour).
(**) Les gens connaissant la théorie des langages (au sens informatique) reconnaitront là les "front-end', "compiler" et "back-end" d'un compilateur.
(***) Puisqu'on a évoqué les moteurs de synthèse vocale et de reconnaissance vocale dans ce fuseau, il ne nous manquait que les moteurs grammaticaux! *rire* Il suffit de voir la qualité médiocre du correcteur grammatical de MS-Word pour deviner que ce n'est pas un sujet aisé (même s'il existe des solutions commerciales, pas nécessairements "très" chères, bien meilleures que le machin inclu dans MS-Word en standard).
Je voudrais vous faire part de ma réflexion en généralisant la question de la restitution d'une langue A donnée depuis une transcription "latine" vers un système d'écriture phonétique B.
En posant:
A = sindarin, quenya, anglais, français, etc.
B = Tengwar, Cirth mais aussi Sarati (*)
Alors l'approche algorithmique du problème pourrait être de décomposer le processus en plusieurs étapes (**), à savoir (au moins):
1. Un module "frontal" transcrivant la langue A en IPA (phonétique) annoté (i.e. avec des extensions).
2. Un module "intermédiaire" transcrivant cet IPA enrichi en écriture B
3. Un module "final" assurant la représentation graphique de l'écriture B.
L'étape 2 est très aisée à réaliser, vu qu'elle est adéquate avec la nature des Cirth, Tengwar et Sarati. Je ne dis pas qu'elle ne pose pas quelques problèmes (dont souffrent déjà les transcripteurs actuels), mais elle demeure d'une complexité simple.
L'étape 3 correspond à la mise en forme, par exemple:
- Dans le cas des Sarati: écriture de gauche à droite ou de droite à gauche, verticale ou horizontale, en boustrophedon, etc.
- Dans le cas des Tengwar: "mode" vocalique (voyelles comme diacritiques apposées sur la consonne précédente ou suivante, voyelles indépendantes), variantes, etc.
Cette étape est d'une complexité moyenne, mais reste abordable. (C'est la seule à poser, en fait, un problème de portabilité / de dépendance à un système d'exploitation, puisqu'elle effectue la représentation graphique.)
L'étape 1 est évidemment la plus complexe dans le cas général. Pour les langues elfiques, dont la transcription latine est globalement phonétique, elle est aisée, pour d'autres langues elle nécessite fort probablement de recourir à un dictionnaire et à une analyse grammaticale. Complexité élevée dans le cas général (***), je ne vous le cache pas ("les poules du couvent couvent").
L'intérêt d'un "logiciel" conçu de cette manière serait de clairement distinguer les différentes étapes (ce que ne font aucun des transcripteurs actuels, qui fonctionnent en "une seule passe") et de les rendre indépendantes, i.e. réutilisables. Ce serait, je pense, beaucoup plus puissant qu'un TengScribe, YaTT, oTT ou autre: d'une part cela ouvre la porte à l'écriture de nouveaux "frontaux" (e.g. pour nos langues "réelles", non sans efforts), comme à celle de nouveaux "finaux" (e.g. Sarati, ou encore autres systèmes phonétiques "imaginaires").
Ce serait un logiciel autrement plus novateur et intéressant à réaliser qu'un énième transcripteur Tengwar basé sur les mêmes concepts que les précédents...
Ma vision d'un tel projet est qu'il faudrait d'abord coder les étapes 2 et 3, avant d'aborder la première (à contrario de ce qu'ont fait les développeurs des transcripteurs actuels, sans doute!).
Joli projet collaboratif, pour qui s'en sentirait le courage. (Pour ma part, j'ai de gros doutes - je parle d'expérience - sur la capacité de la communauté tolkienienne à mener de tels projets communautaires, et je ne me sens pas les tripes de l'aborder seul...).
Didier, féru de divagations inutilement hasardeuses.
Notes:
(*) Car les Sarati, autant sinon plus que les Tengwar, sont "the universal Eldarin alphabet system" (selon une grammaire "Qenya" ancienne, mais on le vérifie facilement en consultant les diverses tables publiées à ce jour).
(**) Les gens connaissant la théorie des langages (au sens informatique) reconnaitront là les "front-end', "compiler" et "back-end" d'un compilateur.
(***) Puisqu'on a évoqué les moteurs de synthèse vocale et de reconnaissance vocale dans ce fuseau, il ne nous manquait que les moteurs grammaticaux! *rire* Il suffit de voir la qualité médiocre du correcteur grammatical de MS-Word pour deviner que ce n'est pas un sujet aisé (même s'il existe des solutions commerciales, pas nécessairements "très" chères, bien meilleures que le machin inclu dans MS-Word en standard).