J'ai proposé il y a peu à Måns Björkman, le créateur du logiciel Tengwar Scribe, une traduction en français de sa création.
Celui-ci m'a alors signalé qu'il comptait mettre prochainement à disposition le code source de son travail. Il serait même prêt à apporter quelques modifications mineures.
Pour mémoire, ce logiciel propose de traduire des mots ou des phrases, de notre alphabet vers le système d'écriture des Tengwar, dans les modes quenya, sindarin, anglais et noir parler.
Par "modes quenya, sindarin, anglais et noir parler", j'entends que l'auteur a employé et interprété les connaissances en sa possession afin d'établir des règles d'emploi de ces modes. Ils peuvent donc être sujets à caution dans la mesure ou toutes les règles d'utilisation les concernant n'ont pas été établies, à l'image, pourrait-on dire, des langues elfiques de Tolkien. Les modes d'utilisation des Tengwar n'ont pas été clairement définis par Tolkien et le travail d'interprétation se fait majoritairement à partir du corpus que le professeur a laissé. Ainsi, le mode du "noir parler" est plus que parcélaire et celui de l'anglais, relativement flou, dans la mesure où le père (JRR Tolkien) n'utilisait pas exactement le même mode anglais que le fils (CJR Tolkien), et que de nombreux fans mirent au point des modes mixtes plus ou moins cohérents...
Ce système est donc perfectible, et c'est justement l'objet de mon post.
En amont de cette traduction, j'ai proposé à Måns Björkman d'effectuer un petit recensement des impressions et des remarques concernant son invention. Afin de la faire évoluer et de proposer une version française corrigée des éventuels bugs informatiques ou erreurs d'interprétation des modes.
Je vous demande donc de me donner vos impressions concernant les incohérences possibles du logiciel vis-à-vis des modes des Tengwar tels que nous les connaissons actuellement. Qu'il s'agisse de bugs liés à l'interprétation que fait le logiciel ou même de possibles erreurs introduites par inadvertance à la conception.
J'ose espérer que les plus chevronnés des Tolkiendili prendront le temps de poster afin de donner leurs avis sur ce logiciel et, le cas échéant, de participer à l'amélioration de ce projet louable.
Pour infos, le logiciel est téléchargeable ICI, conjointement avec le Mode Editor, qui permet de modifier les modes existants ou d'en créer de nouveaux.
Messages : 111
Sujets : 22
Inscription : Aug 2005
Effectivement, ce serai super de pouvoir traduire ce logiciel.
Mais je ne suis pas complétement convaincu par ces logiciels (que ce soit Tengwar Scribe ou Dragon Flame) car la traduction d'un mot en Tengwar doit se faire plus phonétiquement que lettre à lettre.
Messages : 1 965
Sujets : 27
Inscription : Oct 2004
Ce logiciel le fait phonétquement Mais il contient quelques erreurs (au niveau du /y/).
aravanessë
Messages : 2 219
Sujets : 134
Inscription : Sep 2002
Note technique : soit le logiciel est bien fait au niveau de l'internationalisation, auquel cas il n'y a besoin d'aucune connaissance technique pour le traduire. Sinon c'est galère.
aravanessë a écrit :Ce logiciel le fait phonétquement Mais il contient quelques erreurs (au niveau du /y/).
aravanessë C'est-à-dire ?
Messages : 185
Sujets : 2
Inscription : Nov 2004
03.11.2005, 14:21
(Modification du message : 04.11.2005, 00:12 par Lambendil.)
On peut aussi citer des impossibilités d'ordre stylistique (ex. les voyelles longues en quenya indiquées par un tehtar double sur un porteur simple vs. tehta simple sur porteur long)... C'est le problème de ce genre de logiciel "automatique".
Je ne sais pas si Mans a prévu un "mode des Etymologies".
Sébastien.
Beaucoup de questions restent en suspend et je ne suis pas certain d'avoir toutes les compétences requises pour ce travail...
Néanmoins, je m'efforcerai de rendre ce projet concret, ne serait-ce que pour proposer quelques corrections à l'auteur du logiciel.
Ma polititque en matière de projets pour la section Langues de Tolkiendil est simplement de lancer un maximum de passerelles de toutes parts afin de recueillir quelques projets intéressants, compte-tenu des problèmes inopinés parfois rencontrés...
Nous verrons bien ce qu'il adviendra de celui-là !
Messages : 1 324
Sujets : 35
Inscription : May 2005
Tout simplement bonne chance, je salue ton courage
Gil-galad, avec toi
Messages : 486
Sujets : 20
Inscription : Oct 2002
Benjamin Babut avait integré dans Dragon Flame 2.0 le "Tiny Tengwar Transcriber" (TTT) basé sur la moteur Namarcil de YaTT ("Yet Another Tengwar Transcriber") qui supporte aussi bien les modules (asymétriques) de TengScribe que ceux (symétriques) de YaTT.
Je n'ai pas trop joué avec cette option (qui dans DF se limite à "rendre" l'entrée courante)... Par ailleurs tous les transcripteurs automatiques souffrent à ma connaissance plus ou moins des mêmes problèmes... Mais c'est peut-être aussi une piste à creuser, le code source étant d'ores et déjà disponible et (au moins partiellement) portable.
Dans les transcripteurs "en ligne" sur le web, il y a bien sûr l'excellent Quenya Tengwainen de Jérome Sainton, qui a l'avantage d'être en français et d'être de surcroit très bien documenté:
http://erestel.free.fr/quenya_tengwainen/frmIndex.php
Didier.
Messages : 111
Sujets : 22
Inscription : Aug 2005
Comment un logiciel de transcription comme Tengwar Scribe peut-il faire la différence entre vert et verre puisqu'il s'écrivent pareil mais se prononce différemment.
Messages : 1 395
Sujets : 37
Inscription : Feb 2003
rorimac a écrit :Comment un logiciel de transcription comme Tengwar Scribe peut-il faire la différence entre vert et verre puisqu'il s'écrivent pareil mais se prononce différemment.
Tu veux dire qu'ils se prononces pareils mais s'ecrivent differement, non ^^
Messages : 1 965
Sujets : 27
Inscription : Oct 2004
Les mots "vert" et "verre" n'existe pas à ma connaissance en langage sindarin ou quenya. Et même si ils existaient, leur orthographe est très distincte, le double /r/ pour l'un et le "t" final pour l'autre.
aravanessë
Messages : 185
Sujets : 2
Inscription : Nov 2004
aravanessë a écrit :Les mots "vert" et "verre" n'existe pas à ma connaissance en langage sindarin ou quenya. Et même si ils existaient, leur orthographe est très distincte, le double /r/ pour l'un et le "t" final pour l'autre. Ce que voulait dire rorimac, c'est que les tengwar sont un système d'écriture phonétique (ou plutôt phonologique) : un mode pour le français transcrirait de façon identique verre, vert, ainsi que vers ou vair, puisque tous ces mots se prononcent /vεr/. Il est évident qu'un logiciel de transcription automatique peut difficilement rendre compte du phénomène d'homophonie. En conséquence, il y a peu de chance d'obtenir un jour des transcriptions automatisés d'un hypothétique mode de tengwar pour le français (car l'orthographe du français n'est pas phonétique : o, au, eau = /o/ ; è, ê, ai = /ε/ ; c = /s/ ou /k/, etc.), à moins d'écrire le français phonétiquement...
Sébastien
Messages : 486
Sujets : 20
Inscription : Oct 2002
a) A vue de nez, le français s'accorderait à mon avis assez mal d'une transcription purement phonétique... Sans compter que cette dernière gommerait probablement les variantes régionales (par ex. "lait" = [lε] dans le Nord ou [le] dans le Sud) et posérait donc à mon sens plus de problème qu'elle n'en résout. S'il devait exister un mode tengwar pour le français, sans doute faudrait-il qu'il soit au moins partiellement orthographique...
b) Pour répondre à Lambendil, un bon logiciel de transcription pourrait dans la théorie tout à fait passer en interne par une représentation phonétique... Cependant selon le degré de finesse qu'on veut lui donner, ce type d'algorithme va d'une complexité raisonnablement simple (en première approche à base de dictionnaires de graphèmes) à vraiment très complexe (i.e. les moteurs de synthèse vocale (TTS) modernes, à base d'inférences grammaticales etc.). A condition d'y mettre le prix, certains moteurs TTS sont aujourd'hui difficile à distinguer d'un lecteur "humain", sur des textes simples. Evidemment, pour une transcription en tengwar, ce serait un peu un marteau-pilon
Didier.
Messages : 185
Sujets : 2
Inscription : Nov 2004
Hisweloke a écrit :a) A vue de nez, le français s'accorderait à mon avis assez mal d'une transcription purement phonétique... Sans doute. Pour ma part, je ne vois pas l'intérêt de bricoler un mode de tengwar pour le français...
Citation :Sans compter que cette dernière gommerait probablement les variantes régionales (par ex. "lait" = [lε] dans le Nord ou [le] dans le Sud) et posérait donc à mon sens plus de problème qu'elle n'en résout. S'il devait exister un mode tengwar pour le français, sans doute faudrait-il qu'il soit au moins partiellement orthographique...
Au contraire, une version phonétique ne gommerait pas les variantes régionales mais les mettrait en relief (c'est plutôt la transcription orthographique qui gomme les différences prononciations).
D'ailleurs, la variante méridionnale du français poserait moins de problèmes que le français standard parisien : les voyelles mi-ouvertes et ouvertes sont toujours en distribution complémentaires en français méridionnal (voyelle ouverte en syllabe fermée, voyelle mi-ouverte en syllabe ouverte), et il suffirait d'avoir recours à un archiphonème (le français méridonnal distingue le /o/ de pot et pomme, mais ne distingue pas ce dernier de celui de paume, ce qui est le cas en français standard). Mais il est vrai qu'une transcription phonétique devrait rendre compte de l'existence d'au moins deux systèmes phonologiques en français contemporain (le français standard et le français méridionnal).
Citation :b) Pour répondre à Lambendil, un bon logiciel de transcription pourrait dans la théorie tout à fait passer en interne par une représentation phonétique... [...]
En effet. Cela est heureusement inutile pour les langues elfiques puisque leur transcription latine n'est généralement pas ambigue (contrairement au français ou à l'anglais où une lettre peut correspondre à différents phonèmes et un même phonème peut être transcrit par différentes lettres), ce qui n'exclut pas des cas d'homophonie. C'est d'ailelurs ce qui a rendu possible le développement de logiciels comme TengScribe dont le moteur de transcription est basé sur la forme graphique des unités, sans passer par une analyse phonétique au sens strict du terme (bien qu'il y ait nécessairement une analyse des combinaisons de graphèmes, pour des groupes comme ch par exemple).
Citation :A condition d'y mettre le prix, certains moteurs TTS sont aujourd'hui difficile à distinguer d'un lecteur "humain", sur des textes simples.
Cela est vrai, si l'on se limite aux seules unités discrètes de la parole(ponèmes, monèmes) : pour l'heure, les logiciels de synthèse vocale produisent une lecture qui reste mécanique et relativement dépourvue d'intonation. Il est extrêmement difficile de rendre compte des faits de prosodie (hauteur, intensité, débit, courbe intonative) dont le rôle est pourtant capital dans les modalités d'énonciation (selon l'intonation une même phrase peut être une assertion, une injonction ou une interrogation) et dans la fonction expressive qui nous permet de percevoir l'état émotif du locuteur (joie, peur, etc.) ou la façon dont il juge son énoncé (ironie, plaisir, dégoût, etc.).
Mais là on dévie quelque peu du sujet initial !
Sébastien
Messages : 111
Sujets : 22
Inscription : Aug 2005
Voici un mode francais très bien (il a le mérite d'être clair).
Il a aussi l'avantage d'etre imprimable (PDF).
Voici l'url :
http://www.simonrousseau.free.fr/teng-fra.pdf
Ce mode est très phonétique.
Messages : 486
Sujets : 20
Inscription : Oct 2002
Citation :Voici un mode francais très bien (il a le mérite d'être clair).
Intéressant. Ce mode est plus orthographique que phonétique ceci dit (vu qu'il fait figurer des consonnes "muettes" comme le s final dans "dans" etc.). Il ya quelques petites choses incorrectes (notamment sur la définition des semi-consonnes), mais l'idée n'est pas mauvaise.
Je me demande d'où vient son auteur géographiquement, il fait la distinction entre -in- et -un- (brin/brun) mais aussi entre -o- et -au- (pomme/paume)...
Citation :Il est extrêmement difficile de rendre compte des faits de prosodie (hauteur, intensité, débit, courbe intonative) dont le rôle est pourtant capital dans les modalités d'énonciation (selon l'intonation une même phrase peut être une assertion, une injonction ou une interrogation) et dans la fonction expressive qui nous permet de percevoir l'état émotif du locuteur (joie, peur, etc.) ou la façon dont il juge son énoncé (ironie, plaisir, dégoût, etc.)
Les meilleurs moteurs actuels se basent sur la ponctuation (qu'il faut donc évidemment placer correctement) pour rendre l'intonation générale (exclamation, interrogation, assertion, parenthèse...). Le résultat n'est pas trop mauvais. Certains moteurs supportent en outre des "meta-balises" prosodiques (un peu comme un marquage HTML, qu'il faut ajouter au texte) pour affiner l'intonation (hésitation, excitation, emphase...). Ils exploitent aussi parfois les balises de rendu (italique, gras, etc.) à cette même fin, ce qui fait qu'un texte "enrichi" est mieux restitué qu'un texte brut. Je ne dis pas que c'est parfait, mais simplement qu'il y a un net progrès par rapport à ce qui se faisait il y a ne serait-ce qu'une dizaine d'année (lecture très "robotique" à la C3PO !)... Sur certaines phrases, c'est bluffant de réalisme.
Parlant de C3PO (en parenthèse): Paradoxalement, la reconnaissance vocale est loin d'être aussi satisfaisante dans le cas général (i.e. vocabulaire ouvert, par opposition à un vocabulaire limité à qques mots), et nous sommes aujourd'hui dans une situation inverse de celle qui figure dans la plupart des oeuvres de SF ! (Pensez à Star Wars, les robots comprennent tout ce qu'on leur dit... mais parlent soient par bip-bip soit de manière très mécanique!).
Didier
Messages : 284
Sujets : 0
Inscription : Oct 2005
Juste une petite réflexion sur la citation suivante, bien que mon post est hors sujet je le reconnais : Citation :et nous sommes aujourd'hui dans une situation inverse de celle qui figure dans la plupart des oeuvres de SF ! (Pensez à Star Wars, les robots comprennent tout ce qu'on leur dit... mais parlent soient par bip-bip soit de manière très mécanique.
En effet....
Les auteurs de S.F. se sont peut être inspiré du fait réel suivant : dans la réalité un enfant de moins de deux ans comprendra tout ce qu'on lui dit mais n'arriva pas à parler pour autant, et à répéter tout ce qu'il entant. Ce qui est comparable aux robots des films de S.F. qui comprennent tout mais ne parlent que par Bip Bip où par un language mécanique.
En réalité, actuellement, en informatique il est plus simple de faire parler un robot de façon très réelle (des voix humaines enregistrés à l'avance) que de lui faire comprendre un nombre infinit de voix, ce qui nécessite un système d'analyse sonore très complexe (à cause des différent tons, des voix graves ou aigues, et je ne parle pas des voix d'enrhumés hihihi, ...)
Voila, c'est tout ce que je voulais dire en passant par ici...
Messages : 185
Sujets : 2
Inscription : Nov 2004
Hisweloke a écrit :Je me demande d'où vient son auteur géographiquement, il fait la distinction entre -in- et -un- (brin/brun) mais aussi entre -o- et -au- (pomme/paume)... Il vient sans doute du Sud de la France : le français méridionnal distingue - in- de - un- (ces sons sont deux phonèmes différents dans le système phonologique du français méridionnal), ce qui n'est pas le cas du français dit "standard" de Paris.
Citation :Les meilleurs moteurs actuels se basent sur la ponctuation (qu'il faut donc évidemment placer correctement) pour rendre l'intonation générale (exclamation, interrogation, assertion, parenthèse...). Le résultat n'est pas trop mauvais. Certains moteurs supportent en outre des "meta-balises" prosodiques (un peu comme un marquage HTML, qu'il faut ajouter au texte) pour affiner l'intonation (hésitation, excitation, emphase...). Ils exploitent aussi parfois les balises de rendu (italique, gras, etc.) à cette même fin, ce qui fait qu'un texte "enrichi" est mieux restitué qu'un texte brut. Je ne dis pas que c'est parfait, mais simplement qu'il y a un net progrès par rapport à ce qui se faisait il y a ne serait-ce qu'une dizaine d'année (lecture très "robotique" à la C3PO !)... Sur certaines phrases, c'est bluffant de réalisme.
Tout cela est très intéressant. Le fait est que, en phonétique structurale, certains liguistes classent certains faits prosodiques parmis les unités discrètes : c'est le cas des intonèmes, ou courbes intonatives, qui correspondent à des groupes accentuels et à différentes modalités (assertion, interrogation, exclamation).
Mais cela n'empêche que les développements de la linguistique moderne et, dernièrement, des sciences cognitives ont bien montré les limites de l'intelligence artificielle. Ce n'est pas demain, ni même après-demain, qu'on verra une machine parler ou être capable d'analyser n'importe quel énoncé de n'importe quel locuteur humain. Et cela tient à de nombreuses raisons. D'une part, la grande complexité du signal vocal émis par l'homme (la frontière entre voyelles et consonnes est floue, le timbre de chaque personne est différent et les variations sociales ou géographiques sont considérables pour une langue comme le français, difficulté de délimiter la phrase orale ou de déterminer ses unités constitutives dans le flot continu de la parole, problème des faits intonatifs comme le rythme, la hauteur, etc.). Mais le problème le plus important est d'ordre extralinguistique : c'est la question de la pragmatique, qui relève à la fois du code culturel, des connaissances du monde partagées par les locuteurs, de la capacité à attribuer des affects à son interlocuteur, etc. Et cette question est cruciale dans la problématique du sens, puisque le facteur pragmatique vient se greffer au linguistique dès qu'on passe du mot (ou monème) au syntagme et surtout à la phrase (ou à l'énoncé), ou, d'un autre point de vue, dès qu'on passe de la langue (en tant que système) à la parole (actualisation et mise en oeuvre de ce système).
Comme le dit Bertrand, il est facile de faire parler un robot comme un être humain, mais (hélas ou heureusement ? ) on n'est pas près d'avoir une machine capable de communiquer avec un être humain (c'est-à-dire pouvant interagir verbalement).
Messages : 486
Sujets : 20
Inscription : Oct 2002
Je vais laisser de côté les problématiques discutables de l'intelligence artificielle, qui nous entrainent trop loin du sujet initial de ce fuseau, auquel je voudrais revenir.
Je voudrais vous faire part de ma réflexion en généralisant la question de la restitution d'une langue A donnée depuis une transcription "latine" vers un système d'écriture phonétique B.
En posant:
A = sindarin, quenya, anglais, français, etc.
B = Tengwar, Cirth mais aussi Sarati (*)
Alors l'approche algorithmique du problème pourrait être de décomposer le processus en plusieurs étapes (**), à savoir (au moins):
1. Un module "frontal" transcrivant la langue A en IPA (phonétique) annoté (i.e. avec des extensions).
2. Un module "intermédiaire" transcrivant cet IPA enrichi en écriture B
3. Un module "final" assurant la représentation graphique de l'écriture B.
L'étape 2 est très aisée à réaliser, vu qu'elle est adéquate avec la nature des Cirth, Tengwar et Sarati. Je ne dis pas qu'elle ne pose pas quelques problèmes (dont souffrent déjà les transcripteurs actuels), mais elle demeure d'une complexité simple.
L'étape 3 correspond à la mise en forme, par exemple:
- Dans le cas des Sarati: écriture de gauche à droite ou de droite à gauche, verticale ou horizontale, en boustrophedon, etc.
- Dans le cas des Tengwar: "mode" vocalique (voyelles comme diacritiques apposées sur la consonne précédente ou suivante, voyelles indépendantes), variantes, etc.
Cette étape est d'une complexité moyenne, mais reste abordable. (C'est la seule à poser, en fait, un problème de portabilité / de dépendance à un système d'exploitation, puisqu'elle effectue la représentation graphique.)
L'étape 1 est évidemment la plus complexe dans le cas général. Pour les langues elfiques, dont la transcription latine est globalement phonétique, elle est aisée, pour d'autres langues elle nécessite fort probablement de recourir à un dictionnaire et à une analyse grammaticale. Complexité élevée dans le cas général (***), je ne vous le cache pas ("les poules du couvent couvent").
L'intérêt d'un "logiciel" conçu de cette manière serait de clairement distinguer les différentes étapes (ce que ne font aucun des transcripteurs actuels, qui fonctionnent en "une seule passe") et de les rendre indépendantes, i.e. réutilisables. Ce serait, je pense, beaucoup plus puissant qu'un TengScribe, YaTT, oTT ou autre: d'une part cela ouvre la porte à l'écriture de nouveaux "frontaux" (e.g. pour nos langues "réelles", non sans efforts), comme à celle de nouveaux "finaux" (e.g. Sarati, ou encore autres systèmes phonétiques "imaginaires").
Ce serait un logiciel autrement plus novateur et intéressant à réaliser qu'un énième transcripteur Tengwar basé sur les mêmes concepts que les précédents...
Ma vision d'un tel projet est qu'il faudrait d'abord coder les étapes 2 et 3, avant d'aborder la première (à contrario de ce qu'ont fait les développeurs des transcripteurs actuels, sans doute!).
Joli projet collaboratif, pour qui s'en sentirait le courage. (Pour ma part, j'ai de gros doutes - je parle d'expérience - sur la capacité de la communauté tolkienienne à mener de tels projets communautaires, et je ne me sens pas les tripes de l'aborder seul...).
Didier, féru de divagations inutilement hasardeuses.
Notes:
(*) Car les Sarati, autant sinon plus que les Tengwar, sont "the universal Eldarin alphabet system" (selon une grammaire "Qenya" ancienne, mais on le vérifie facilement en consultant les diverses tables publiées à ce jour).
(**) Les gens connaissant la théorie des langages (au sens informatique) reconnaitront là les "front-end', "compiler" et "back-end" d'un compilateur.
(***) Puisqu'on a évoqué les moteurs de synthèse vocale et de reconnaissance vocale dans ce fuseau, il ne nous manquait que les moteurs grammaticaux! *rire* Il suffit de voir la qualité médiocre du correcteur grammatical de MS-Word pour deviner que ce n'est pas un sujet aisé (même s'il existe des solutions commerciales, pas nécessairements "très" chères, bien meilleures que le machin inclu dans MS-Word en standard).
|