PDA

Afficher la version complète : Apprentissage du Japonais - Projet de traduction du JMdict et kanjdic en français



Gnurou
19/11/2011, 13h50
Bonjour à tous!

La plupart d'entre vous connaissent sans doute JMdict et kanjidic2, le dictionnaire libre japonais/anglais créé par Jim Breen et son équivalent pour les kanji. Si vous ne les connaissez pas, nul doute que vous les ayez déjà utilisés: ces données sont utilisées par pratiquement tous les logiciels de japonais gratuits ainsi que la plupart des dictionnaires en ligne (jisho.org, JWPCE, Tagaini, etc).

Le plus gros reproche contre ces excellentes resources de la part des utilisateurs non-anglophones est le manque de couverture des langues autres que l'anglais. En français, seuls les jouyou kanji ont une traduction (grâce à l'excellent travail d'Alain Thierion), et le JMdict n'est traduit qu'à 10%. Et encore, beaucoup de ces traductions ont été importées automatiquement à partir d'autres sources, et n'ont pas été mises à jour bien que la version anglaise ait évolué, faute d'une infrastructure centralisée. Pour les autres langues, c'est encore pire, la plupart n'étant même pas prises en charge.

Conséquence directe et facheuse: cela fait environ 3 ans que je casse les pieds de Jim pour lui demander quand pourra-t-on enfin soumettre des traductions pour le JMdict facilement et assurer leur suivi. C'est quelque chose de difficile à faire pour la petite équipe du JMdict et je le comprend. Du coup, la meilleure chose à faire semble être d'externaliser l'effort.

Il y a quelques mois, Akeru m'avait suggéré d'utiliser Transifex pour faciliter la traduction de l'interface de Tagaini. Transifex est un site sur lequel des développeurs de logiciels peuvent soumettre les chaînes de caractères utilisées dans leur logiciel en Anglais pour se les faire traduire dans d'autres langues par des contributeurs. C'est génial et ça marche: en deux semaines, Tagaini a gagné 4 nouvelles traductions et le suivi est bien plus simple à faire.

Du coup j'ai pensé, si ça marche si bien pour les logiciels, pourquoi pas avec autre chose? J'ai donc fait quelques tests ces dernières semaines afin de vérifier s'il était possible d'extraire les données en anglais de JMdict/Kanjidic, les faire traduire sur Transifex qui offre une interface impeccable pour ce genre de travail, et ré-insérer les nouvelles traductions dans les fichiers d'origine. Ben les amis, ça marche super, et je suis heureux de vous présenter un nouvel effort d'internationalisation du travail de Jim Breen dans toutes les langues que vous pouvez parler:

https://www.transifex.net/projects/p/jmdict-i18n/

Toute personne ayant un compte sur Transifex peut joindre l'une des équipes de traduction (ou demander la création d'une nouvelle pour une langue pas encore supportée) et contribuer à l'avancement du projet. Le résultat sera éventuellement intégré dans les fichiers officiels et ainsi utilisés dans tous les projets concernés par le JMdict (c'est-à-dire beaucoup). Bien entendu, un minimum de maîtrise de l'anglais et de sa langue natale (ainsi que, autant que possible, du japonais) est demandée. Si vous venez du monde du fansub, réfléchissez donc bien avant de vous lancer. ;)

La traduction est très simple en pratique, pour chaque définition se trouvent à gauche le mot d'origine en japonais, ses prononciations, et ses traductions en anglais (une par ligne). A droite, un emplacement pour taper la traduction dans une autre langue:2630Une tape sur la touche "tab" du clavier permet de passer à la définition suivante et ainsi de faire des traductions au kilomètre. Les traductions sont automatiquement enregistrées et seront disponibles dans la prochaine version du fichier.

L'état de la traduction française est visible sur la page suivante:

https://www.transifex.net/projects/p/jmdict-i18n/team/fr/

Le JMdict n'est pas encore extrait dans son intégralité, mais il y a déjà de quoi manger. Je suis en train de décider des règles pour extraire les autres entrées dans des groupes cohérents.

Quoi qu'il en soit, le projet est ouvert et j'espère bien faire remonter les premières données à Jim rapidement. Alors rejoignez-nous, faites passer le mot, et ensemble offrons enfin un dictionnaire japonais/français complet et libre!

Suikasensei
19/11/2011, 21h33
Projet vraiment honorable. Quelque chose qui m'interpelle, même si c'est le principe même de la collaboration entre anonymes: comment s'assurer de la qualité des traductions? C'est sans doute valable pour le JMDict aussi, mais qui peut prétendre traduire des mots dont les nuances sont parfois subtiles, s'il n'est pas professionnel dans le domaine? On me répondra peut-être que ce sont les utilisateurs qui feront la sélection, et qu'un mauvais dictionnaire ne marchera pas puisque les gens se rendront compte des erreurs. Mais n'y a-t-il pas l'effet inverse à considérer, à savoir le fait qu'un certain nombre de gens se voient apprendre des mots avec des définitions hasardeuses? Simple question - peut-être que l'effet global est très limité, ce que j'imagine. En tout cas le besoin est là, donc merci pour le temps que tu passes sur ce projet.

Az_In_one
20/11/2011, 01h46
Bien que je sois trop fainéant pour le faire*, j'avoue que si quelqu'un voulait bien reprendre l'intégralité des traductions du Nouveau Petit Royal papier au mépris de la propriété intellectuelle, je ne lui jetterais pas la première pierre.

* et surtout respectueux de la loi

Gnurou
20/11/2011, 02h12
Quelque chose qui m'interpelle, même si c'est le principe même de la collaboration entre anonymes: comment s'assurer de la qualité des traductions? C'est sans doute valable pour le JMDict aussi, mais qui peut prétendre traduire des mots dont les nuances sont parfois subtiles, s'il n'est pas professionnel dans le domaine?
Chaque équipe de traduction est gérée par un ou plusieurs coordinateurs, que l'on souhaite être des gens compétents (si possible des linguistes travaillant déjà depuis longtemps avec le JMdict) et qui joue le rôle de "modérateur". Le fait d'utiliser l'anglais comme langue pivot a justement pour but de faire baisser le niveau habituellement requis pour participer à ce genre de projet: la seule vraie règle pour effectuer les traductions (outre le fait de ne pas être analphabète) est de ne jamais dépasser la portée semantique de la traduction anglaise dans la définition en une autre langue. Ainsi la fidélité du dictionnaire devrait être respectée. Nous verrons comment cela fonctionnera en pratique, mais je suis relativement confiant. De plus, par rapport à la façon dont les traductions sont actuellement gérées (i.e. de façon quasi-automatique), cela ne pourra être qu'un progrès.

Suikasensei
20/11/2011, 17h31
Je vois - ingénieux. Comme tu dis, dans tous les cas cela ne saurait qu'améliorer les choses.
AZ_In_One: tu n'as pas dû bien lire, le JMDict est complètement libre si je ne m'abuse. Donc le traduire en français n'a rien d'illégal - en plus d'être légal c'est même utile.

margouyab26
21/11/2011, 09h14
Je vois - ingénieux. Comme tu dis, dans tous les cas cela ne saurait qu'améliorer les choses.
AZ_In_One: tu n'as pas dû bien lire, le JMDict est complètement libre si je ne m'abuse. Donc le traduire en français n'a rien d'illégal - en plus d'être légal c'est même utile.
AZ_In_One signifiait à mon avis que le dictionnaire Royal pourtant censée être fait par des linguistes professionnels contient pas mal d'erreur.

Sinon je suis très intéressé par ce projet (qui me sera utile pour Nihonwiki). Je rejoins donc la french team dès que j'ai un peu de temps libre (difficile avec un travail, un projet et des enfants ^__^).

Suikasensei
21/11/2011, 15h06
Effectivement - en effet dans ce cas.

fengrim
06/12/2011, 16h11
Je t'aurais bien filer un coup de main, si j'avais une minute pour moi.
En revanche j'ai transmis le message à des élèves japonais (Sorbonne) sur paris qui ont un bon niveau de français (surtout écrit.)
Ils prennent ce travail pour du Shukudai de base. :)

Gnurou
06/12/2011, 23h55
Hey femgrim,

Recevoir des contributions de japonais francophones, je n'y avais pas pensé - je me demande dans quel sens la traduction serait la plus fidèle. :P

En tout cas l'équipe française s'est un peu étoffée et la couverture déjà améliorée, il y a également eu du vietnamien ainsi que du thai! J'espère releaser tout cela avec un prochain Tagaini dans le mois.

Gnurou
25/01/2012, 03h55
Petit rapport sur le statut du projet: les choses ont bien avancées avec plusieurs centaines de nouvelles traductions côté français améliorant la couverture des mots essentiels, et la quasi-totalité des jouyou kanji traduits en italien depuis zéro. Mais le plus important, c'est que Jim Breen, au départ sceptique, s'est finalement laissé convaincre d'intégrer directement et automatiquement les contributions dans le JMdict officiel! Cela veut dire que les nouvelles traductions qui ont été soumises (principalement par des membres du forum) ou qui le seront finiront par couler dans les nombreux projets (gratuits ou non) utilisant le JMdict.

Je suis en train de finaliser les scripts gérant les régressions et l'export pour le JMdict, et une fois cela fini les contributions seront importées par Jim, vraisemblablement de façon quotidienne. C'est une excellente nouvelle et j'espère qu'elle motivera les contributeurs actuels et futurs à persister dans ce projet qui s'avèrera très utile pour les étudiants francophones.

Akeru
25/01/2012, 07h13
Jim Breen, au départ sceptique, s'est finalement laissé convaincre d'intégrer directement et automatiquement les contributions dans le JMdict officiel!

Ca c'est ce que j'appelle une bonne nouvelle, ta perseverance a fini par porter ses fruits ! Bravo !

natsuhiboshi
12/02/2012, 09h45
Bonjour,

Qui faut-il contacter pour participer au projet ? Ca m'intéresserait de participer (modestement, car comme bien d'autres, je n'ai pas beaucoup de temps).

Gnurou
12/02/2012, 10h52
Bonjour,


Qui faut-il contacter pour participer au projet ? Ca m'intéresserait de participer (modestement, car comme bien d'autres, je n'ai pas beaucoup de temps).

Il suffit de se créer un compte sur Transifex puis de demander à rejoindre le projet en allant sur sa page:

https://www.transifex.net/projects/p/jmdict-i18n/

Suikasensei
18/08/2013, 07h52
Hello Gnurou, je me demandais où en étais ton projet? J'ai vu le site, mais j'ai l'impression que tu n'as pas eu les ressources suffisantes?

Gnurou
18/08/2013, 10h07
Oui malheureusement plusieurs facteurs font que le project n'a pas décollé comme je l'espérais:
- Transifex qui change son interface, rendant la traduction plus difficile car les notes ne sont plus directement visibles ;
- Grosse demande du taf qui me laisse moins de temps libre ;
- Des projets à en occuper plusieurs vies, Tagaini qu'il faudrait porter aux interfaces mobiles, du coup je me disperse et rien ne se concrétise. :/

C'est dommage car il ne manque certainement pas grand-chose pour que Jim Breen puisse intégrer les traductions à son processus, mais pour le moment les données accumulées ne sont toujours pas exploitées. Les scripts sont dispos pour quiconque voudrait continuer l'effort.

C'est peut-être ça le vrai problème, que le projet n'intéresse pas tant de monde que ça. Les projets portés à bout de bras par une seule personne ne vont guère loin, et après une bonne dizaine d'années à faire ça j'en suis venu à préférer participer à des projets qui peuvent mobiliser plus de monde.

Mais si d'autres personnes décidaient de reprendre ça je serais heureux de fournir du code et des conseils.

Suikasensei
19/08/2013, 03h04
Dommage en effet, mais bien compréhensible. Hâte de voir tagaini sur mobile, je serais un utilisateur enthousiaste!!
(depuis que je suis passé à Android ;))