Gnurou
19/11/2011, 13h50
Bonjour à tous!
La plupart d'entre vous connaissent sans doute JMdict et kanjidic2, le dictionnaire libre japonais/anglais créé par Jim Breen et son équivalent pour les kanji. Si vous ne les connaissez pas, nul doute que vous les ayez déjà utilisés: ces données sont utilisées par pratiquement tous les logiciels de japonais gratuits ainsi que la plupart des dictionnaires en ligne (jisho.org, JWPCE, Tagaini, etc).
Le plus gros reproche contre ces excellentes resources de la part des utilisateurs non-anglophones est le manque de couverture des langues autres que l'anglais. En français, seuls les jouyou kanji ont une traduction (grâce à l'excellent travail d'Alain Thierion), et le JMdict n'est traduit qu'à 10%. Et encore, beaucoup de ces traductions ont été importées automatiquement à partir d'autres sources, et n'ont pas été mises à jour bien que la version anglaise ait évolué, faute d'une infrastructure centralisée. Pour les autres langues, c'est encore pire, la plupart n'étant même pas prises en charge.
Conséquence directe et facheuse: cela fait environ 3 ans que je casse les pieds de Jim pour lui demander quand pourra-t-on enfin soumettre des traductions pour le JMdict facilement et assurer leur suivi. C'est quelque chose de difficile à faire pour la petite équipe du JMdict et je le comprend. Du coup, la meilleure chose à faire semble être d'externaliser l'effort.
Il y a quelques mois, Akeru m'avait suggéré d'utiliser Transifex pour faciliter la traduction de l'interface de Tagaini. Transifex est un site sur lequel des développeurs de logiciels peuvent soumettre les chaînes de caractères utilisées dans leur logiciel en Anglais pour se les faire traduire dans d'autres langues par des contributeurs. C'est génial et ça marche: en deux semaines, Tagaini a gagné 4 nouvelles traductions et le suivi est bien plus simple à faire.
Du coup j'ai pensé, si ça marche si bien pour les logiciels, pourquoi pas avec autre chose? J'ai donc fait quelques tests ces dernières semaines afin de vérifier s'il était possible d'extraire les données en anglais de JMdict/Kanjidic, les faire traduire sur Transifex qui offre une interface impeccable pour ce genre de travail, et ré-insérer les nouvelles traductions dans les fichiers d'origine. Ben les amis, ça marche super, et je suis heureux de vous présenter un nouvel effort d'internationalisation du travail de Jim Breen dans toutes les langues que vous pouvez parler:
https://www.transifex.net/projects/p/jmdict-i18n/
Toute personne ayant un compte sur Transifex peut joindre l'une des équipes de traduction (ou demander la création d'une nouvelle pour une langue pas encore supportée) et contribuer à l'avancement du projet. Le résultat sera éventuellement intégré dans les fichiers officiels et ainsi utilisés dans tous les projets concernés par le JMdict (c'est-à-dire beaucoup). Bien entendu, un minimum de maîtrise de l'anglais et de sa langue natale (ainsi que, autant que possible, du japonais) est demandée. Si vous venez du monde du fansub, réfléchissez donc bien avant de vous lancer. ;)
La traduction est très simple en pratique, pour chaque définition se trouvent à gauche le mot d'origine en japonais, ses prononciations, et ses traductions en anglais (une par ligne). A droite, un emplacement pour taper la traduction dans une autre langue:2630Une tape sur la touche "tab" du clavier permet de passer à la définition suivante et ainsi de faire des traductions au kilomètre. Les traductions sont automatiquement enregistrées et seront disponibles dans la prochaine version du fichier.
L'état de la traduction française est visible sur la page suivante:
https://www.transifex.net/projects/p/jmdict-i18n/team/fr/
Le JMdict n'est pas encore extrait dans son intégralité, mais il y a déjà de quoi manger. Je suis en train de décider des règles pour extraire les autres entrées dans des groupes cohérents.
Quoi qu'il en soit, le projet est ouvert et j'espère bien faire remonter les premières données à Jim rapidement. Alors rejoignez-nous, faites passer le mot, et ensemble offrons enfin un dictionnaire japonais/français complet et libre!
La plupart d'entre vous connaissent sans doute JMdict et kanjidic2, le dictionnaire libre japonais/anglais créé par Jim Breen et son équivalent pour les kanji. Si vous ne les connaissez pas, nul doute que vous les ayez déjà utilisés: ces données sont utilisées par pratiquement tous les logiciels de japonais gratuits ainsi que la plupart des dictionnaires en ligne (jisho.org, JWPCE, Tagaini, etc).
Le plus gros reproche contre ces excellentes resources de la part des utilisateurs non-anglophones est le manque de couverture des langues autres que l'anglais. En français, seuls les jouyou kanji ont une traduction (grâce à l'excellent travail d'Alain Thierion), et le JMdict n'est traduit qu'à 10%. Et encore, beaucoup de ces traductions ont été importées automatiquement à partir d'autres sources, et n'ont pas été mises à jour bien que la version anglaise ait évolué, faute d'une infrastructure centralisée. Pour les autres langues, c'est encore pire, la plupart n'étant même pas prises en charge.
Conséquence directe et facheuse: cela fait environ 3 ans que je casse les pieds de Jim pour lui demander quand pourra-t-on enfin soumettre des traductions pour le JMdict facilement et assurer leur suivi. C'est quelque chose de difficile à faire pour la petite équipe du JMdict et je le comprend. Du coup, la meilleure chose à faire semble être d'externaliser l'effort.
Il y a quelques mois, Akeru m'avait suggéré d'utiliser Transifex pour faciliter la traduction de l'interface de Tagaini. Transifex est un site sur lequel des développeurs de logiciels peuvent soumettre les chaînes de caractères utilisées dans leur logiciel en Anglais pour se les faire traduire dans d'autres langues par des contributeurs. C'est génial et ça marche: en deux semaines, Tagaini a gagné 4 nouvelles traductions et le suivi est bien plus simple à faire.
Du coup j'ai pensé, si ça marche si bien pour les logiciels, pourquoi pas avec autre chose? J'ai donc fait quelques tests ces dernières semaines afin de vérifier s'il était possible d'extraire les données en anglais de JMdict/Kanjidic, les faire traduire sur Transifex qui offre une interface impeccable pour ce genre de travail, et ré-insérer les nouvelles traductions dans les fichiers d'origine. Ben les amis, ça marche super, et je suis heureux de vous présenter un nouvel effort d'internationalisation du travail de Jim Breen dans toutes les langues que vous pouvez parler:
https://www.transifex.net/projects/p/jmdict-i18n/
Toute personne ayant un compte sur Transifex peut joindre l'une des équipes de traduction (ou demander la création d'une nouvelle pour une langue pas encore supportée) et contribuer à l'avancement du projet. Le résultat sera éventuellement intégré dans les fichiers officiels et ainsi utilisés dans tous les projets concernés par le JMdict (c'est-à-dire beaucoup). Bien entendu, un minimum de maîtrise de l'anglais et de sa langue natale (ainsi que, autant que possible, du japonais) est demandée. Si vous venez du monde du fansub, réfléchissez donc bien avant de vous lancer. ;)
La traduction est très simple en pratique, pour chaque définition se trouvent à gauche le mot d'origine en japonais, ses prononciations, et ses traductions en anglais (une par ligne). A droite, un emplacement pour taper la traduction dans une autre langue:2630Une tape sur la touche "tab" du clavier permet de passer à la définition suivante et ainsi de faire des traductions au kilomètre. Les traductions sont automatiquement enregistrées et seront disponibles dans la prochaine version du fichier.
L'état de la traduction française est visible sur la page suivante:
https://www.transifex.net/projects/p/jmdict-i18n/team/fr/
Le JMdict n'est pas encore extrait dans son intégralité, mais il y a déjà de quoi manger. Je suis en train de décider des règles pour extraire les autres entrées dans des groupes cohérents.
Quoi qu'il en soit, le projet est ouvert et j'espère bien faire remonter les premières données à Jim rapidement. Alors rejoignez-nous, faites passer le mot, et ensemble offrons enfin un dictionnaire japonais/français complet et libre!