Page 2 sur 4 PremièrePremière 1234 DernièreDernière
Affiche les résultats de 11 à 20 sur 35

Sujet : Openjisho - le Japonais pour vous, par vous

  1. #11
    Junior Member Avatar de Azel
    Inscrit
    juin 2008
    Lieu
    Tokyo
    Messages
    29
    Merci
    3
    Remercié 0 Fois dans 0 Messages

    Par défaut

    Et puis un jour quelqu'un m'a mis sous le nez le fait que cette licence était inexploitable pour la simple raison qu'elle était incompatible, notamment, avec la GPL, la politique de Debian, etc. Autrement dit, inexploitable pour n'importe quel projet libre. La raison? La clause non-commerciale interdirait par exemple à Debian de vendre des CDs de leur distro à prix coûtant si les données y étaient inclues. Du coup nous sommes rapidement passés à une CC 3.0 Share Alike, qui propose virtuellement la même guarantie : les produits dérivés doivent être livrés sous une licence compatible, guarantissant que personne ne peut fermer les données et se les approprier, tout en laissant l'opportunité de faire des logiciels commerciaux pourvu qu'ils restent ouverts dans leurs contributions.
    En grattant un peu plus, c'est effectivement ce que j'ai cru comprendre. Voilà un point de régler! Merci.

    C'est pour cela que j'insiste sur le fait que le moteur du dictionnaire est une préoccupation totalement orthogonale à la contruction de la base de données qu'il utilisera. Attention à ne pas courir deux lièvres à la fois ; c'est très difficile de faire un bon logiciel de dictionnaire, c'est très difficile de réunir des données de qualité. Faire les deux en même temps relève du miracle.



    Là encore l'exemple du JMdict est révélateur : le dictionnaire officiel est pourri, par contre les sites alternatifs utilisant ces même données rencontrent un meilleur succès.
    On est d'accord sur ce point. J'étais plus ou moins balancé suite à vos différentes remarques et dernier post m'a convaincu
    Techniquement, le boulot n'est pas monstrueux pour effectuer cette "légère" réorientation. Il va juste falloir venir plugger les données JMDict à mon modèle de données (ie: le site tourne sous Drupal et une entrée étant un node).

    Après, il y aura sans doute quelques modifications pour internationaliser JMDict pour coller aux spécificités du français (et autres langues). Par exemple une chose que j'ai oublié sur Openjisho c'est de gérer le cas des adjectifs et noms ayant une forme masculine et féminine. Par exemple 白い → blanc, blanche. La plupart des dictionnaires ne propose que blanc. Pour un français cela ne pose pas réellement de problème mais pour un japonais il peut être intéressant d'avoir les 2 traductions. L'idéal est même de ne pas avoir 2 traductions mais qu'une traduction puisse avoir une forme masculine et féminine. Je ne pense pas que JMDict supporte ce genre de chose?

    Ta dernière proposition est à mon avis exactement ce qu'il faut faire. Tu as des entrées du JMdict, identifiées par un numéro unique. A côté tu as les phrases d'exemple de Tatoeba, identifiées par un numéro unique. Il suffit juste de connecter les deux. Pour l'API, tu n'en as même pas besoin vu que tu peux importer les données de Tatoeba dans ton projet. Ne pas aller dans cette direction, ce serait un peu comme faire reconstruire ta maison à côté de l'ancienne sous prétexte que tu as perdu les clés, parce qu'il ne t'es pas venu à l'esprit qu'il suffirait de changer la serrure.
    C'est avantage mais également un inconvénient car tu te retrouves avec un temps de latence pour récupérer les nouvelles données. (On est d'accord que ce n'est pas non plus bloquant )
    Comment opères-tu pour mettre à jour tes données sur Tagaini? Le soft récupères tous les x jours la base JMDict et l'importe?

    Jim était déjà ouvert pour intégrer les contribs de Transifex dans son JMdict - si ton projet va dans la même direction, je suis prêt à l'appuyer pour qu'il en prenne la place et t'aider dans la limite (très limitée ) de mon temps disponible. Et il semble également que d'autres membres du site soient prêts à contribuer.
    Il serait également envisageable d'utiliser ces données dans Openjisho?
    Le dictionnaire de Japonais pour vous, par vous openjisho.com

  2. #12
    Junior Member Avatar de Azel
    Inscrit
    juin 2008
    Lieu
    Tokyo
    Messages
    29
    Merci
    3
    Remercié 0 Fois dans 0 Messages

    Par défaut

    Aparté - Il manque définitivement une vraie doc. pour JMDict

  3. #13
    Member Avatar de Renaud
    Inscrit
    janvier 2007
    Lieu
    Lyon
    Messages
    86
    Merci
    3
    Remercié 1 Fois dans 1 Message

    Par défaut

    (Non, pas "définitivement" mais assurément. Grrr. À part ça, bon courage pour l'entreprise )

  4. #14
    Junior Member Avatar de Azel
    Inscrit
    juin 2008
    Lieu
    Tokyo
    Messages
    29
    Merci
    3
    Remercié 0 Fois dans 0 Messages

    Par défaut

    Citation Envoyé par Renaud Voir le message
    (Non, pas "définitivement" mais assurément. Grrr. À part ça, bon courage pour l'entreprise )
    C'est peut être l'occasion de proposer/réaliser quelque chose
    Rien qu'une version propre et claire du DTD

  5. #15
    Junior Member Avatar de Azel
    Inscrit
    juin 2008
    Lieu
    Tokyo
    Messages
    29
    Merci
    3
    Remercié 0 Fois dans 0 Messages

    Par défaut

    Par ailleurs, les entrées japonaises du JMdict fourniraient un squelette complet et cohérent, avec tous les indices sémantiques nécessaires (un dictionnaire ne se limite pas à la traduction d'une langue à une autre, il faut également connaître le genre d'un mot, de type d'un verbe, etc.), et la traduction anglaise fournirait un "guide" pour la définition française. De plus en respectant le format du JMdict (voire en y contribuant les entrées traduites), le projet assurerait que les efforts des contributeurs sont utilisés dans un maximum de sites et de logiciels. Si je veux chercher une définition, j'irai sur jisho.org plutôt qu'ailleurs - autant faire en sorte qu'une traduction française y soit également visible.
    Par contre les indices sémantiques se limitent uniquement à la version anglaise, c'est un peu dommage, il faudrait également ces informations sur les gloss... par exemple 自転車→vélo (nm) , bicyclette(nf)

  6. #16
    Senior Member Avatar de Gnurou
    Inscrit
    septembre 2004
    Lieu
    Tokyo
    Messages
    930
    Merci
    70
    Remercié 173 Fois dans 108 Messages

    Par défaut

    Citation Envoyé par Azel Voir le message
    On est d'accord sur ce point. J'étais plus ou moins balancé suite à vos différentes remarques et dernier post m'a convaincu
    Techniquement, le boulot n'est pas monstrueux pour effectuer cette "légère" réorientation. Il va juste falloir venir plugger les données JMDict à mon modèle de données (ie: le site tourne sous Drupal et une entrée étant un node).
    Et aussi t'assurer que tu puisses mettre à jour ton modèle à partir des nouvelles versions du JMdict, en prenant en compte certaines subtilités comme le fait que les sens d'une entrée sont réordonnés. C'est loin d'être trivial, mais pas impossible non plus.

    Citation Envoyé par Azel Voir le message
    Après, il y aura sans doute quelques modifications pour internationaliser JMDict pour coller aux spécificités du français (et autres langues). Par exemple une chose que j'ai oublié sur Openjisho c'est de gérer le cas des adjectifs et noms ayant une forme masculine et féminine. Par exemple 白い → blanc, blanche. La plupart des dictionnaires ne propose que blanc. Pour un français cela ne pose pas réellement de problème mais pour un japonais il peut être intéressant d'avoir les 2 traductions. L'idéal est même de ne pas avoir 2 traductions mais qu'une traduction puisse avoir une forme masculine et féminine. Je ne pense pas que JMDict supporte ce genre de chose?
    Non, mais en ayant deux gloss sur le même sens, tu auras l'effet désiré. Ce moyen est déjà employé dans le JMdict actuel.

    Citation Envoyé par Azel Voir le message
    C'est avantage mais également un inconvénient car tu te retrouves avec un temps de latence pour récupérer les nouvelles données. (On est d'accord que ce n'est pas non plus bloquant )
    Comment opères-tu pour mettre à jour tes données sur Tagaini? Le soft récupères tous les x jours la base JMDict et l'importe?
    Non, les données sont téléchargées à la compilation et restent donc fixes pour une version donnée. Ceci pour éviter les problèmes liés à d'éventuelles évolutions du format de ces dernières. Et me forcer à sortir une nouvelle version de temps en temps.

    Citation Envoyé par Azel Voir le message
    Il serait également envisageable d'utiliser ces données dans Openjisho?
    Bien entendu - soit elles seront déjà fusionnées dans le JMdict et ce sera automatique, soit ce ne sera pas le cas et je te refile le tout.

    Citation Envoyé par Azel Voir le message
    Par contre les indices sémantiques se limitent uniquement à la version anglaise, c'est un peu dommage, il faudrait également ces informations sur les gloss... par exemple 自転車→vélo (nm) , bicyclette(nf)
    Je suppose que tu voulais dire qu'ils se limitent à la version japonaise. C'est normal, vu que JMdict est un dictionnaire de japonais - les traductions n'ont pas à avoir d'indices sémantiques.

  7. #17
    Junior Member Avatar de Azel
    Inscrit
    juin 2008
    Lieu
    Tokyo
    Messages
    29
    Merci
    3
    Remercié 0 Fois dans 0 Messages

    Par défaut

    Citation Envoyé par Gnurou Voir le message
    Non, mais en ayant deux gloss sur le même sens, tu auras l'effet désiré. Ce moyen est déjà employé dans le JMdict actuel.
    Il faudra faire avec

    Citation Envoyé par Gnurou Voir le message
    Je suppose que tu voulais dire qu'ils se limitent à la version japonaise. C'est normal, vu que JMdict est un dictionnaire de japonais - les traductions n'ont pas à avoir d'indices sémantiques.
    Oui pardon. Effectivement, JMDict est un dictionnaire de japonais ça semble logique. Par contre dans ma vision d'Openjisho je voyais plutôt quelque chose qui va dans les 2 sens ; langue(s) étrangère(s)/japonais et japonais/langue(s) étrangère(s). Je me place dans la peau d'un utilisateur japonais, il est intéressant (et utile) d'avoir des indices sémantiques sur la traduction d'un mot japonais. Principalement avec le français sur le genre.


    Bon voilà une bonne base de départ. Je vais pouvoir attaquer le boulot
    J'espère pouvoir mettre en ligne une nouvelle version d'Openjisho prochainement. Si des personnes sont intéressées je peux vous rajouter au projet. Le projet est versionné sous GIT (via bitbucket).

    J'ai mis en place une petite lib PHP également qui permet de travailler avec la langue japonaise. Elle propose rien de révolutionnaire mais elle centralise des fonctionnalités utiles: https://github.com/mbilbille/jpnforphp
    Ainsi que le module permettant la lib dans Drupal : http://drupal.org/sandbox/mbilbille/1613510

  8. #18
    Senior Member Avatar de Gnurou
    Inscrit
    septembre 2004
    Lieu
    Tokyo
    Messages
    930
    Merci
    70
    Remercié 173 Fois dans 108 Messages

    Par défaut

    Citation Envoyé par Azel Voir le message
    Oui pardon. Effectivement, JMDict est un dictionnaire de japonais ça semble logique. Par contre dans ma vision d'Openjisho je voyais plutôt quelque chose qui va dans les 2 sens ; langue(s) étrangère(s)/japonais et japonais/langue(s) étrangère(s). Je me place dans la peau d'un utilisateur japonais, il est intéressant (et utile) d'avoir des indices sémantiques sur la traduction d'un mot japonais. Principalement avec le français sur le genre.
    Un dictionnaire bidirectionnel (ou dans ce cas, multi-directionnel) est quelque chose de très difficile (impossible?) à réaliser correctement. La raison est que la couverture sémantique des mots n'est pas équivalente dans les différentes langues. Un exemple avec 許す: c'est un mot en japonais, mais en français il prendra deux concepts: autoriser et pardonner. De la même manière un mot français peut couvrir (complètement ou partiellement) plusieurs concepts en japonais. C'est pour cela que les dictionnaires sont uni-directionnels et que l'utilisateur du JMdict n'est pas un japonais qui cherche à apprendre l'anglais ou le français, mais bien l'étudiant ou l'académique non-japonisant. Se mettre dans la peau d'un utilisateur japonais est ici hors-sujet.

    Citation Envoyé par Azel Voir le message
    Bon voilà une bonne base de départ. Je vais pouvoir attaquer le boulot
    J'espère pouvoir mettre en ligne une nouvelle version d'Openjisho prochainement. Si des personnes sont intéressées je peux vous rajouter au projet. Le projet est versionné sous GIT (via bitbucket).
    Git, cool! Tu comptes tout gérer en PHP ou passer par des languages plus adaptés au traitement de données (genre Python) pour la partie non-web?

  9. #19
    Junior Member Avatar de Azel
    Inscrit
    juin 2008
    Lieu
    Tokyo
    Messages
    29
    Merci
    3
    Remercié 0 Fois dans 0 Messages

    Par défaut

    Citation Envoyé par Gnurou Voir le message
    Un dictionnaire bidirectionnel (ou dans ce cas, multi-directionnel) est quelque chose de très difficile (impossible?) à réaliser correctement. La raison est que la couverture sémantique des mots n'est pas équivalente dans les différentes langues. Un exemple avec 許す: c'est un mot en japonais, mais en français il prendra deux concepts: autoriser et pardonner. De la même manière un mot français peut couvrir (complètement ou partiellement) plusieurs concepts en japonais. C'est pour cela que les dictionnaires sont uni-directionnels et que l'utilisateur du JMdict n'est pas un japonais qui cherche à apprendre l'anglais ou le français, mais bien l'étudiant ou l'académique non-japonisant. Se mettre dans la peau d'un utilisateur japonais est ici hors-sujet.
    Peut-être pas pousser le multi-directionnel à 100% mais au minimum proposer le même niveau de détails que sur la version actuelle d'Openjisho: http://www.openjisho.com/en/jidensha/7 (pour rester dans le vélo )


    Citation Envoyé par Gnurou Voir le message
    Git, cool! Tu comptes tout gérer en PHP ou passer par des languages plus adaptés au traitement de données (genre Python) pour la partie non-web?
    Le PHP n'est surement pas le language le plus adapté pour ce genre de traitement mais le site (front et back) repose sur Drupal, donc il me paraît plus simple de partir sur du 100% PHP pour profiter de toutes l'API Drupal.
    Le traitement des données n'est pas non plus monstrueux. Il faut juste attaquer le fichier proprement car il est assez lourd

  10. #20
    Member
    Inscrit
    novembre 2011
    Messages
    30
    Merci
    4
    Remercié 6 Fois dans 6 Messages

    Par défaut

    Citation Envoyé par Gnurou Voir le message
    Un dictionnaire bidirectionnel (ou dans ce cas, multi-directionnel) est quelque chose de très difficile (impossible?) à réaliser correctement. La raison est que la couverture sémantique des mots n'est pas équivalente dans les différentes langues. Un exemple avec 許す: c'est un mot en japonais, mais en français il prendra deux concepts: autoriser et pardonner. De la même manière un mot français peut couvrir (complètement ou partiellement) plusieurs concepts en japonais. C'est pour cela que les dictionnaires sont uni-directionnels et que l'utilisateur du JMdict n'est pas un japonais qui cherche à apprendre l'anglais ou le français, mais bien l'étudiant ou l'académique non-japonisant. Se mettre dans la peau d'un utilisateur japonais est ici hors-sujet.
    +1000 !

    L'écueil le plus important de ce type de projet est l'excès d'ambition (on l'a tous). Un (bon) dictionnaire multi-directionnel est très difficile à réaliser et probablement impossible si on mixe plus de deux langues.

    @Azel
    je n'ai pas consulté le blog pendant qq jours mais je note que Gnurou t'a apporté les bons conseils, notamment pour la licence (je suis toujours surpris par cette obsession pour le non-commercial. Que serait devenu Linux si Torvald avait eu la même approche ?...).

    @Gnurou
    Je n'ai pas ton expérience concernant JMDict et tu as raison, mon aversion (un peu malsaine, hein, parce que je continue à l'utiliser) au JMDict vient probablement de la mauvaise utilisation qu'en font les différents logiciels qui y ont recours (tous ?).
    Mon reproche principal vient de la volonté sous-jacente des contributeurs à en faire un outil exhaustif alors que beaucoup d'entrées ne trouvent leur sens qu'à la lecture d'un exemple. Et pour la nuance entre différents termes, il faut repasser.
    Le moyen que j'ai trouvé de rendre cet outil utilisable est le recours à des listes (mais encore faut-il les constituer). Car, ce n'est pas simplement un problème de mots/écritures obsolètes que celui de mots réellement utilisés par des natifs. Faites le test auprès de vos amis japonais. Je ne fréquente pas que des linguistes !
    Repartir du JMDict présente l'avantage de pouvoir construire beaucoup plus rapidement une base conséquente en français car on peut alors s'appuyer sur des japonisants débutants qui parlent anglais (voire même pas japonisant du tout !). Cela dit, Transifex reste un peu rigide (obligation d'avoir des parenthèses en français quand elles existent dans la version anglaise, interdiction d'en créer sinon) alors que la plupart des mots ne peuvent se contenter d'une traduction directe. mais je te suis reconnaissant de l'initiative.


    Enfin, même si cela dépasse le cadre de ce post (car on est quand même partis sur l'idée d'un dictionnaire), je reste convaincu que le recours à des phrases exemples reste le meilleur moyen d'acquérir une langue. C'est pourquoi je suis beaucoup plus impressionné par un projet comme Tatoeba que par le JMDict et les 15 années de contribution d'universitaires. Je reconnais toutefois que c'est un peu cracher dans la soupe .

sujet d'information

Utilisateur(s) parcourant ce sujet

il y a actuellement 1 utilisateur(s) parcourant ce sujet. (0 membres et 1 visiteurs)

Sujets similaires

  1. Téléphone Vous allez vivre au Japon, et vous avez un iphone ?
    Par Marc desu dans le forum Japon - Questions générales
    Réponses: 18
    Dernier message: 29/09/2012, 14h09
  2. Divers un endroit ou vous vous sentez comme chez vous
    Par Tokyoko dans le forum Japon - Questions générales
    Réponses: 10
    Dernier message: 10/09/2008, 16h18
  3. Divers Et vous, vous préparez quoi pour le dîner du 31 décembre ?
    Par Heiho dans le forum Cuisine - Restaurants
    Réponses: 5
    Dernier message: 01/01/2008, 15h56
  4. Conseil Pourriez vous m'aider messieurs s'il vous plait ? :oops:
    Par emilie_jolie dans le forum Katana et Autres questions
    Réponses: 9
    Dernier message: 30/11/2004, 12h48
  5. Livres Quel livre pour apprendre le japonais selon vous ?
    Par ashmad dans le forum Livres, dictionnaires et méthodes
    Réponses: 11
    Dernier message: 10/11/2004, 16h02

Règles des messages

  • Vous ne pouvez pas créer de sujets
  • Vous ne pouvez pas répondre aux sujets
  • Vous ne pouvez pas importer de fichiers joints
  • Vous ne pouvez pas modifier vos messages
  •  
  • Les BB codes sont Activés
  • Les Smileys sont Activés
  • Le BB code [IMG] est Activé
  • Le code [VIDEO] est Activé
  • Le code HTML est Désactivé