PDA

Afficher la version complète : Fonctionnement de google japonais ?



Danodare
22/07/2004, 11h51
Bonjour,

je cherchais a verifier l'ordre des traits du 薔 de 薔薇 (bara = rose) quand je suis tombe sur un phenomene etrange.

En cherchant 薔薇 筆順 sur google.com, je trouve 68 reponses.

En cherchant simplement 薔 筆順, je ne trouve que 26 reponses.

Etant donne qu'il n'y a pas d'espaces en japonais, comment est-ce que Google se debrouille pour donner moins de reponses avec une recherche plus large ?

Informations annexes:
- 筆順 veut dire "ordre des traits".
- j'ai cherche dans l'autre sens aussi 筆順 薔薇 et 筆順 薔, avec le meme resultat.
- j'ai cherche sur google en japonais
http://www.google.com/intl/ja
le resultat est encore plus flagrant, je trouve respectivement 45 et 6 reponses.

Questions annexes:
- si quelqu'un connait l'ordre des traits de 薔, je suis preneur. Je voulais verifier car 座 s'ecrit dans un ordre contraire a l'intuition.
- y a-t-il un meilleur moteur de recherche que Google pour les sites japonais ou plus generalement les sites ecrits en caracteres chinois ?

Merci d'avance,
-Danodare

LHommeBoulet
22/07/2004, 13h30
tres surprenant en effet!
j'ai pas d'explications a donner, mais en regardant, quand on cherche 薔+薇 sur les pages, on trouve seulement "薔薇" pas les 2 kanjis separés ... peut etre que c'est un debut de reponse pour une explication...? parce que "筆+順" => 206.000 et "筆順" ->23.500

sinon, je crois que le site reference en japonais c'est goo (http://www.goo.ne.jp/) (notament les dictionnaires, mais le fait qu'il y ait des kanjis de partout me fait peur :cry: )

donc en cherchant

je suis tombé sur
classé par année, en flash (http://www.a-chi.jp/htj_4.html) jusqu'à la 5m année apparment
par nombre de traits (http://www.inv.co.jp/~yoshio/DW/Hitsujun/Hitsujun.htm) jusqu'à 15 malheureusement

donc pour l'instant pas d'ordre des traits, mais des que j'ai des nouvelles, je fais signe ^^

Danodare
22/07/2004, 14h13
Oui j'aurais pu faire beaucoup plus simple dans mon premier post.

Le noeud du probleme est que chercher 薔薇 donne beaucoup plus de reponses que 薔.

Google ou bien Goo ont ce comportement. Pour Goo, 213 000 reponses contre 4200.

-Danodare

Yukumizu
22/07/2004, 16h34
C’est normal, parce qu’avec deux kanji tu as des pages comprenant les deux kanji, même s’ils ne se suivent pas. Par exemple on peut les trouver dans des noms de famille.

L’ordre des traits pour l’élément central, c’est : croix + les deux éléments symétriques + trait horizontal.

erwan
22/07/2004, 17h19
Ce n'est qu'une supposition, mais peut etre que Google utilise un algo d'analyse grammatical pour separer les mots (et palier ainsi au fait qu'il n'y aie pas d'espaces en japonais).

Pour info, la recherche en texte integral se fait avec des guillemets (utile pour chercher "to be or not to be", qui ne renvoie pas grand chose si on separe les mots).

Danodare
22/07/2004, 17h38
Merci Yukumizu pour l'ordre des traits.


C’est normal, parce qu’avec deux kanji tu as des pages comprenant les deux kanji, même s’ils ne se suivent pas.

Justement non, le nombre de pages contenant les deux kanji est inferieur ou egal au nombre de pages contenant un seul des deux... purement par la logique. Mais Google / Goo / Infoseek en trouve beaucoup moins.


Ce n'est qu'une supposition, mais peut etre que Google utilise un algo d'analyse grammatical pour separer les mots (et palier ainsi au fait qu'il n'y aie pas d'espaces en japonais).

Ca pourrait etre une explication... si c'est le cas, Google est vraiment fort, pour faire la difference entre chinois et japonais, pour separer les mots entre eux... Chapeau !

Rajouter des guillements ne change rien. "薔" donne les memes resultats.

Le probleme se resume a trouver un moteur de recherche qui donnerait toutes les pages contenant un kanji donne. Je concois que ca ne servirait probablement pas beaucoup aux japonais eux-memes, mais ca serait tres pratique pour les gaijin qui ne connaissent qu'une partie d'un mot.

JM
22/07/2004, 20h10
Désolé mais pour l'ordre des traits, ce n'est pas ça...


L’ordre des traits pour l’élément central, c’est : croix + les deux éléments symétriques + trait horizontal.

Voici l'animation pour ce kanji:
http://www.gahoh.com (http://www.gahoh.com/movie/kanji/10kaku/za3A42.html)

Et je viens de le vérifier dans un livre de calligraphie.

Yukumizu
22/07/2004, 21h20
Tu t’es trompé de kanji JM, il ne s’agissait pas de 座 mais de 薔.

薔 s'écrit donc : herbe + croix + les deux éléments symétriques + trait horizontal + tourner (dans sa version moderne).

JM
22/07/2004, 21h52
Ah oui en effet.
Merci de les avoir écrit plus gros :) J'utilise en effet généralement une loupe pour les lire à l'écran et j'ai dirigé ma loupe vers le mauvais kanji.
C'est pas beau de vieillir hein :lol:

Yukumizu
22/07/2004, 23h29
Moi aussi j’ai du mal à les lire quand ils sont tout petits comme cela. En général je les copie sur Word pour pouvoir les agrandir. Pour 薔薇, à moins de connaître déjà les kanji, je trouve que c’est illisible, y compris sur mon dictionnaire papier (Taishukan) où même avec une loupe je n’arrive à déchiffrer le deuxième kanji. Sur le Casio il y la fonction zoom qui est très utile.

mimosas
23/07/2004, 00h37
Enfin, il me semble que les japonais ecriront plus souvent バラ (en katakana) ou même ばら (en hiragana) que 薔薇.
Ca simplifie les choses, et essayez donc de faire une recherche pour voir.

Yukumizu
23/07/2004, 01h03
Oui, tu as tout à fait raison, il faut savoir le lire, ou le reconnaître, au cas où, mais ce n'est vraiment pas utile de savoir écrire バラ en kanji.

Danodare
23/07/2004, 08h19
il me semble que les japonais ecriront plus souvent バラ (en katakana) ou même ばら (en hiragana) que 薔薇.
Vous pourriez penser que mes references sont tres litteraires voire meme archaique, mais ce n'est pas le cas.

Ce qui m'a conduit a m'interesser a 薔薇, c'est que ces deux kanji apparaissent dans le deuxieme episode du dessin anime "マリア様が見てる-春". Pas exactement litteraire il me semble :).

Ca n'a rien a voir, mais j'en profite pour mentionner autre chose. Tire du meme dessin anime,

雫が溜まる - shizuku ga tamaru - les gouttes d'eau s'accumulent.

En cherchant dans mes dictionnaires, je me suis rendu compte que ni l'un ni l'autre des deux kanji ne faisait partie des 2000 officiels. Ceci dit, il y avait des kanji de prononciations et de sens plus ou moins equivalent dans les 2000 officiels, a savoir

滴が貯まる - shizuku ga tamaru - les gouttes d'eau s'accumulent.

Ce qui m'a frappe, c'est que ceux du dessin anime utilisent des graphemes lies a la pluie, a l'agriculture... alors que les kanji officiels sont lies au commerce, a l'argent... C'est curieux les choix qui ont ete faits par le ministere de l'education japonais :).

Sur cette note poetique,
-Danodare

mimosas
23/07/2004, 09h00
Merci pour cette précision Danodare.
Et oui, on peut donc faire passer des nuances simplement dans le choix des kanjis utilisés ...
Ca ne facilite pas la tache hein :?

Yukumizu
23/07/2004, 10h24
Il y a une chaîne d’Izakaya qui s’appelle 月の雫.
Moi je dirais plutôt que les kanji faisant référence à la nature, ayant un sens poétique, sont très présents dans la vie des Japonais, mais ne sont pas forcément nécessaires pour lire un journal (la liste des 1945 s’applique notamment à eux).

Pour バラ je ne pense pas que beaucoup de Japonais sachent l’écrire en kanji, mais beaucoup doivent savoir le lire.

Il ne faut pas oublier que le bagage en kanji d’un Japonais moyen, ce n’est pas 2000 kanji, mais 3 à 4000.