Comment saisir du japonais avec GNU/Linux
Ressources sur le Japonais sur GNU/Linux
Création : lundi 16 juin 2003
Mises à jour au fur et à mesure que j'apprends sur le sujet (et que j'en ai le temps ^^; )
Liens
http://fr.wikibooks.org/wiki/Lire_et_écrire_le_japonais_sous_Debian
http://rschultz.ath.cx/files/HOWTO-UIM-QtGTK.html
Super :
http://www.jw-stumpel.nl/input.html (
http://www.jw-stumpel.nl/stestu.html)
http://www.h4.dion.ne.jp/~apricots/mandrake/miniguide.html
http://im-ja.sourceforge.net/,
http://im-ja.sourceforge.net/im-ja-doc.html
http://www.thbz.org/japonais/japonais-linux.html
http://www.loisant.org/weblog/index.php?2004/04/20/30-saisie-multilingue-japonais-francais-sous-gnulinux
http://linuxfr.org/comments/219445.html (dans les
commentaires)
http://linuxfr.org/~jadatux/3265.html
http://www.linuxfrench.net/linux_au_japon_article747.html (part 2 :
http://www.linuxfrench.net/linux_au_japon_article767.html)
http://www.aa.tufs.ac.jp/~jwb/wwwjdicinf.html#browser_tag
Logiciels :
Kanjipad :
http://www.gtk.org/~otaylor/kanjipad/ (apt-get install kanjipad)
Gjiten :
http://gjiten.sourceforge.net/ (cat "deb
http://gjiten.sourceforge.net/ ./" >> /etc/apt/sources.list && apt-get install gjiten)
LUG japonais :
Tokyo :
http://www.tlug.gr.jp/
Japan :
http://jla.linux.or.jp/
Distributions :
http://www.turbolinux.com/
Divers :
http://linux.ascii24.com/
Avant propos
Ce texte est surtout un mémo pour m'aider à me rappeler comment j'ai fait. Il se peut qu'il ne soit pas du tout didactique. Si c'est le cas n'hésitez pas à me demander des éclaircissements, je fairais de mon mieux pour y répondre.
Je vais parler de Debian GNU/Linux, mais c'est probablement identique à peu de choses prés sur d'autres distributions.
Il ne semble malheureusement pas y avoir de solution globale : il faut utiliser des logiciels précis, compatibles avec la saisie de caractères japonais, pour chaques tâches précises. Toujours pareil : si vous connaissez de meilleures solutions, partagez-les svp.
Je me suis basé sur l'excellente, bien qu'un peu dépassée, page de Craig Toshio Oda :
http://www.tlug.jp/craigoda/writings/linux-nihongo/
Cependant je suis loin d'avoir compris tous les méandres de ce sujet. Si vous voyez de vilaines erreurs, étourderies ou quelconques bourdes, ou si vous avez de meilleur solutions à proposer, soyez assez aimable de me les faire remarquer, que tout le monde en profite :-)
Pré-requis
Avant tout, il faut installer :
- des polices (fonts). Elles le sont déjà probablement, vérifions :
[moku@navi:~]$ xlsfonts | grep jis
-jis-fixed-medium-r-normal--0-0-75-75-c-0-jisx0208.1983-0
-jis-fixed-medium-r-normal--16-110-100-100-c-160-jisx0208.1983-0
-jis-fixed-medium-r-normal--16-150-75-75-c-160-jisx0208.1983-0
-jis-fixed-medium-r-normal--24-170-100-100-c-240-jisx0208.1983-0
-jis-fixed-medium-r-normal--24-230-75-75-c-240-jisx0208.1983-0
-misc-fixed-medium-r-normal--0-0-75-75-c-0-jisx0201.1976-0
-misc-fixed-medium-r-normal--0-0-75-75-c-0-jisx0208.1983-0
-misc-fixed-medium-r-normal--14-130-75-75-c-140-jisx0208.1983-0
-misc-fixed-medium-r-normal--14-130-75-75-c-70-jisx0201.1976-0
-sony-fixed-medium-r-normal--0-0-100-100-c-0-jisx0201.1976-0
-sony-fixed-medium-r-normal--16-120-100-100-c-80-jisx0201.1976-0
-sony-fixed-medium-r-normal--16-150-75-75-c-80-jisx0201.1976-0
-sony-fixed-medium-r-normal--24-170-100-100-c-120-jisx0201.1976-0
-sony-fixed-medium-r-normal--24-230-75-75-c-120-jisx0201.1976-0
Et voici la liste des polices installés chez moi. Ce qui me permet d'afficher tous les caractères du
test de WikiPédia (sauf 12 caractères du système polytonique Grec)
(les -naga10 ne sont pas libres, donc sont dans la branche
non-free de Debian)
[moku@yuki:~]$ dpkg -l ttf-*
ii ttf-arphic-bkai00mp 2.10-6 "AR PL KaitiM Big5" Chinese TrueType font by Arphic Technology
ii ttf-arphic-bsmi00lp 2.10-6 "AR PL Mingti2L Big5" Chinese TrueType font by Arphic Technology
ii ttf-arphic-gbsn00lp 2.11-6 "AR PL SungtiL GB" Chinese TrueType font by Arphic Technology
ii ttf-arphic-gkai00mp 2.11-6 "AR PL KaitiM GB" Chinese TrueType font by Arphic Technology
ii ttf-baekmuk 2.2-1 Baekmuk series TrueType fonts
ii ttf-bitstream-vera 1.10-3 The Bitstream Vera family of free TrueType fonts
ii ttf-freefont 20031008-1.1 Freefont Serif, Sans and Mono Truetype fonts
rc ttf-kochi-gothic 1.0.20030809-3 Kochi Subst Gothic Japanese TrueType font without naga10
ii ttf-kochi-gothic-naga10 1.0.20030809-3 Kochi Subst Gothic Japanese TrueType font with naga10 (non-free)
rc ttf-kochi-mincho 1.0.20030809-3 Kochi Subst Mincho Japanese TrueType font without naga10
ii ttf-kochi-mincho-naga10 1.0.20030809-3 Kochi Subst Mincho Japanese TrueType font with naga10 (non-free)
ii ttf-opensymbol 1.1.2dfsg1-3 The OpenSymbol TrueType font
ii ttf-sazanami-gothic 0.0.1.20040629-2 Sazanami Gothic Japanese TrueType font
ii ttf-sazanami-mincho 0.0.1.20040629-2 Sazanami Mincho Japanese TrueType font
ii ttf-thryomanes 1.1-1 A Unicode font covering Latin, Greek, Cyrillic and IPA
- Kterm (le « K » de Kanji)
Est un émulateur de console sous X qui sait afficher des caractères japonais (entre autres).
Mais il ne fonctionne pas seul : il lui faut un serveur de conversion romaji -> kana. On utilisera canna.
*
Est le Front End Processor. L'interface de communication entre les logiciels et le serveur de conversion (canna).
Est le serveur de conversion romaji -> kana (et kanji).
En pratique
Pour utiliser
Kinput2?, ajouter à son
~/.bashrc
# Saisir du japonais
# http://www.tlug.jp/craigoda/writings/linux-nihongo/node24.html
export XMODIFIERS="@im=kinput2"
*inputMethod: kinput2
et à son
~/.xsession
# Lancer kinput2 à chaque session en lui précisant de
# se connecter au serveur canna.
/usr/bin/X11/kinput2 -canna &
# mapper la touche "drapeau Windows" de droite (sur mon
# clavier) comme étant la touche "Kanji".
# Vous pouvez choisir la touche que vous voulez (utilisez
# alors `xev` pour connaitre le code de votre touche, chez
# moi c'est 116)
/usr/bin/X11/xmodmap -e 'keycode 116 = Kanji' &
Si tout va bien, et aprés que les services canna-server et kinput2 soient lancés, on devrait pouvoir saisir du japonais dans kterm.
Pour vérifier que les services sont bien démarrés :
[moku@navi:~]$ ps aux|grep canna
canna 226 0.0 0.4 2068 1124 ? S 05:23 0:00 /usr/sbin/cannaserver -u canna
moku 593 0.0 0.8 3840 2144 ? S 05:26 0:00 /usr/bin/X11/kinput2 -canna
Si cannaserver n'est pas lancé, un coup de `/etc/init.d/canna start` fera l'affaire et vérifiez par cannastat (paquet Debian
canna-utils) :
[moku@navi:~]$ cannastat
Connected to unix
Canna Server (Ver. 3.7)
No clients
Si kinput2 n'est pas lancé, `/usr/bin/X11/kinput2 -canna &`.
Voilà maintenant, plus qu'à lancer kterm et faire
Maj+Espace ou
Ctrl+Kanji pour saisir en romaji de l'hiragana.
Le
[ あ ] en dessous de la ligne de commande est la preuve que l'on est en mode de saisie kinput2 et que les caractères que l'on tape vont être interprétés comme des hiragana.
*
Si l'on veut des katakana ou des kanji, il faut presser sur le touche
espace, ce qui donne :
*
Mon log d'installations :
apt-get install im-ja-all im-ja-applet
apt-get install kanjipad
apt-get install gjiten
apt-get install gjiten ttf-sazanami-mincho
apt-get install lookup xjdic sdic-edict enamdict x-ttcidfont-conf
apt-get install lookup xjdic enamdict x-ttcidfont-conf
apt-get install manpages-fr
apt-get install ttf-arphic-bkai00mp ttf-arphic-bsmi00lp ttf-arphic-gbsn00lp ttf-arphic-gkai00mp
apt-get install xfonts-efont-unicode xfonts-efont-unicode-ib
Logiciels
Vim : Édition de texte
Vim dans un kterm peut saisir du japonais via kinput2 sans aucun problème.
Il existe aussi un JVim (Japanese Vim) qui peut, semble-t-il, se passer de kinput2 (2004-08-15 : ça ne marche pas chez moi en tout cas) et communique directement avec le serveur canna. Mais il est bien trop en retard sur les innombrables fonctionnalitées de Vim pour que je puisse l'utiliser. Et puis, il n'y en a pas besoin tant que kterm + kinput2 (+ canna) + vim tourne à merveille !
Sauf que je ne peux pas afficher, ni saisir, de lettre accentuées ! A priori je ne sais pas comment faire pour avoir mes lettres bien française et les kana et kanji. Si vous trouvez, n'hésitez pas à nous en faire part. Merci :-)
J'imagine qu'il faut fouiller du coté d'Unicode et d'UTF...
Mutt : Mails
Saisir du japonais avec Mutt (et kterm) :
http://home.nyc.rr.com/computertaijutsu/jpninpt.html
La saisie de japonais lors de la rédaction des mails se faisant dans l'éditeur texte de son choix, le problème ne se pose pas puisque j'utilise Vim. Il faut par contre évidemment lancer Mutt dans un kterm, ce qui veut dire se passer des caractère accentués autant à la saisie (on peut s'y faire) qu'à l'affichage (beaucoup plus génant à mon avis).
*
En ce qui concerne l'affichage du japonais, pas de problème pour lire un mail ou tant que l'on s'envoie un email à soi-même... dés que l'on souhaite envoyer un mail en japonais sur le grand réseau, on doit faire face aux problèmes de formats différents. C'est un peu le bordel...
UPDATE 06/10/2003 :
http://irg.cs.ohiou.edu/~eblanton/i18n/jpmutt.html
Ça marche, et c'est finalement assez simple pour l'affichage pour peu que l'encodage du mail soit bien quelque chose comme
Content-Type: text/plain; charset="ISO-2022-JP" :
Ajouter à
~/.muttrc
Puis définir un moyen d'afficher le text/plain.
Ajouter à votre
~/.mailcap ou à
/etc/mailcap
text/plain; iconv -f iso-2022-jp -t euc-jp; test=charset=%{charset} && test x`echo \"$charset\" | tr a-z A-Z` = xISO-2022-JP; copiousoutput
text/plain; cat; copiousoutput
And voilà.
Mozilla : Web
(voir
Galeon, plus bas)
Ben là ce que j'ai trouvé comme solution pour pouvoir saisir du japonais est un peu galère.
Pour l'affichage de pages en japonais, Mozilla le gère trés bien (sauf dans la barre de titre, mais n'est-ce pas plutôt lié au Window Manager ? C'est
WindowMaker? en l'occurence.)
Bref, pour la saisie :
http://www.mozilla.org/quality/intl/kinput2/kinput2-inst.html et surtout :
http://www.csse.monash.edu.au/~jwb/mozillaime.html
Il y aurait besoin que l'on installe en plus le server jserver (apt-get install freewnn-jserver et c'est réglé).
[moku@navi:~]$ ps axu|grep jserver
wnn 230 0.0 1.6 5620 4072 ? S 05:23 0:00 /usr/bin/Wnn4/jserver
Et aussi que le kinput2 utilise le protocole XIM :
kinput2 -canna -xim
Il faut ensuite redéfinir carrément la locale. C'est à dire dire à sa machine que l'on veut un système en japonais. Moi je l'aimais bien quand il me parlait en français...
[moku@navi:~]$ locale
LANG=fr_FR.ISO-8859-1
[...]
[moku@navi:~]$ export LANG=ja_JP
[moku@navi:~]$ locale
LANG=ja_JP
[...]
Ensuite, il faut relancer mozilla (donc fermer toutes les instances, ou killall mozilla-bin) pour qu'il prenne en compte ce changement de locale.
C'est con parceque maintenant, tous les messages système seront en japonais...
locale_ja-message_systeme.png
?
Et encore, c'est parceque c'est dans un kterm. Mais dans un xterm, c'est pire ! (du charabiat) ^_^;
Galeon : Web
UPDATE : 20/03/2004
Merci à
Emmanuel Hainry <e.hainry(AT)operamail.com>
Son mail :
Bonjour,
Tout d'abord merci pour les explications sur kinput2, je ne savais pas
l'utiliser et donc ne pouvais pas ecrire en japonais avec vim et mutt.
Ensuite, pour ecrire en japonais dans le browser, il y a un moyen plus propre
(et sans toucher aux locales) : utiliser les outils gtk. J'utilise Galeon
comme butineur, mais ca marche aussi avec epiphany. J'ai installe les paquets
uim uim-common uim-gtk2.0 anthy anthy-cannadic libanthy0 qui font (c'est
surtout uim-gtk2.0 qui le fait) que quand on clique dans une zone de saisie de
texte gtk (dans la barre d'adresse de galeon), on peut changer l'"input method"
(voir la premiere image attachee), je choisis uim-anthy et apres, je peux
encore taper des caracteres normaux mais si je fais shift espace, je passe en
hiragana, reappuyer sur espace permet de passer en katakana ou en kanji. Et
pour revenir en caracteres latin, re shift espace...
Voila,
(cela dit, ca fait beaucoup appel a la souris, donc utiliser des kterm avec
kinput2 est plus simple qu'utiliser cette methode dans un gnome-terminal)
(Les images attachées à son mail sont sur cette page :
SaisirDuJaponaisImages)
Donc, comme uim-gtk2.0 dépends de uim-common et libuim0 et anthy de anthy-cannadic et libanthy0, on n'a plus qu'à apt-getter :
apt-get install uim-gtk2.0
apt-get install anthy
Maintenant, y'a plus qu'à utiliser Galeon quand c'est requis ! :-)
Merci Emmanuel !
JAVA
Les applets java n'affichent que des rectangles (
http://www.ghosthack.net/~moku/data/doc/gnu-linux/images/2005-04-10-java_japonais-ko.jpg) au lieu des caractères japonais (
http://www.ghosthack.net/~moku/data/doc/gnu-linux/images/2005-04-10-java_japonais-ok.jpg) ?
Il faut indiquer à Java où trouver les fichiers de polices de caractères japonais.
Le problème c'est que les polices
Watanabe mincho et
Wadalab gothic ne sont pas libres, et ont donc étées retirées de Debian à la fin de l'année 2003. (voir
cette discussion)
Il faut donc en avoir une copie (illégale ?) pour pouvoir utiliser l'applet Java d'
Apprendre les kanji japonais sur Japanese-kanji.com.
cd ...(java path).../j2re1.4.1/lib/fonts/
(ou bien : cd ...(...).../jre1.5.0_01/lib/fonts/ )
Cherchons si les fonts sont disponibles :
apt-cache search watanabe
dpkg -L ttf-xtt-watanabe-mincho | grep "\.ttf"
sudo ln -s /usr/share/fonts/truetype/X-TT/watanabe-mincho.ttf
apt-cache search wadalab
dpkg -L ttf-xtt-wadalab-gothic | grep "\.ttf"
sudo ln -s /usr/share/fonts/truetype/X-TT/wadalab-gothic.ttf
Sinon, les récupérer depuis un ami puis les lier/copier dans ce répertoire.
Relancer Mozilla et voilà
Source :
http://www.asahi-net.or.jp/~ik2r-myr/kanji/linos_fr.htm
UPDATE 2004-12-14
Utiliser
IM-JA semble être le futur.
http://im-ja.sourceforge.net/
(en root)
echo "deb http://im-ja.sourceforge.net/ ./" >> /etc/apt/sources.list
apt-get update
apt-get install im-ja-all im-ja-applet
update-gtk-immodules
(puis en utilisateur normal)
galeon (ou epiphany)
Effectuer le clic-droit dans la zone d'adresse et choisir l'Input Method (Méthode de saisie) « Japanese ». Refaire le clic-droit au même endroit et apparait alors une liste des méthodes de saisies disponibles : en « raw » (texte brut), en hiragana, katakana, etc.
Sauf qu'au jour d'aujourd'hui, chez moi, ça ne marche pas pour les champs d'une page web, seulement pour les champs du logiciel. C'est assez limité ^^
UPDATE 2004-12-14, #2
Suivre le tutorial de JWS
http://www.jw-stumpel.nl/input.html
La première solution fonctionne bien.
Monter un système de fichiers encodé en japonais
C'est à dire avec l'un des
charsets Shift-JIS ou EUC-JP (UTF-8 ?)
Il faut avoir activté dans le noyaux la directive
File systems > Native Language Support > Japanese charsets (Shift-JIS, EUC-JP) (CONFIG_NLS_CODEPAGE_932)
Ensuits il suffit de monter le périphérique (CD-Rom par exemple) en spécifiant le charset à utiliser :
mount -o iocharset=euc-jp /dev/cdrom /cdrom/
Pour lire les noms de fichiers, il faut bien sûr utiliser kterm.
Un exemple du rendu :
*