JIS X 0212 と JIS X 0213

(1/1)
草彅剛
JIS X 0208:198787JIS)には6,879の文字、記号が登録されている。だが、これでは表しきれない文字が多いことから、6,067の文字、記号が追加された JIS X 0212JIS補助漢字)が制定される。ところが、JIS補助漢字はコンピュータ向けに符号化することを想定していなかったため普及せず、2000年(平成12年)に制定される JIS X 0213 を待たねばならなかった。

JIS X 0212:JIS補助漢字

97JISには6,879の文字、記号が登録されている。だが、これでは表しきれない文字が多いことから、田嶋一夫ら国文学研究資料館の研究に基づき、6,067の文字、記号が追加されることになった。1990年(平成2年)10月1日、「情報交換用漢字符号-補助漢字」として JIS X 0212 を制定した。別名は JIS補助漢字

JIS X 0212JIS X 0208 と同じく、94×94の区点コードで示される。
漢字も5,801文字が追加されたが、研究色が濃く、たとえば鹿児島の南にある 吐噶喇 (とから) 列島を表示することができない。 が足りないのである。

結局、JIS補助漢字はコンピュータ向けに符号化することを想定していなかったため普及しなかった。

JIS X 0213:第3・第4水準

JIS X 0212 の失敗を踏まえ、JIS X 0208 の上位互換の文字符号化方式として制定されたのが、2000年(平成12年)の JIS X 0213 である。規格の正式名称は「7ビット及び8ビットの2バイト情報交換用符号化拡張漢字集合」で、通称「JIS2000」だ。さらに2004年(平成16年)に10文字増やし、こちらは「JIS2004」と呼ばれる。
ここでは、JIS2004 について紹介していくことにする。

JIS X 0213 では、97JIS の収載字体の用例・典拠を徹底して調べ上げ、一般には使われるものの、97JIS に収載されていない4,354字を追加した。このため、あらたに収録された文字は JIS X 0212 と互換性がない。

JIS X 0213JIS X 0212 と合わせて11,233字となり、これでは94×94=8,836個では不足する。
そこで、JIS X 0213 ではまず、94×94の区点コード表を2面用意した。そして、97JIS を1面に割り当てた。1面で未定義だった13区に77文字の非漢字を、14~15区および47区の後半、84~94区に1,259文字の漢字を割り当てた。1面にあらたに割り当てられた漢字を第3水準と呼ぶ。
2面は、01~15区、78~94区に2,436文字の漢字が割り当てられた。これが第4水準である。
2面の中央の大部分を未定義としているのは、JIS X 0212 と重ならないようにするためである。規格としての JIS X 0212 は健在なのだ。
JIS X 0213 区点コード表 1面
JIS X 0213 区点コード表 1面
JIS X 0213 区点コード表 2面
JIS X 0213 区点コード表 2面

文字の収集

JIS X 0213 に収載する文字の基準は
  • 現代日本語の文章として
  • 安定して用いられるもので
  • 印刷された用例があるもの
という厳格な基準が設けられた。JIS X 0208 で問題になった幽霊文字はもちろん、出典が怪しい文字は一切排除された。第3・第4水準文字を加えた結果、新聞の電子版でカタカナ表記をしている 鄧小平 (とうしょうへい)  深圳 (しんせん)  が漢字表記できるようになった。三国志ファンならお馴染みの、龐統 (ほうとう)  荀彧 (じゅんいく)  程昱 (ていいく)  邢道栄 (けいどうえい)  も漢字表記できるようになった。

中国漢字だけではない。解散したSMAPの 草彅剛 も漢字表記できる。
後述する Unicode は第3・第4水準を網羅しているのだが、いまだに新聞の電子版では「深セン(センは土へんに川)」などと表記していたりする。同じ日本人として嘆かわしい限りである。

復活した漢字

JIS X 0208の改正と混乱」によって消えていった漢字のうち、いくつかが復活した。

あなたの名前はきちんと登録されているか」で話題にした森鴎外問題で取り上げた (1面94区69点)が復活した。また、冒瀆、祈禱、蠟燭、飛驒、蓬萊なども本字体で表記できるようになった。

ただし、97JIS で定義された[包摂規準 (ほうせつきじゅん) 」は依然として有効であり、とめ・はね・はらいといった細かな違いの異体字は収載されていない。

JIS X 0213 の符号化

JIS X 0213 の規格書には9つにも及ぶ符号化手順が明記されている。
EUC-JP を拡張した EUC-JIS-2004シフトJIS を拡張した Shift_JIS-2004ISO 2022を拡張した ISO-2022-JP-2014 などである。

ところが、規格制定の土壇場になって、メーカーやベンダから機種依存文字を表示できるようにしたいとの意見が噴出。結局、符号化の部分は「参考」という扱いになってしまい、これらの符号化手順は普及しなかった。
第3・第4水準の漢字を使えるのようになるのは、Unicode の普及を待たねばならなかった。

参考サイト

(この項おわり)
header