あなたの名前はきちんと登録されているか

(1/1)
あなたの名前は PC で間違いなく表示されているだろうか? データベースに間違いなく登録されているだろうか?
日本語をプログラムで扱う際、俗に言う「森鴎外問題」という大きな問題が横たわっている。常用漢字や JIS 漢字に代替がきくアプリケーションならともかく、人名、地名などの固有名詞を扱うアプリでにとっては少々厄介な問題である。場合によっては、設計者の意図した内容が利用者に伝わらないこともある。

森鴎外問題

森鴎外問題
下の HTML ファイルをオープンしてほしい。

左図のように表示されただろうか。
最近の Unicode 対応のブラウザであれば、OS を問わずに左図のように表示されるはずである。
ここで、2行目の「森鴎外」をドラッグ&コピーして、先ほどの "mori.html" のファイル名を漢字にリネームしてみる。たいていの OS では問題なくリネームできるだろう。
次に、2行目で同じ作業を行ってみる。今度は、多くの OS でエラーとなったはず。
これは、2行目の文字が Unicode で記述されているため、Unicode 対応のアプリでないと利用できないことに起因する――これが第一の問題
つまり、アプリケーションによって、使える漢字と使えない漢字があるのだ。とくに最近の Web アプリでは、ブラウザでは入力できたのに、データベースに登録できないというケースが多い。

では、あなたはどちらの字体を正しい「森鴎外」として習ったか?
お父さん、お母さん以上の世代は 2行目の方だろう。しかし、若い人たちの中には、1行目で習った人がいるかもしれない。
実は、近年のコンピュータ漢字表記のゴタゴタから、出版物に両方の文字が混在しているのだ――これが第二の問題

自分は「森鴎外」ではないから大丈夫だと思う人もいるかもしれない。
しかし、たとえば「渡辺」の場合、100種類以上の表記が存在している。これを異体字と呼ぶ。
今までは手書きだったから良かったものの、ワープロやパソコンが普及してから、やむを得ず「渡辺」という字体を使っている人もいるのではないだろうか。電子政府構想が具体化し、住基ネットやマイナンバーによる申請書の電子化など、さまざまな分野で自分の名前を電子化しなければならなくなった。しかし、「森鴎外問題」を解決しないまま電子化が進んでいるのが現状である。

本コーナーでは、第一の問題の要因となっている文字コード、および第二の問題の要因となっている異体字について解説し、わが国にあるべきプログラムの姿を追っていく。

参考書籍

表紙 異体字の世界 最新版
著者 小池和夫
出版社 河出書房新社
サイズ 文庫
発売日 2013年09月06日
価格 820円(税込)
rakuten
ISBN 9784309412443
常用漢字の変遷、人名用漢字の混乱、ケータイからスマホへ進化し続ける漢字の現在を、異形の文字から解き明かした増補改訂新版。漢字のアナザーワールドへようこそ!
 

参考サイト

(この項おわり)
header