あなたの名前はきちんと登録されているか

(1/1)
あなたの名前はPCで間違いなく表示されているだろうか? データベースに間違いなく登録されているだろうか?
日本語をプログラムで扱う際、俗に言う「森鴎外問題」という大きな問題が横たわっている。常用漢字やJIS漢字に代替がきくアプリケーションならともかく、人名、地名などの固有名詞を扱うアプリでにとっては少々厄介な問題である。場合によっては、設計者の意図した内容が利用者に伝わらないこともある。

森鴎外問題

森鴎外問題
下のHTMLファイルをオープンしてほしい。

左図のように表示されただろうか。
最近のUnicode対応のブラウザであれば、OSを問わずに左図のように表示されるはずである。
ここで、2行目の「森鴎外」をドラッグ&コピーして、先ほどの "mori.html" のファイル名を漢字にリネームしてみる。たいていのOSでは問題なくリネームできるだろう。
次に、2行目で同じ作業を行ってみる。今度は、多くのOSでエラーとなったはず。
これは、2行目の文字が Unicode で記述されているため、Unicode対応のアプリでないと利用できないことに起因する――これが第一の問題
つまり、アプリケーションによって、使える漢字と使えない漢字があるのだ。とくに最近のWebアプリでは、ブラウザでは入力できたのに、データベースに登録できないというケースが多い。

では、あなたはどちらの字体を正しい「森鴎外」として習ったか?
お父さん、お母さん以上の世代は2行目の方だろう。しかし、若い人たちの中には、1行目で習った人がいるかもしれない。
実は、近年のコンピュータ漢字表記のゴタゴタから、出版物に両方の文字が混在しているのだ――これが第二の問題

自分は「森鴎外」ではないから大丈夫だと思う人もいるかもしれない。
しかし、たとえば「渡辺」の場合、100種類以上の表記が存在している。これを異体字と呼ぶ。
今までは手書きだったから良かったものの、ワープロやパソコンが普及してから、やむを得ず「渡辺」という字体を使っている人もいるのではないだろうか。電子政府構想が具体化し、住基ネットやマイナンバーによる申請書の電子化など、さまざまな分野で自分の名前を電子化しなければならなくなった。しかし、「森鴎外問題」を解決しないまま電子化が進んでいるのが現状である。

本コーナーでは、第一の問題の要因となっている文字コード、および第二の問題の要因となっている異体字について解説し、わが国にあるべきプログラムの姿を追っていく。

参考書籍

表紙 異体字の世界 最新版
著者 小池 和夫
出版社 河出書房新社
サイズ 文庫
発売日 2013年09月06日頃
価格 935円(税込)
ISBN 9784309412443
常用漢字の変遷、人名用漢字の混乱、ケータイからスマホへ進化し続ける漢字の現在を、異形の文字から解き明かした増補改訂新版。漢字のアナザーワールドへようこそ!
 

参考サイト

(この項おわり)
header