森鴎外問題
ここで、2行目の「森鴎外」をドラッグ&コピーして、先ほどの "mori.html" のファイル名を漢字にリネームしてみる。たいていのOSでは問題なくリネームできるだろう。
次に、2行目で同じ作業を行ってみる。今度は、多くのOSでエラーとなったはず。
これは、2行目の文字が Unicode で記述されているため、Unicode対応のアプリでないと利用できないことに起因する――これが第一の問題。
つまり、アプリケーションによって、使える漢字と使えない漢字があるのだ。とくに最近のWebアプリでは、ブラウザでは入力できたのに、データベースに登録できないというケースが多い。
では、あなたはどちらの字体を正しい「森鴎外」として習ったか?
お父さん、お母さん以上の世代は2行目の方だろう。しかし、若い人たちの中には、1行目で習った人がいるかもしれない。
実は、近年のコンピュータ漢字表記のゴタゴタから、出版物に両方の文字が混在しているのだ――これが第二の問題。
自分は「森鴎外」ではないから大丈夫だと思う人もいるかもしれない。
しかし、たとえば「渡辺」の場合、100種類以上の表記が存在している。これを異体字と呼ぶ。
今までは手書きだったから良かったものの、ワープロやパソコンが普及してから、やむを得ず「渡辺」という字体を使っている人もいるのではないだろうか。電子政府構想が具体化し、住基ネットやマイナンバーによる申請書の電子化など、さまざまな分野で自分の名前を電子化しなければならなくなった。しかし、「森鴎外問題」を解決しないまま電子化が進んでいるのが現状である。
本コーナーでは、第一の問題の要因となっている文字コード、および第二の問題の要因となっている異体字について解説し、わが国にあるべきプログラムの姿を追っていく。
次に、2行目で同じ作業を行ってみる。今度は、多くのOSでエラーとなったはず。
これは、2行目の文字が Unicode で記述されているため、Unicode対応のアプリでないと利用できないことに起因する――これが第一の問題。
つまり、アプリケーションによって、使える漢字と使えない漢字があるのだ。とくに最近のWebアプリでは、ブラウザでは入力できたのに、データベースに登録できないというケースが多い。
では、あなたはどちらの字体を正しい「森鴎外」として習ったか?
お父さん、お母さん以上の世代は2行目の方だろう。しかし、若い人たちの中には、1行目で習った人がいるかもしれない。
実は、近年のコンピュータ漢字表記のゴタゴタから、出版物に両方の文字が混在しているのだ――これが第二の問題。
自分は「森鴎外」ではないから大丈夫だと思う人もいるかもしれない。
しかし、たとえば「渡辺」の場合、100種類以上の表記が存在している。これを異体字と呼ぶ。
今までは手書きだったから良かったものの、ワープロやパソコンが普及してから、やむを得ず「渡辺」という字体を使っている人もいるのではないだろうか。電子政府構想が具体化し、住基ネットやマイナンバーによる申請書の電子化など、さまざまな分野で自分の名前を電子化しなければならなくなった。しかし、「森鴎外問題」を解決しないまま電子化が進んでいるのが現状である。
本コーナーでは、第一の問題の要因となっている文字コード、および第二の問題の要因となっている異体字について解説し、わが国にあるべきプログラムの姿を追っていく。
参考書籍
参考サイト
- IE7と補助漢字(「森鴎外」と「森鷗外」):WEBプログラミング NOW!
- 文字コード(漢字)の問題点
- 続・葛城市問題(飛騨市とJIS漢字と「MS 明朝」):とつか町だより
(この項おわり)
日本語をプログラムで扱う際、俗に言う「森鴎外問題」という大きな問題が横たわっている。常用漢字やJIS漢字に代替がきくアプリケーションならともかく、人名、地名などの固有名詞を扱うアプリでにとっては少々厄介な問題である。場合によっては、設計者の意図した内容が利用者に伝わらないこともある。