『ユニコード戦記』――文字コードは常に議論の的

小林龍生=著
表紙 ユニコード戦記
著者 小林龍生
出版社 東京電機大学出版局
サイズ 単行本
発売日 2011年06月
価格 2,970円(税込)
rakuten
ISBN 9784501549701
ぼくにとって、国際標準化活動へのかかわりを深めていくということと、英語によるコミュニケーション能力を高めていくということとは、ほとんど不可分のことだった。(136ページ)

概要

Unicode
コンピュータの文字コードといえば、いまやユニコード(Unicode)が標準になった感があるが、本書はその経緯を記した技術書というより、標準化組織の内情を日本人の立場から時系列に記したドキュメンタリーになっている。
小学館で「ドラえもん」の担当編集者だった著者の小林龍生 (こばやし たつお) さんは、40代にしてATOKを有するジャストシステムに転職。それからユニコードの国際会議に参画し、やがて国際符号化文字集合の責任者になってゆく。
本書で印象的だったのは、ユニコードが少数民族の文字まで扱おうとする一方で、その議論に参画するには英会話能力が必須だということ。著者はこれについて、「経済や産業発展のためには、国際標準(まさにグロスタ!)に則った産業基盤の育成が欠かせないわけだが、それはある種の諸刃の剣で、先進工業国がつくった枠組みを盲目的に受け入れる以外に、グローバル化した社会の中での経済や産業の発展はありえないという矛盾がある」(183ページ)と語る。
また、ほとんど海外へ行ったことがない著者が、40代で一念発起して英会話能力を磨く姿には頭が下がる。ただし、「大切なのは、英語のスキルではなく、伝えるべきメッセージをはっきりと持っているか否か」(33ページ)と釘を刺している。
欧米との仕事意識の違いについても言及している。「とくに欧米人が日本人に対してよく抱く疑問は、権限を委譲されているならば、なぜその場で自分で判断しないのかということ。持ち帰って検討するなら、子供の使いと同じではないか」(60ページ)などがそれだ。

レビュー

ユニコードは、あくまで表記文字を標準化するもので、会話言語を扱うものではないということにも留意すべきだ。ユニコードでは、シフトJISで扱えなかったような漢字まで扱えるが、方言は考慮されていない。

本書の後半で、異体字や東南アジアの少数民族の表記文字に関する話題が登場する。少数民族の表記文字を先進国が標準化していいものなのだろうかという著者の疑問は、大手システムベンダ/SIがBtoCシステムを開発するときにも同じことが言える。
日本の汎用コンピュータは、名前に使われる異体字(渡辺の「辺」や斉藤の「斉」など)を表記するために各社固有の文字コードを使っているが、これをオープン化/Web化する際にシフトJISやEUC-JPにすると、異体字が完全に無視される。異体字の名を持つ人の中には、それにこだわりを持っている人が少なからずおり、こうしたシステム変更に対してクレームをつけてくる。
その気持ちはよくわかる。私の名前の1文字も、JIS第一水準に収録されているにもかかわらず人名漢字であるために、カタカナで宛名表記してくる人/組織/会社が多い。技術者としては、システムの仕様と言い逃れをするのではなく、エンドユーザーのクレームにもっと耳を傾けるべきだと思う。
著者は「システムの設計は、一般にユーザーの存在と要求を前提として行われる。われわれ、システムを提供する側には、ユーザーの要求に応える義務がある」(97ページ)と指摘するが、「しかしまた、潜在的なものも含めて、あらゆるニーズを満たすシステムも、これまた、一般的には存在しない」とも言っている。システム開発の匙加減が難しいのは、こうした背景があるからだ。

私の経験でも、システム設計で文字コードが議論になることが多い。設計段階で文字コードが決まってしまうと、あとで変更するのはまず不可能だからだ。
判断が厳しいのは、せっかくフロントエンド系にユニコードを導入して異体字が扱えるようにしても、宛名を印字するバックエンド系が汎用コンピュータだったり、(本書でも解説されている)「16ビット固定長ユニコード」という誤った設計のフレームワークが採用されている場合である。
さらに、すべてをユニコードで実装しても、エンドユーザーが使用しているフォントが対応していない場合もあり得る。
この文章はユニコードで表示している。あなたのブラウザで「」の異体字である「𠝏」は表示されるだろうか? 表示されなければフォントが対応していない。
いずれにしても、こういう文字に絡む議論が起きている現場では、多少時間がかかっても本書の読書会を行うことをお勧めする。
また、関連書籍として『パソコンは日本語をどう変えたか』(Yomiuri PC編集部)、『異体字の世界』(小池和夫)、『プログラマのための文字コード技術入門』(矢野啓介)も参考になるだろう。
(2011年8月2日 読了)

参考サイト

(この項おわり)
header