![]() |
ユニコード戦記 | ||
著者 | 小林龍生 | ||
出版社 | 東京電機大学出版局 | ||
サイズ | 単行本 |
![]() ![]() |
|
発売日 | 2011年06月 | ||
価格 | 2,970円(税込) | ||
ISBN | 9784501549701 |
ぼくにとって、国際標準化活動へのかかわりを深めていくということと、英語によるコミュニケーション能力を高めていくということとは、ほとんど不可分のことだった。(136ページ)
概要

本書で印象的だったのは、ユニコードが少数民族の文字まで扱おうとする一方で、その議論に参画するには英会話能力が必須だということ。著者はこれについて、「経済や産業発展のためには、国際標準(まさにグロスタ!)に則った産業基盤の育成が欠かせないわけだが、それはある種の諸刃の剣で、先進工業国がつくった枠組みを盲目的に受け入れる以外に、グローバル化した社会の中での経済や産業の発展はありえないという矛盾がある」(183ページ)と語る。
また、ほとんど海外へ行ったことがない著者が、40代で一念発起して英会話能力を磨く姿には頭が下がる。ただし、「大切なのは、英語のスキルではなく、伝えるべきメッセージをはっきりと持っているか否か」(33ページ)と釘を刺している。
欧米との仕事意識の違いについても言及している。「とくに欧米人が日本人に対してよく抱く疑問は、権限を委譲されているならば、なぜその場で自分で判断しないのかということ。持ち帰って検討するなら、子供の使いと同じではないか」(60ページ)などがそれだ。
また、ほとんど海外へ行ったことがない著者が、40代で一念発起して英会話能力を磨く姿には頭が下がる。ただし、「大切なのは、英語のスキルではなく、伝えるべきメッセージをはっきりと持っているか否か」(33ページ)と釘を刺している。
欧米との仕事意識の違いについても言及している。「とくに欧米人が日本人に対してよく抱く疑問は、権限を委譲されているならば、なぜその場で自分で判断しないのかということ。持ち帰って検討するなら、子供の使いと同じではないか」(60ページ)などがそれだ。
レビュー
ユニコードは、あくまで表記文字を標準化するもので、会話言語を扱うものではないということにも留意すべきだ。ユニコードでは、シフトJISで扱えなかったような漢字まで扱えるが、方言は考慮されていない。

本書の後半で、異体字や東南アジアの少数民族の表記文字に関する話題が登場する。少数民族の表記文字を先進国が標準化していいものなのだろうかという著者の疑問は、大手システムベンダ/SIがBtoCシステムを開発するときにも同じことが言える。
日本の汎用コンピュータは、名前に使われる異体字(渡辺の「辺」や斉藤の「斉」など)を表記するために各社固有の文字コードを使っているが、これをオープン化/Web化する際にシフトJISやEUC-JPにすると、異体字が完全に無視される。異体字の名を持つ人の中には、それにこだわりを持っている人が少なからずおり、こうしたシステム変更に対してクレームをつけてくる。
その気持ちはよくわかる。私の名前の1文字も、JIS第一水準に収録されているにもかかわらず人名漢字であるために、カタカナで宛名表記してくる人/組織/会社が多い。技術者としては、システムの仕様と言い逃れをするのではなく、エンドユーザーのクレームにもっと耳を傾けるべきだと思う。
著者は「システムの設計は、一般にユーザーの存在と要求を前提として行われる。われわれ、システムを提供する側には、ユーザーの要求に応える義務がある」(97ページ)と指摘するが、「しかしまた、潜在的なものも含めて、あらゆるニーズを満たすシステムも、これまた、一般的には存在しない」とも言っている。システム開発の匙加減が難しいのは、こうした背景があるからだ。

私の経験でも、システム設計で文字コードが議論になることが多い。設計段階で文字コードが決まってしまうと、あとで変更するのはまず不可能だからだ。
判断が厳しいのは、せっかくフロントエンド系にユニコードを導入して異体字が扱えるようにしても、宛名を印字するバックエンド系が汎用コンピュータだったり、(本書でも解説されている)「16ビット固定長ユニコード」という誤った設計のフレームワークが採用されている場合である。
さらに、すべてをユニコードで実装しても、エンドユーザーが使用しているフォントが対応していない場合もあり得る。
この文章はユニコードで表示している。あなたのブラウザで「剣」の異体字である「𠝏」は表示されるだろうか? 表示されなければフォントが対応していない。
いずれにしても、こういう文字に絡む議論が起きている現場では、多少時間がかかっても本書の読書会を行うことをお勧めする。
また、関連書籍として『パソコンは日本語をどう変えたか』(Yomiuri PC編集部)、『異体字の世界』(小池和夫)、『プログラマのための文字コード技術入門』(矢野啓介)も参考になるだろう。

本書の後半で、異体字や東南アジアの少数民族の表記文字に関する話題が登場する。少数民族の表記文字を先進国が標準化していいものなのだろうかという著者の疑問は、大手システムベンダ/SIがBtoCシステムを開発するときにも同じことが言える。
日本の汎用コンピュータは、名前に使われる異体字(渡辺の「辺」や斉藤の「斉」など)を表記するために各社固有の文字コードを使っているが、これをオープン化/Web化する際にシフトJISやEUC-JPにすると、異体字が完全に無視される。異体字の名を持つ人の中には、それにこだわりを持っている人が少なからずおり、こうしたシステム変更に対してクレームをつけてくる。
その気持ちはよくわかる。私の名前の1文字も、JIS第一水準に収録されているにもかかわらず人名漢字であるために、カタカナで宛名表記してくる人/組織/会社が多い。技術者としては、システムの仕様と言い逃れをするのではなく、エンドユーザーのクレームにもっと耳を傾けるべきだと思う。
著者は「システムの設計は、一般にユーザーの存在と要求を前提として行われる。われわれ、システムを提供する側には、ユーザーの要求に応える義務がある」(97ページ)と指摘するが、「しかしまた、潜在的なものも含めて、あらゆるニーズを満たすシステムも、これまた、一般的には存在しない」とも言っている。システム開発の匙加減が難しいのは、こうした背景があるからだ。

私の経験でも、システム設計で文字コードが議論になることが多い。設計段階で文字コードが決まってしまうと、あとで変更するのはまず不可能だからだ。
判断が厳しいのは、せっかくフロントエンド系にユニコードを導入して異体字が扱えるようにしても、宛名を印字するバックエンド系が汎用コンピュータだったり、(本書でも解説されている)「16ビット固定長ユニコード」という誤った設計のフレームワークが採用されている場合である。
さらに、すべてをユニコードで実装しても、エンドユーザーが使用しているフォントが対応していない場合もあり得る。
この文章はユニコードで表示している。あなたのブラウザで「剣」の異体字である「𠝏」は表示されるだろうか? 表示されなければフォントが対応していない。
いずれにしても、こういう文字に絡む議論が起きている現場では、多少時間がかかっても本書の読書会を行うことをお勧めする。
また、関連書籍として『パソコンは日本語をどう変えたか』(Yomiuri PC編集部)、『異体字の世界』(小池和夫)、『プログラマのための文字コード技術入門』(矢野啓介)も参考になるだろう。
(2011年8月2日 読了)
参考サイト
- ユニコード戦記:東京電機大学出版局
- 『ホンモノの日本語を話していますか』(金田一春彦,2001年04月)
- 『ヘボン博士の愛した日本』(杉田幸子,2006年03月)
- 『異体字の世界』(小池和夫,2007年07月)
- 『適当な日本語』(金田一秀穂,2008年08月)
- 『ユニコード戦記』(小林龍生,2011年06月)
- 『パソコンは日本語をどう変えたか』(Yomiuri PC編集部,2008年08月)
- 西暦1978年 - 日本語ワードプロセッサ「JW-10」発表:ぱふぅ家のホームページ
- PHPで日本語テキストを正規化:ぱふぅ家のホームページ
- JIS X 0208 と漢字ROM:ぱふぅ家のホームページ
- 外字が不要に――ISO/IEC 10646:2017:ぱふぅ家のホームページ
(この項おわり)