サイトアイコン InDesign(インデザイン)専門の質の高いDTP制作会社―株式会社インフォルム

今あらためてJIS2004への対応を考える

今あらためてJIS2004への対応を考える

漢字表の変遷と文字コード

コンピュータが普及していく過程で問題になったのが、日本語の文字の扱いでした。数字を入れても数十文字もあればなんとかなる英語環境と違い、まともな日本語を使うにはどう少なく見積もっても数千字は必要になります。

1978年、漢字を含む日本語の文字集合が初めてJISで制定されました。これがJIS C 6226―のちにJIS X 0208と改称され、日本語デジタル環境におけるもっとも基本の規格として広く使われてきた文字コード(文字セット)です。

JIS X 0208は1983年、1990年、1997年の3回にわたって改定され、最終的に6,879文字が規定されることになります。内訳は、句読点など記号類の特殊文字、数字、アルファベット、ひらがな、カタカナ、ギリシャ文字、キリル文字、罫線、それに漢字で、漢字は第1水準と第2水準合わせて6355字でした。

JIS制定に先立つ1971年、情報処理学会は規格委員会の中に漢字コード委員会を設け、漢字に関する18点の資料を調査し、6086字の「標準コード用漢字表(試案)」を公表しました。その後、行政管理庁がこの試案をベースに、官報やほかの漢字表の調査を加味した分析結果と漢字表「行政管理庁基本漢字」を作成しました。

1978年のJIS作成委員会は、行政管理庁の分析結果を参考にし、上記の標準コード用漢字表、行政管理庁基本漢字に、人名・地名の漢字として日本生命の「人名漢字表」、国土地理協会の「国土行政区画総覧使用漢字表」を加えた4つの漢字表をもとに、漢字関係の37点の資料における出現頻度を考慮してJIS X 0208の漢字を選んだのです。

その後の改定においては、若干の文字の追加もありましたが、文字の追加以上に大きな問題になったのが規格票の例示字形の変更と包摂基準の規定化でした。

そもそも漢字には、形が違うのに読み方も意味も同じ文字として扱われる「異体字」が相当数存在します。異体字には、元の字を省略した略字や、古い時代の古字、世間で非公式に使われてきた俗字など、さまざまな由来のものがありますが、いずれにしても異体字関係にある文字同士は形が異なっていても同じ文字とみなされ扱われます。

複数の異体字がある場合、どれが正字でどれが異体字かは、一概に決められません。元は由緒正しい文字だったとしても、簡略化された異体字のほうが正式な漢字表に採用されたりすれば元の字は旧字という名の異体字になることもよくあります。

日本で正式に国から告示された漢字表には1946年の「当用漢字表」、1951年の「人名用漢字別表」、1981年の「常用漢字表」、2010年の「改定常用漢字表」などがありますが、当用漢字表と3年後に告示された同字体表によって数百字の簡易字体が採用され、それまで正しいとされてきた文字が異体字(旧字)に、異体字が正字とされました。この段階で正・異が変更になった文字としては、たとえば「應・応」「廣・広」「亞・亜」「晝・昼」などがあります。

当用漢字は漢字使用を制限する目的で作られたもので、あらゆる文書に対する義務化をもたらすものではないものの、公文書や教育現場はもちろん、新聞や商業出版物においてもかなりの強制力が発揮され、漢字の制限や字体の変更が行われました。

一方で、当用漢字以降、漢字制限はさまざまな方面から批判を浴び続けます。その結果、1951年には当用漢字しか使えないとされた人名で使える漢字として「人名用漢字別表」を告示、その後もたびたび人名用漢字が追加されることになります。また、1981年には当用漢字が廃止され、代わりに法令以外には強制力がなく、あくまでも目安扱いの「常用漢字」が告示されました。

1978年のJIS X 0208(78JIS)では、当用漢字表に収録されていた文字は、字体表に掲載された字形のまま、人名用漢字別表とともにすべて第1水準に収録されました(当用漢字が1850字、人名用漢字別表が120字、第1水準は2965字)。第1水準の残りと第2水準には、先ほど述べた4つの漢字表にある漢字から選んで収録されました。その際、当用漢字でない文字のうち「嘘」「叛」など10文字程には、当用漢字に合わせた簡略字形が採用されましたが、多くは元の漢字表に掲載されていた正字でした。つまり、78JISは、簡略字体を使う当用漢字と当用漢字以外の従来の字体の漢字が混在した文字セットだったわけです。

この段階で字形を統一できればよかったのかもしれません。ただし、文字コードの考え方としては、規格票に掲載した文字は具体的な字形を指定したものではなく、あくまで字体を「例示」したものだとなります。JIS X 0208の1997年改訂ではこの点について「包摂」という概念を示し、例示字体は一例であって字形の細かな差異があっても包摂基準の範囲であれば同じ字体とみなすとしていました。

ところが、JIS X 0208の1983年改訂(83JIS)では、JIS規格票に掲載される例示字形の相当数が変更され、入れ替わりました。同じ文字の異体字が第1水準と第2水準にまたがって収録されていた22組は、それぞれ第1水準と第2水準の入っていた符号位置が入れ替わり、さらに第1水準3文字と第2水準1文字が簡略化されて元の字は第2水準の最後に追加されました。そのほか、83JISで例示字形が変更になったのが254字と、合わせて約300の例示字形が変わったのです。

本来、文字コードは細かな字形の違いにかかわらないものであり、なおかつ、例示字体は実際の文字のデザインを定義するわけではないのですが、この変更はその後のフォントのデザインに大きな影響を与え、83JISに準拠した字体のフォントが一般的になりました。

一方、DTPなどでは簡略化された字形よりも従来の印刷で使われてきた字体のニーズが大きく、また人名における字形もこだわりが強いことから、文字コードにかかわらず必要な字形を求める動きが高まりました。その結果、異体字を管理・運用できるOpenTypeフォントが登場することになります。

表外漢字字体表がもたらした影響

文字数の制限を目的とした当用漢字から単なる目安の常用漢字に移行し、さらにワープロ・パソコンなど情報機器が普及したことで、漢字を取り巻く状況は大きく変わりました。文字を覚えるのに膨大な手間・労力がかかるというのが漢字を制限する政策の最大の根拠でしたが、難しい漢字でも簡単に入力、印刷できるようになったことで、使える文字の範囲を増やすことへの障害がなくなったのです。

同様に、字体についても簡略化から従来の字体の維持へと流れが変わります。

2000年12月、国語審議会は、常用漢字と一緒に使われることが多い1022字の漢字について、印刷標準字体を示した「表外漢字字体表」を答申しました。常用漢字と人名漢字を除く使用頻度の高い漢字について、当用漢字や常用漢字のような簡略字体ではなく、従来のいわゆる康熙字典体(清の康熙帝の勅撰により作られた漢字辞典で採用された字体)と、それに匹敵する使用実績のある俗字や略字を印刷用の標準字体として定めたこの字体表は、強制的なものではないものの、国として字体を指定した点は無視できないものであり、文字コードにも大きな影響を与えることになりました。

表外漢字字体表に先立つ2000年1月、JIS X 0208を大幅に拡張し、11,233字を収録した新しい文字セットJIS X 0213が制定されていました(以下、「JIS2000」と略す)。JIS X 0213では第3水準、第4水準が追加され、非漢字も増えましたが、そのため従来のフォント環境での対応は難しく、Unicodeのサポートによって普及することになります。おりしも、UnicodeをサポートするOS、フォント、アプリケーションが一気に普及する時期にあたり、JIS X 0213をフルカバーするOpenTypeフォント(Adobe-Japan1-5)も2002年に登場しました。OpenTypeフォントを中心に、JIS X 0213に対応したフォントが順調に増えていく中で、メーカーや関係者に表外漢字への対応を迫ることになったのがJISの改正です。

JISの規格は制定・改正から5年以内に見直しをしなければならないという決まりがあります。JIS X 0213は2004年に改正を行いますが、その際、表外漢字字体表に対応するため、168字の例示字形を変更し、10字を追加しました(JIS X 0213:2004。以下「JIS2004」と略す)。

その後、JIS2004に対応したフォントが登場してきますが、中でも重要なのがWindowsに標準搭載されたMS書体です。2007年発売のWindows Vista以降、MS明朝、MSゴシック、メイリオの字形はすべてJIS2004に準拠したものに変更されました。もちろん、従来のOSやフォントも使うことは可能ですし、従来字形のJIS90互換MS書体も用意されましたが、OSのバージョンによって同じ書体なのに字形が違うという事態が生じたわけです。

同時期に、主にDTP用途のOpenTypeフォントもJIS2004への対応を進めました。ただし、これらはフォントが個別に管理されるものだけに、取り違えないように名前で区別がつく必要があります。従来の字形のフォントはそのまま変わらず、小塚明朝Pr6Nや筑紫明朝Pr5NといったようにJIS2004対応の多くの書体の名前にNが付くようになりました(Nフォント)。

異なる字形をどうやって使い分けるか

書体の違いによって字形が変わるというのもあまりよいことではありませんが、それでも使う書体で字形の使い分けができるのであれば最低限の管理はできます。ところがWindows標準書体の場合はWindowsのバージョンによって字形が変わってしまうということであり、管理は極めて困難になります。

例えば、Windows XPで作ったJIS2000字形のデータをWindows Vistaで開けば、JIS2004の字形になります。これはWordデータであってもInDesignデータであっても同じで、MS書体を使っていれば自動的に変わってしまうのです。

ここでDTPと印刷のワークフローについて考えてみます。DTPでは、まず原稿が作成され、それをアプリケーションでレイアウトし、校正と修正を繰り返して校了になれば印刷に回ります。原稿を作る人間とレイアウトする人間は別人の場合がほとんどで、出版社の社内で完結するというようなケース以外は組織も別になり、お互い面識がないということも多いでしょう。

つまり、どのような環境で入力したか、後の工程の人間が確認することが難しいわけです。また、データが作られてから時間が経てば経つほど作った時点の情報は少なくなってきます。社内に昔作られたテキストデータが保管されていて、それを新たにInDesignに流し込むという仕事などでは、入力した時点での字形が何かを確認するのはかなり難しいでしょう。

さらに考えなければならないのは、入力した人間がどれだけ字形を意識していたのか分からないという点です。JIS2004で変更になった字形の中には、違いが微妙でパッと見ただけでは気づきにくいものもあります。たとえば、「辻」「辿」「迄」といった一点しんにょうと二点しんにょうの違いなど、小さなモニタ画面の中できちんと確認しながら入力している人ばかりではありません。

以前Windows XPで入力された名簿テキストを、最近になって使うことになったので、Windows 11のノートパソコンで開いて確認し、問題ないから印刷会社に渡した…いくらでもありそうな話ですが、この場合、どの字形が正しいと断言できるでしょうか。

要するに、テキストを作った本人の意思を確認するのも難しいというのがこの字形にまつわる最大の問題なのです。

現実問題として、クライアントから制作会社にテキストやWordデータが入稿された場合に、JIS2004の変更字形をどうするかは現在も頭を悩ます問題の一つです。原稿のテキストやWordデータは、最近のWindowsで開けばJIS2004の字形になっています。

この場合、JIS2004の字形を維持してレイアウトするのであれば、書体にOpenTypeのNフォントを指定することになるでしょう。

一方、Pro書体が使用フォントに指定されていたり、Nフォント以外の書体が指定されている旧データをそのまま流用するという場合は、必然的にJIS2000の字形になります。

どの字形にするかは、もちろん最終的には発注元のクライアント(内製であれば発行責任者)が決めるべきことです。しかし、発注元に確認しようとしても、字形をめぐる複雑な事情を知らない人間にはきちんと理解・判断できないということも十分考えられます。そういった場合のために、制作サイドとしても基本的な方針はまとめておくべきかもしれません。

もちろん、字形の違いがさほど重要でない印刷物もあります。問題になりやすいのは固有名詞が頻繁に出てくるもの、特に人名です。人名に関しては、その印刷物全体で字形を決めるというより、個別の名前ごとに字形を指定する必要があるかもしれません。

まず、2006年以前に作成されたデータの場合、作成当時に想定されていた字形がJIS2000だということを考慮すると、Pro書体などNフォント以外の書体を使うことを第一に考えていいのではないでしょうか。もっとも、クライアントが今の一般的な字形にしてほしいという希望があるならそれに従うべきです。

原稿も含めて完全に新規に作成する印刷物については、Nフォントを使うという基本方針でいいでしょう。現状で流通するテキストはほとんどJIS2004字形になっているはずですから問題ないはずです。

ただし、「完全に新規に作成する」という点が問題になります。原稿がデジタルデータで受け渡されるようになって久しいですが、デジタルデータの最大の特徴は複製が極めて容易という点です。たとえば、全体の原稿は2024年に作られたものだとしても、そのうちの半分以上はWindows XPで作られた別のデータをそのままコピーしたものだとしたらどうでしょう。

テキストをコピーする際に、最初に作られた時点の字形を気にしてコピーする人間などいないでしょう。コピーした時点で、字形を特定する手掛かりは失われてしまいます。

結局のところ、データだけで字形を確定するのは難しいようです。データを制作する側には、字形問題に関する十分な知識と、それをもとにした関係各所とのコミュニケーションが必要になるということは言えるでしょう。

(田村 2024.4.19)

モバイルバージョンを終了