テキスト原稿におけるデータ処理
手作業を省くことによるメリット
パソコンの普及などによって、印刷物の原稿も手書きではなくはじめからテキストデータとして作られるのが当たり前になってきました。手書き原稿を作った後でそれを入力するという工程を省くことで、コストを削減することができ、さらに手書きからテキストに起こす際の入力ミスの防止にもつながる(もちろん、入力する人間のミスはあり得る)わけです。
といっても、手書きの原稿がまったくなくなったわけではありません。特に、すでに印刷されたものを元にして新たに本を作るような場合などは、大量の赤字が手書きされていることも多く、本格的なテキスト入力が必要になることも珍しくありません。
また、原稿がテキストデータとして出来上がっていたとしても、きちんとしたものになっているとは限りません。複数の著者が書いた原稿であったり、異なる目的で書かれた文章をひとつにまとめるといった場合は、言い回しや表記などがバラバラになっていることもあり、それを統一する必要が出てきます。
こういった場合、ワープロソフトやテキストエディタでテキストの表記をひとつずつ修正していくというのはそれなりに時間がかかる作業です。それに加えて、修正箇所が多ければ多いほど作業ミスが出ることも考慮しなければなりません。
逆に言うと、原稿修正における時間やミスを少なくするには、原稿の修正を人間がひとつずつやっていくという作業をなくし、自動化を図るということが大切になってくるわけです。
ワープロやテキストエディタを使う処理
テキストを処理するソフトというと、Wordや一太郎といったワープロソフトや秀丸などのテキストエディタが定番です。これらのソフトには検索・置換機能が付いており、それを使うことで修正作業を正確かつ効率的に行うことができます。
ただし、語句をひとつずつ検索しながら置換していくのは非効率的ですし、処理が多ければミスが出るかもしれません。といっても、一括で置換すると、間違って直してはいけない部分を直す危険も出てきます。また、同じ語句であっても同じ置換でいいとは限らず、前後の状況によって修正内容が違うということもあり得ます。
そういった場合、正規表現を使うことで効率的な作業が可能になります。正規表現は文字列をパターンで扱うことができ、前後の語句をパターンとして検索することで置換しないケースを排除したり、あるいは前後の語句の順序の入れ替えなどを行うことができます。もちろん、正規表現を使うには正規表現に対応したソフトを使うというのが前提です。
また、通常の検索・置換機能だと検索と置換にそれぞれひとつの語句しか選べませんが、異なる複数の語句を一括で処理したいという場合もあります。ソフトによっては、マクロやアドインソフトなどを使い、複数語句を検索で指定してそれぞれに異なる置換を行う処理ができるものもあります。
そのほか、ワープロソフトには校正を支援する機能として表現のゆらぎなどをチェックしたり統一する機能が搭載されているものもあります。必要ないのにチェックされて煩わしいという声もある機能ですが、使いようによってはかなり有効な機能です。
Excelを使う処理
ワープロやテキストエディタだけですべてのテキスト処理ができるとは限りません。さまざまな処理を自動的に行うとなると、たとえ正規表現を使っても難しいものもあります。
場合によっては、Excelに代表される表計算ソフトを使うこともあります。表計算ソフトは、その名の通り数値など表計算のためのソフトですが、データ処理のための豊富な機能を備えており、それをテキストの処理にも活用することでワープロやテキストエディタの手の届かない部分を補うことができるわけです。
Excelの場合、さまざまな関数が用意されており、これを使って計算処理を自動的に行えるようになっています。この関数の中には、たとえば文字列の指定された個所の文字を置換するRELPACE関数やSUBSTITUTE関数、文字と文字コードの変換を行うCODE関数やCHAR関数など、テキストの処理に利用できるものも少なくありません。
また、IF関数のような関数を使えば、条件を指定して「この場合はこの処理、そうでない場合は別の処理」というような、より柔軟な処理を行うことも可能です。
もちろん、Excelはワープロやエディタではなく、あくまでセルで区切られた表を基本としたソフトですから、長文のテキストをそのまま処理するのには向きません。使えるケースは限られますし、ちょっとした工夫も必要になるかもしれませんが、使い方次第では強力なツールとして利用することができるはずです。
多くの場合、テキスト原稿がそのまま修正なしに印刷物になるということはほとんどないでしょう。むしろ、デジタル化が進むにつれて入力後の修正が必要な度合いも大きくなっているようにすら思われます。
テキストの修正は、テキストをDTPソフトに流し込んだ後でなく、できるだけ前工程で行うほうが効率的であり、ミスの危険も少なくなります。そのためには、テキストを処理することができるさまざまなツールを駆使することが重要になってきます。
(田村 2010.3.23初出)
(田村 2016.5.25更新)