ポリシーは『質』へのこだわり。インフォルムは質の高い書籍・カタログ・参考書・雑誌のDTP制作(デザイン・組版)を追求する会社です。《ISO 9001:2015・ISO/IEC 27001:2022認証取得》

インフォルムロゴ
03-5783-4080
〒140-0004
東京都品川区南品川2-2-7 南品川Jビル9F

MENU

メニューを飛ばす
  • HOME
  • 会社情報
    • ごあいさつ
    • 会社概要
    • 所在地・アクセス
    • 級数表下敷き
    • ISO認証
      • ISO 9001:2015
      • 品質方針
      • ISO/IEC 27001:2022
      • ISMS基本方針
    • 個人情報保護方針
      • プライバシー・ポリシー
      • 個人情報規定と管理体制と実施状況
    • 採用情報
    • 特定商取引法に基づく表記
  • 営業品目
    • InDesign(インデザイン)による組版
    • DB(データベース)自動組版
    • デザイン
    • テキスト入力・加工処理
    • 書籍の編集業務
    • CD・DVDのコンテンツ制作・プレス
    • 画像加工・各種画像処理
    • 電子書籍の制作
      • 印刷物と電子書籍を同時に作る場合
      • 既存の印刷物を元に電子書籍を作る場合
      • 電子書籍だけを最初に作る場合
  • 実績・設備
    • インフォルムが選ばれる理由
    • InDesign(インデザイン)を使う理由
    • InDesign(インデザイン)でのDTP制作実績
    • お客様の声
      • 株式会社研究社編集部
      • 渋沢栄一記念財団―渋沢史料館
    • 品質の裏付け
      • DTP制作と失敗学
      • 1.畑村失敗学とは
      • 2.失敗学の導入と実践
      • 3.失敗の定義と失敗率計算式
      • 4.失敗率公開の理由
      • 品質を高める工夫
      • 情報の取り扱い
      • DTP作業ワークフロー
      • 校正の仕組み
      • 管理体制ーマネジメントシステム
      • 質と生産性の向上
    • DTP環境・設備一覧
    • 対応フォント
  • 技術情報
    • DTP全般
    • InDesign(インデザイン)関連
    • PDFのポイント
    • 文字について
    • カラーの話し
    • 入稿の注意
    • 製版・印刷
    • 電子出版の現状
    • DTPワンポイントアドバイス
      • PDFでの入稿・納品
      • 原稿入稿の注意点
      • 校正の注意点
      • 索引・目次について
      • 色のポイント
      • 電子書籍とは何か
        • データ形式
        • 印刷物との連携
        • 電子書籍におけるレイアウト
        • 電子書籍の販売
  • お問い合わせ
  • HOME »
  • 技術情報 »
  • 文字について »
  • テキスト原稿におけるデータ処理

テキスト原稿におけるデータ処理

手作業を省くことによるメリット

パソコンの普及などによって、印刷物の原稿も手書きではなくはじめからテキストデータとして作られるのが当たり前になってきました。手書き原稿を作った後でそれを入力するという工程を省くことで、コストを削減することができ、さらに手書きからテキストに起こす際の入力ミスの防止にもつながる(もちろん、入力する人間のミスはあり得る)わけです。

といっても、手書きの原稿がまったくなくなったわけではありません。特に、すでに印刷されたものを元にして新たに本を作るような場合などは、大量の赤字が手書きされていることも多く、本格的なテキスト入力が必要になることも珍しくありません。

また、原稿がテキストデータとして出来上がっていたとしても、きちんとしたものになっているとは限りません。複数の著者が書いた原稿であったり、異なる目的で書かれた文章をひとつにまとめるといった場合は、言い回しや表記などがバラバラになっていることもあり、それを統一する必要が出てきます。

こういった場合、ワープロソフトやテキストエディタでテキストの表記をひとつずつ修正していくというのはそれなりに時間がかかる作業です。それに加えて、修正箇所が多ければ多いほど作業ミスが出ることも考慮しなければなりません。

逆に言うと、原稿修正における時間やミスを少なくするには、原稿の修正を人間がひとつずつやっていくという作業をなくし、自動化を図るということが大切になってくるわけです。

ワープロやテキストエディタを使う処理

テキストを処理するソフトというと、Wordや一太郎といったワープロソフトや秀丸などのテキストエディタが定番です。これらのソフトには検索・置換機能が付いており、それを使うことで修正作業を正確かつ効率的に行うことができます。

ただし、語句をひとつずつ検索しながら置換していくのは非効率的ですし、処理が多ければミスが出るかもしれません。といっても、一括で置換すると、間違って直してはいけない部分を直す危険も出てきます。また、同じ語句であっても同じ置換でいいとは限らず、前後の状況によって修正内容が違うということもあり得ます。

そういった場合、正規表現を使うことで効率的な作業が可能になります。正規表現は文字列をパターンで扱うことができ、前後の語句をパターンとして検索することで置換しないケースを排除したり、あるいは前後の語句の順序の入れ替えなどを行うことができます。もちろん、正規表現を使うには正規表現に対応したソフトを使うというのが前提です。

また、通常の検索・置換機能だと検索と置換にそれぞれひとつの語句しか選べませんが、異なる複数の語句を一括で処理したいという場合もあります。ソフトによっては、マクロやアドインソフトなどを使い、複数語句を検索で指定してそれぞれに異なる置換を行う処理ができるものもあります。

そのほか、ワープロソフトには校正を支援する機能として表現のゆらぎなどをチェックしたり統一する機能が搭載されているものもあります。必要ないのにチェックされて煩わしいという声もある機能ですが、使いようによってはかなり有効な機能です。

Excelを使う処理

ワープロやテキストエディタだけですべてのテキスト処理ができるとは限りません。さまざまな処理を自動的に行うとなると、たとえ正規表現を使っても難しいものもあります。

場合によっては、Excelに代表される表計算ソフトを使うこともあります。表計算ソフトは、その名の通り数値など表計算のためのソフトですが、データ処理のための豊富な機能を備えており、それをテキストの処理にも活用することでワープロやテキストエディタの手の届かない部分を補うことができるわけです。

Excelの場合、さまざまな関数が用意されており、これを使って計算処理を自動的に行えるようになっています。この関数の中には、たとえば文字列の指定された個所の文字を置換するRELPACE関数やSUBSTITUTE関数、文字と文字コードの変換を行うCODE関数やCHAR関数など、テキストの処理に利用できるものも少なくありません。

また、IF関数のような関数を使えば、条件を指定して「この場合はこの処理、そうでない場合は別の処理」というような、より柔軟な処理を行うことも可能です。

もちろん、Excelはワープロやエディタではなく、あくまでセルで区切られた表を基本としたソフトですから、長文のテキストをそのまま処理するのには向きません。使えるケースは限られますし、ちょっとした工夫も必要になるかもしれませんが、使い方次第では強力なツールとして利用することができるはずです。

多くの場合、テキスト原稿がそのまま修正なしに印刷物になるということはほとんどないでしょう。むしろ、デジタル化が進むにつれて入力後の修正が必要な度合いも大きくなっているようにすら思われます。

テキストの修正は、テキストをDTPソフトに流し込んだ後でなく、できるだけ前工程で行うほうが効率的であり、ミスの危険も少なくなります。そのためには、テキストを処理することができるさまざまなツールを駆使することが重要になってきます。

(田村 2010.3.23初出)

(田村 2016.5.25更新)

技術情報

  • DTP全般
    • Adobe Bridge
    • Illustratorのアピアランス
    • Illustratorへの画像の貼り込みの問題
    • InCopyの可能性
    • JPEG 2000
    • OSとファイル名の関係に気をつけよう
    • RIP処理とデータの安全性
    • Version Cueのメリット
    • あらためてスタイル機能を考える
    • グラデーションの品質
    • デジカメ撮影の基本
    • デジタル時代の著作権問題
    • ノンブルの機能
    • ハイレゾ・バウンディングボックス
    • ピクセル深度とダイナミックレンジ
    • マスターオブジェクトのトラブル
    • レイヤー0の秘密
    • レイヤーを活用したワークフロー
    • レイヤーマスクの活用
    • 写真のゴミ取り
    • 半調の処理
    • 印刷を考えたデザイン
    • 平滑度と出力解像度
    • 数式の組版
    • 画像のシャープネス処理
    • 画像の切り抜き
    • 画像解像度と線数
    • 画像解像度のリサンプル
    • 索引
    • 索引作成ワークフローを考える
    • 線の幅
    • 自動組版の基本的な考え方
    • 貼り込み画像のポイント
  • InDesign(インデザイン)関連
    • InDesign(インデザイン)における文字組みと文字クラス
    • InDesign(インデザイン)における検索・置換のコツ
    • InDesign(インデザイン)における欧文組版の基礎
    • InDesign(インデザイン)のグリッド
    • InDesign(インデザイン)のソフトの互換性・リビジョンの違い
    • InDesign(インデザイン)のブックファイル
    • InDesign(インデザイン)の文字環境
    • InDesign(インデザイン)の画像出力
    • InDesign(インデザイン)データをXMLでコントロールするIDML
    • InDesign(インデザイン)出力のカラー設定
    • 「泣き分かれ」に泣く前に
    • オーバーライドを理解しよう
    • 特殊な“ノンブル”の配置方法
    • 縦組みの中黒「・」の怪
  • PDFのポイント
    • DTPの基本フォーマットになるPDF/X(其の一)
    • DTPの基本フォーマットになるPDF/X(其の二)
    • PDFのオーバープリントに注意
    • PDFのファイルサイズ
    • PDFのフォント環境
    • PDFを使ったデータのプリフライト
    • PDFプルーフの問題
    • PDF出力を考える
    • PDF校正を考える
    • PDF生成ソフトと安全性
    • 画像フォーマットとしてのPDF
  • カラーの話し
    • 2色印刷の色表現
    • RGB画像の色変換作業のポイント
    • カラーマネージメント その一
    • カラーマネージメント その三
    • カラーマネージメント その二
    • カラーマネージメント その四
    • カラーマネージメントを使わない出力
    • プロファイルを使った特色シミュレーション
    • 印刷物の色の評価と環境光
    • 色分解の基礎
    • 色温度
    • 色補正の基礎
    • 重要性を増すカラー設定
  • 入稿の注意
    • テキスト原稿のやり取りにおける問題
    • ファイルシステム
    • 入稿データと紙原稿
    • 原稿指定のあり方を考える
  • 文字について
    • OpenTypeフォントの字形管理
    • OpenTypeフォントの特徴と使い方
    • SINGの使い方と可能性
    • スペースの使い分け
    • テキスト原稿におけるデータ処理
    • フォントのアウトライン化を考える
    • フォントのフォーマットに気をつけよう
    • ルビ
    • 句読点
    • 和欧混植時の組版処理
    • 多言語組版の基本
    • 字形のコントロール
    • 引用符
    • 形式名詞や補助用言の扱い
    • 数字の扱い方
    • 文字の修飾
    • 文字コードをめぐる新しい動き(その1)
    • 文字コードをめぐる新しい動き(その2)
    • 文字コードをめぐる新しい動き(その3)
    • 文字コードをめぐる新しい動き(その4)
    • 文字サイズの単位
    • 文字列を揃える機能
    • 文字組版と可読性
    • 文字間隔のコントロール
    • 新しい常用漢字
    • 日本語の仮名遣いを整理する
    • 日本語表記の統一
    • 本文文字詰めを考える
    • 段落一字下げを考える
    • 波ダッシュ
    • 異体字セレクタ
    • 組版における行の扱い
    • 行で分割しない文字の処理
    • 行頭・行末のルールを考える
    • 表記の論理を整理しよう
    • 記述記号の扱い
    • 送り仮名
    • 今あらためてJIS2004への対応を考える
  • 製版・印刷
    • CIP3/CIP4のメリット
    • FMスクリーニングのメリット
    • オーバープリント
    • カラーを変える多色印刷
    • トンボと裁ち落とし
    • ハイブリッド印刷の可能性
    • プロセスレス・プレート
    • ベタ濃度とドットゲイン
    • モアレの防止
    • 印刷できない線
    • 環境にやさしい印刷のワナ
    • 紙と印刷の色
    • 製本で変わるページ配置
    • 透明効果
    • 高精細印刷
    • 黒のインクを知ろう
  • 電子出版の現状
    • DRMは電子書籍の必要悪か
    • EPUB 3に見る日本語組版機能
    • iPad登場で電子出版はどこへ向かう?
    • Kindle Fireは電子書籍市場をどう変えるのか
    • 「紙もデジタルも」が時代の流行
    • なぜKindleは売れるのか
    • デジタル化する教科書
    • 利益最大化を見据えた電子書籍戦略
    • 専用端末の普及と将来性
    • 日本版電子書籍端末の実力は?
    • 日本語電子書籍ファイルをどう作るのか
    • 電子出版の将来性
    • 電子出版時代のXML活用
    • 電子書籍が変える出版の形
    • 電子書籍とISBNコード
    • 電子書籍と画面解像度
    • 電子書籍におけるレイアウト再現
    • 電子書籍に求められるもの
    • 電子書籍に求められる品質とコスト
    • 電子書籍のゆくえ
    • 電子書籍の囲い込みは可能か
    • 電子書籍の新標準「EPUB」とは何か
    • 電子書籍の販売促進術
  • DTPワンポイントアドバイス
    • PDFでの入稿・納品
    • 原稿入稿の注意点
    • 校正の注意点
    • 索引・目次について
    • 色のポイント
    • 電子書籍とは何か
      • データ形式
      • 印刷物との連携
      • 電子書籍におけるレイアウト
      • 電子書籍の販売
このエントリーをはてなブックマークに追加
Tweet
Pocket

DTP技術情報ワード検索

カタログ制作について、お悩みではありませんか?

技術情報

  • DTP全般
    • Adobe Bridge
    • Illustratorのアピアランス
    • Illustratorへの画像の貼り込みの問題
    • InCopyの可能性
    • JPEG 2000
    • OSとファイル名の関係に気をつけよう
    • RIP処理とデータの安全性
    • Version Cueのメリット
    • あらためてスタイル機能を考える
    • グラデーションの品質
    • デジカメ撮影の基本
    • デジタル時代の著作権問題
    • ノンブルの機能
    • ハイレゾ・バウンディングボックス
    • ピクセル深度とダイナミックレンジ
    • マスターオブジェクトのトラブル
    • レイヤー0の秘密
    • レイヤーを活用したワークフロー
    • レイヤーマスクの活用
    • 写真のゴミ取り
    • 半調の処理
    • 印刷を考えたデザイン
    • 平滑度と出力解像度
    • 数式の組版
    • 画像のシャープネス処理
    • 画像の切り抜き
    • 画像解像度と線数
    • 画像解像度のリサンプル
    • 索引
    • 索引作成ワークフローを考える
    • 線の幅
    • 自動組版の基本的な考え方
    • 貼り込み画像のポイント
  • InDesign(インデザイン)関連
    • InDesign(インデザイン)における文字組みと文字クラス
    • InDesign(インデザイン)における検索・置換のコツ
    • InDesign(インデザイン)における欧文組版の基礎
    • InDesign(インデザイン)のグリッド
    • InDesign(インデザイン)のソフトの互換性・リビジョンの違い
    • InDesign(インデザイン)のブックファイル
    • InDesign(インデザイン)の文字環境
    • InDesign(インデザイン)の画像出力
    • InDesign(インデザイン)データをXMLでコントロールするIDML
    • InDesign(インデザイン)出力のカラー設定
    • 「泣き分かれ」に泣く前に
    • オーバーライドを理解しよう
    • 特殊な“ノンブル”の配置方法
    • 縦組みの中黒「・」の怪
  • PDFのポイント
    • DTPの基本フォーマットになるPDF/X(其の一)
    • DTPの基本フォーマットになるPDF/X(其の二)
    • PDFのオーバープリントに注意
    • PDFのファイルサイズ
    • PDFのフォント環境
    • PDFを使ったデータのプリフライト
    • PDFプルーフの問題
    • PDF出力を考える
    • PDF校正を考える
    • PDF生成ソフトと安全性
    • 画像フォーマットとしてのPDF
  • カラーの話し
    • 2色印刷の色表現
    • RGB画像の色変換作業のポイント
    • カラーマネージメント その一
    • カラーマネージメント その三
    • カラーマネージメント その二
    • カラーマネージメント その四
    • カラーマネージメントを使わない出力
    • プロファイルを使った特色シミュレーション
    • 印刷物の色の評価と環境光
    • 色分解の基礎
    • 色温度
    • 色補正の基礎
    • 重要性を増すカラー設定
  • 入稿の注意
    • テキスト原稿のやり取りにおける問題
    • ファイルシステム
    • 入稿データと紙原稿
    • 原稿指定のあり方を考える
  • 文字について
    • OpenTypeフォントの字形管理
    • OpenTypeフォントの特徴と使い方
    • SINGの使い方と可能性
    • スペースの使い分け
    • テキスト原稿におけるデータ処理
    • フォントのアウトライン化を考える
    • フォントのフォーマットに気をつけよう
    • ルビ
    • 句読点
    • 和欧混植時の組版処理
    • 多言語組版の基本
    • 字形のコントロール
    • 引用符
    • 形式名詞や補助用言の扱い
    • 数字の扱い方
    • 文字の修飾
    • 文字コードをめぐる新しい動き(その1)
    • 文字コードをめぐる新しい動き(その2)
    • 文字コードをめぐる新しい動き(その3)
    • 文字コードをめぐる新しい動き(その4)
    • 文字サイズの単位
    • 文字列を揃える機能
    • 文字組版と可読性
    • 文字間隔のコントロール
    • 新しい常用漢字
    • 日本語の仮名遣いを整理する
    • 日本語表記の統一
    • 本文文字詰めを考える
    • 段落一字下げを考える
    • 波ダッシュ
    • 異体字セレクタ
    • 組版における行の扱い
    • 行で分割しない文字の処理
    • 行頭・行末のルールを考える
    • 表記の論理を整理しよう
    • 記述記号の扱い
    • 送り仮名
    • 今あらためてJIS2004への対応を考える
  • 製版・印刷
    • CIP3/CIP4のメリット
    • FMスクリーニングのメリット
    • オーバープリント
    • カラーを変える多色印刷
    • トンボと裁ち落とし
    • ハイブリッド印刷の可能性
    • プロセスレス・プレート
    • ベタ濃度とドットゲイン
    • モアレの防止
    • 印刷できない線
    • 環境にやさしい印刷のワナ
    • 紙と印刷の色
    • 製本で変わるページ配置
    • 透明効果
    • 高精細印刷
    • 黒のインクを知ろう
  • 電子出版の現状
    • DRMは電子書籍の必要悪か
    • EPUB 3に見る日本語組版機能
    • iPad登場で電子出版はどこへ向かう?
    • Kindle Fireは電子書籍市場をどう変えるのか
    • 「紙もデジタルも」が時代の流行
    • なぜKindleは売れるのか
    • デジタル化する教科書
    • 利益最大化を見据えた電子書籍戦略
    • 専用端末の普及と将来性
    • 日本版電子書籍端末の実力は?
    • 日本語電子書籍ファイルをどう作るのか
    • 電子出版の将来性
    • 電子出版時代のXML活用
    • 電子書籍が変える出版の形
    • 電子書籍とISBNコード
    • 電子書籍と画面解像度
    • 電子書籍におけるレイアウト再現
    • 電子書籍に求められるもの
    • 電子書籍に求められる品質とコスト
    • 電子書籍のゆくえ
    • 電子書籍の囲い込みは可能か
    • 電子書籍の新標準「EPUB」とは何か
    • 電子書籍の販売促進術
  • DTPワンポイントアドバイス
    • PDFでの入稿・納品
    • 原稿入稿の注意点
    • 校正の注意点
    • 索引・目次について
    • 色のポイント
    • 電子書籍とは何か
      • データ形式
      • 印刷物との連携
      • 電子書籍におけるレイアウト
      • 電子書籍の販売

最近のお知らせ

  • 2025年06月02日
    技術情報 記事を更新しました
  • 2025年05月09日
    技術情報 記事を更新しました
  • 2025年04月16日
    2025 ゴールデンウィーク 営業日のお知らせ
  • 2025年04月15日
    技術情報 記事を更新しました
  • 2025年03月24日
    技術情報 記事を更新しました

PAGETOP
  • インフォルムロゴ
  • 品川サイト 〒140-0004
  • 東京都品川区南品川2-2-7 南品川Jビル 9F
  • TEL:03-5783-4080(代)/ FAX:03-5783-4081
  • 本社・川口サイト 〒334-0073
  • 埼玉県川口市赤井1-4-9 インフォルムビル
  • TEL:048-286-2666(代)/ FAX:048-280-1053
  • 会社情報
  • ごあいさつ
  • 会社概要
  • 所在地・アクセス
  • 級数表下敷き
  • ISO認証
  • 個人情報保護方針
  • 採用情報
  • 特定商取引法に基づく表記
  • 営業品目
  • InDesignによる組版
  • デザイン
  • DB自動組版
  • テキスト入力・加工処理
  • 書籍の編集業務
  • CD・DVDのコンテンツ制作・プレス
  • 画像加工・各種画像処理
  • 電子書籍の制作
  • 実績・設備
  • インフォルムが選ばれる理由
  • InDesignを使う理由
  • InDesignでのDTP制作実績
  • お客様の声
  • 品質の裏付け
  • DTP環境・設備一覧
  • 対応フォント
  • DTP技術情報
  • DTP全般
  • InDesign関連
  • PDFのポイント
  • 文字について
  • カラーの話し
  • 入稿の注意
  • 製版・印刷
  • 電子出版の現状
  • DTPワンポイントアドバイス
  • お問い合わせ

Copyright © Informe. All Rights Reserved.