目次
- 電子文書書法とは何か
- 情報資源のための文書作成
- 電子書法の指針
- 電子書法の実際
文書が従来のように最終的に印刷物の形態で利用されるのではなく,情報資源としての蓄積と再利用の対象として認識されるようになると,文章表現もこの目的に応じた様式へと変貌する可能性がでてくる. 言語表現として文書の`部品化'傾向が望ましいかどうかについては多いに議論すべきなのは言うまでもないが,コンピュータ利用の利便性を追及する結果として文章表現の変質を招く可能性があることを指摘しておく.
コンピュータ利用の最大の恩恵は,大量の情報を蓄積しそれらを総体として管理できることにある. 逆にいうならば,記憶できる程度のわずかな情報を扱うのであれば,コンピュータ利用自体を考え直してみるべきだ. 実際,洗練されていないコンピュータ管理よりはノートやカード類を使った従来の整理方式のほうがずっと効果的な場合がある.
コンピュータを使う以上,莫大なデータから必要なものを探し出し,それを分析・統合する能力が発揮できるように,情報を電子化しこれらを組織的に管理することが必要となる. CD-ROMなどの大容量メディアやコンピュータネットワーク環境の普及によって,大量の情報をいくらでも入手することが可能となっている かくして,コンピュータに蓄積された情報は巨大化する一方である.
電子文書書法は,情報資源として将来の再利用に備えて情報を蓄積しておくためのノウハウの一端である.
しかし,LaTeXやHTMLで文章を書かなくともベタ書きテキスト(プレインテキスト)をそのまま出力するだけでも十分役に立つことが多い. たとえば次の図のように,わざわざ表組みなどしなくても,-, = や+を使って,プレインテキストでも十分わかりやすい表を組むことができる.
|
我々自身は大量の情報を高速に処理・理解する能力を持っていまない. それを眺めるだけでも莫大な時間がかかってしまう. たとえば『不思議の国のアリス』は英文で約160KBで,原稿用紙200枚分の情報量だが, この程度の情報量ならネットワークを通じて簡単に入手できる. しかし,ざっと読むだけでも数時間はかかってしまう. つまり,文章をそのまま電子化(テキスト化)してあっても直ちに情報資源として有効に再利用できるわけではない.
文書の電子化あるいは電子文書を前にしてして考えるべきことは
- 特殊フォントの抑制
- 全角と半角文字の混在する日本語文に起因する特殊事情には注意を払う必要がある. 特に,半角カタカナは漢字コードの取り扱い上で問題が多いので使用しないこと. パソコンの機種に特有なフォントや`{\bf 外字}'などローカルな文字も使わないようにする. 他の機種やOSでも確実に読み書きできる文字を使うことが基本である.
- コメントの活用
- 文書の用途や意図,修正の履歴情報などをできるだけ詳細にメモ化してコメントとしておく. コメントを有効に活用することが,将来の情報資源として大きな意味をもたらす. コメントスタイルは処理方法に応じて様々であるが,プレインテキスト文書では,たとえば 行頭に『#』つけてその行をコメント行の印とするのが慣習である.
- 英数字や記号の表記
- 英数字や記号は半角文字で書く. コンピュータでは半角と全角文字は異種の文字として扱われる. 全角または半角のどちらかに統一して使うようにすればいいが,半角文字で表記するのが妥当である. テキスト処理ツール群を利用して検索処理などを行なう際,UNIXではコマンドラインに全角文字を入力することが難しい場合があるからである. LaTeXやHTMLの文書整形システムのためにテキストファイルを転用する際にも便利である.
- 個数表記
- 漢数字を個数表記には使わずに,「一個」よりも「1個」というように数字に統一すると検索処理には便利である. テキストから『数』を抜き出す文書処理の機会は案外と多く,十本とか百冊という表記では対応が難しくなるからである. 修辞学的に多少の無理がある場合も考えられますが,そのときには文書の目的を考えながら対応する.
- 空行と字下げ
- プレインテキストでは空行と字下げを効果的に利用し,段落の切れ目や見出しの前後に空行を入れてわかりやすい文になるように工夫する. テキストの行数が増えてもファイル容量にはほとんど影響しない. プログラムを書くときのように,字下げによって論理構造を浮きだたせるなど読みやすい記述を工夫をすること. このとき,全角空白でべた書きテキストのレイアウトを行わないこと. 文書処理の際に,例外処理となることがあるからである. LaTeXやHTMLなど文書整形システムを使って整形出力する場合には,こうした文字配置は自動的になされるので,テキストの段階でのこれらの工夫は不要であるばかりかむしろ逆効果となることもある.
- 1行の長さ
- 1行を長大にしてはいけない. エディタ(やワープロ)では,ウィンドウ幅に収まらない文を自動的に折り返してくれるので,1行の長さが長大になってしまい易い. 原則として,一つの文の終わりには必ず改行する. 短い行のほうが編集作業も容易になるからである. あた,システムや電子メールソフトウェアによっては,『長い1行』を表示することができない場合があるからである. 積極的に改行キーを使って文を書くようにする.
- 言葉の揺らぎ
- 用語の使い方を統一して,単語検索などに備えること. 「積み木」と「積木」,「コンピュータ」と「コンピューター」や「WHO」と「WHO」のように半角文字と全角文字の差異などの表記の揺らぎに常に配慮し,できる限り統一した表記を目指すこと.
- 見出し
- プレインテキストでは,目次の作成が容易な首尾一貫した見出しを付けること. 見出しの付け方や番号の振り方に一貫性を持たせて,あとから目次作成などの処理がしやすいように記述スタイルを統一する. LaTeX文書やHTML文書では見出しには定められたタグを付けるために,このような配慮は無用である.
たとえば,次のようなプレインテキストを考えてみよう.
......... 5. 桃太郎の筋力トレーニング 5.1. 足柄山の地理的特徴 昔々の足柄山には浦島太郎の祖父にあたる花咲彦蔵をはじめ数多くの伝説的 な人物が集っていた.富士山を近くに配する豊かな自然環境は .... .......... 6. 桃太郎の食生活 .........この文書では明らかに,「5. 桃太郎の筋力トレーニング」は節の見出しを表しており,「5.1. 足柄山の地理的特徴'」は項の見出しとなっている. したがって,これらの見出し部分に注目して,次のような目次の作成を考えたくなる.
......... 5. 桃太郎の筋力トレーニング 5.1. 足柄山の地理的特徴 5.2. タヌキ君との出会い 5.3. トレーニングメニュー 5.4. 水汲み作業の工 5.5. 持久力走との併用 6. 桃太郎の食生活 7. .........実際,このような目的のためにPerlやAWKなどのスクリプト言語がテキスト処理ツールとして使われる. 文の中から目次情報として抽出したいパターンを正規表現 として指定し,パターンマッチによってヒットした行を書き出すことで目次を作成することができる.
章や節を表す見出し文を含んだ文章を処理するためには一定のスタイルで書くことが大切である. たとえば
とか5.(2)タヌキ君との出会いや5-4 水汲み作業の工夫5.5 持久力走との併用など,統一のない形式を混在させることは好ましくない. 一つのテキストでは一貫した文書スタイルを心掛けるべきである.
電子文書書法の意図は,いまの必要性だけに迫られて書くのではなく,作成した文の将来的な再利用を念頭において文章を書くという姿勢を維持することにある. 今後,多くの文書が電子化されてコンピュータ上で情報資源として活用されるようになっていく. どのような文章表現が妥当であるのかは,実際の利用における試行的模索によって見いだされていくべきであろう.