ディジタルサウンド

ここがポイント!
音と映像を駆使するマルチメディアコンテンツ制作では,音声情報に関する知識が欠かせない.マルチメディア検定でも,アナログ信号である音声をディジタル化(A口変換)するための基本方式として,POMや口OTなどの基礎知識が試される.また,実際にコンピュータが音声を鳴らす(再生する)ための装置(音源)として,PCM音源,FM音源,そしてMlDI音源も必須の知識である.

PCM

PCMは,アナログ音声信号をディジタル信号に変換し,搬送する変調方法で,1937年にフランスのり一プスによって発明された.この発明は1948年にシャノンが「情報理論』を発表したことによって,一躍脚光を浴びるようになった.しかし,当時の実験用試作ではPCMは回路技術の複雑さに加えコストが高いことから,その後の研究の進展はなかった.本格的にPCMが注目されるのは,コンピュータがトランジスタからICを用いたものへ発展を遂げていく過程の中であった.マルチメディア時代に入って,画像情報や音声情報に対する重要性の認識が高まり,PCMが音声データの搬送方法として,より一層注目されるようになった.CDやDATはこのPCM方式を採用している.

PCMの基本系構

PCMの基本系統は,「標本化→量子化→符号化」である.標本化では,連続なアナログ信号から一定間隔ごとにとびとびの信号を抽出する.標本抽出の意味からこの作業を標本化と呼ぶ.量子化は,とびとびに抽出

図1 標本化,量子化,符号化

サンプルレート

された信号の振幅の大きさを数値化することをいう.符号化は,量子化された振幅をコンピュータが理解できる2進数で表す作業をいう.

PCMの精度

PCMにおける標本化では,ある時点ごとに振幅を抽出するが,これは連続信号を図2に示すような階段状の図形に近似していることになる.したがって,1秒間に行う標本化の数,すなわち標本化周波数(サンプルレート)を増やすことによって近似精度が上がる.また,量子化では,想定している最大振幅をある決められたステップ数に分割し,アナログ信号の振幅を,そのステップ幅を単位とした整数値で近似している.例えば図3では8ステップ(3ビット)に分割したスケールを用いているが,アナログ信号の振幅が4と5の間の値であるにもかかわらず,量子化の値は4となる.そこで,量子化の精度を上げるためには,全体を分割するステップ数(ビットレート)を増やす必要がある.
以上からわかるように,サンプルレートとビットレートを無限に上げない限り,PCMでディジタル化された音声は元の音声より情報量が少ない.

図2サンプリングによる近似

図3量子化近似

ADPCM

PCMではサンプルレートやビットレートが大きい方が音質が良い.しかし実際は,コンピュータのメモリや記録媒体の容量を考慮すると十分なレートを設定することができない場合が多い.そこでPCMに工夫を加え,音声情報を圧縮するためにADPCM(適応PCM)方式が考えられた.
一般の音声波形を標本化するとき,隣どうしのサンプル信号は互いに近い値をとることが予想される.そこでADPCMでは,隣接するサンプル信号の差分を量子化する.これによって,全体の振幅が大きい波形でも小さいビットレートで十分に量子化できる.ADPCMはISDN,衛星通信そして長距離通信で利用されている.

DCT

この方式は離散コサイン変換,またはフーリエ変換と呼ばれているものである.通常私たちの周りに存在する任意の波形は,いくつかのコサインカーブとサインカーブにある重みをかけて足し合わせたもので表現できることがわかっている.このとき,コサインカーブの周期と足し合わせるときの重みを音声情報として量子化する方式がDCTである.DCTはTV電話,移動電話,自動車電話など広く採用されている.

図4 DCT方式

ATRACとPASC

ATRACとPASCでは,ほぼ同様の手順で音声情報を圧縮する.まず,元の音声信号をあらかじめいくつかの周波数帯に分割し,次に分割された音声信号をDCTで符号化する.また,最小可聴レベル(後述)以下の周波数をカットしたり,マスキング効果(後述)と呼ばれる心理聴覚特性も利用される.ATRACはMDに,PASCはDCCに採用されている.


最小可聴レベルとマスキング効果

人間が音声を聞く場合,ある程度大きな音でないと聞こえない周波数領域がある.これを最小可聴レベルと呼ぶ.また,ある強い音が存在すると,その周辺の弱い音は聞こえないという心理聴覚特性をマスキング効果と呼ぶ.

図5 可聴レベルとマスキング効果

PCM音源

PCMデータを再生する音源(音を鳴らすための装置).PCMは,先に述べたように本物の楽器から出た音を「標本化→量子化→符号化」の手順で録音することからサンプリング方式とも呼ばれる.


FM音源

FM音源は,先に解説したDCTの逆の作業を行って音声を鳴らす音源と覚えてもよい.ただし,DCTではサインカーブを足し合わせるのに対して,FM音源は,音色の異なる複数の音源データを組み合わせてさまざまな新しい音色を作り出す.FM音源をはじめて採用したシンセサイザとして,ヤマハのDX-7が有名である.


MIDI音源

MIDIは,2・3節で詳しく解説するが,電子楽器とコンピュータの接続と制御方式を定めたプロトコル規格である.MIDIデータの特徴は,PCMなどに比べて,少ない情報で音楽を表現するのに必要なパラメータを伝送できる点である.

練習問題

1 音楽用CDは44.1kHzの標本化周波数が採用されている.1語長16ビットのCDのステレオ信号を送る場合,最低どの程度の伝達性能(Kbps)を必要とするか,解答群から選べ.

〈解答群〉
ア.700kbs
イ,800kbs
ウ.1400kbs
エ.1500kbs

2 次のa.〜i.の文章の□を埋める適当な語句を解答群より選べ.

a.人間が音声を聞く場合,ある程度大きな音でないと聞こえない周波数領域がある.これを□と呼ぶ.
b.□ま,アナログ音声信号をディジタル信号に変換し,搬送する変調方法で,1937年にフランスのリーブスによって発明された.
c.□はMDに採用されている圧縮方式である.
d.□はDCCに採用されている圧縮方式である.
e.ある強い音があると,その周辺の弱い音は聞こえないという心理手聴覚特性を□効果と呼ぶ.
f.□はTV電話,移動電話、自動車電話など広く採用されている.
9.□はISDN,衛星通信そして長距離通信で利用されている.
h.PCMにおける□では,連続なアナログ信号から一定間隔ごとにとびとびの信号を抽出する.
i.PCMにおける□は,量子化された振幅をコンピュータが理解できる2進数で表す作業をいう.

〈解答群〉
ア.ATRAC
イ.PASC
ウ.最小可聴レベル
エ.マスキング
オ.PCM
カ.ADPCM
キ.標本化
ク.DCT
ケ.符号化

2.2 音の3要素,音場再生,エフェクター

ここがポイント!
質の良い音声がコンピュータで再生可能になるにつれて,マルチメディアコンテンツの作成に,音響・音楽の知識が必要とされる場面が増加してきた.検定でも音響に関わる知識が試される問題が多く出題されるそこで,一般の音響音楽の知識の中で,コンピュータ上で音声を扱うときに必要となる項目は理解しておく必要がある.

音の3要素

すべての色は赤,青,黄の3原色を混ぜ合わせることによって作られることはよく知られている.音も,音程,音色,音量の三つの基本要素を組み合わせることによってすべての音色を作り出すことができる.
◆音程 音程は二つの音の周波数の隔たりを表す言葉で,「度」という単位を用いて表す.たとえば,譜面に示される,ドの音とレの音の音程は1度である.また,ある高さのうとその一つ下のうの音程は「8度」である(8度の音程を特別に,オクターブと呼ぶ).音楽の世界では基準となるラ音の周波数を440Hz(442Hzやそのほかの場合もある)としている.このとき基準のうの1オクターブ上の音程は880Hzである.このようにオクターブの音程では周波数の比が2である.
ピアノの鍵盤にはオクターブの間に12個のキーがある.各キーには周波数の比が一定になるように1オクターブを12分割した音程が割り当てられている.これを12平均率音階と呼ぶ.
■音量 音量には以下に解説する音圧とphoneがある.また,関連事項としてダイナミックレンジがある.
(i) 音圧音量は,音波の振幅の大きさ(図2)に相当する.しかし,同じパワーをもつ音波であっても,音波が伝わる媒体によって振幅の大きさは異なる.そこで,実用的には,音のパワーを表す「音圧」を用いて音量を表す.音圧は,音を伝える媒質中の気圧(圧力)が音のないときの気圧より高くなった変化分である.音圧は指数的に値を変化させるので,通常は基準音圧との比の対数をとった音圧レベルを使う.うまり,音圧レベルの単位はdBである.
(ii) phone音圧レベルは物理的な音波の振幅であるから,人間の実際の感覚とは異なる場合が多い.つまり,音色やそのほかの要素によって,同じ音圧レベルの音声であっても音量が異なって聞こえる場合がある.このような,人間の感覚を基準にした音量の単位がphoneである,ある音のphone数は,その音と同じ音量に聞こえる周波数1kHzの単一正弦波(サインカーブ)の音圧レベルである.たとえば,20phoneの音量は,20dBの周波数1kHz単一正弦波と同じ音量に聞こえる.
(iii) ダイナミックレンジ最大音圧と最小音圧の差をダイナミックレンジという.単位はdBである.音楽用のCDに記録可能なダイナミックレンジは96dBで,人間の耳で聞くことのできるダイナミックレンジは120dBである.マイクロフォンなどでダイナミックレンジを超えた音声信号を出力するとディストーション(歪み)が生じ,人間の耳にダイナミックレンジを超えた音声信号を入力すると耳が痛くなったり鼓膜が破れたりする.

図1 音程と音量(模式図)

●音色 音色は,音声のもっている属性から,高さ(絶対的な音程)と音量を取り除いた部分を指す.人間の声の違い,楽器の音色の違いはこの音色によって決まる,音色を決定する要素にはエンベロープと倍音がある.以下にそれぞれを解説する.
(i) エンベロープ 音の立ち上がりから減衰して聞こえなくなるまでの音量の変化のパターンをエンベロープと呼ぶ.私たちの身の周りに存在する音にはそれぞれ固有のエンベロープがある.

図2ピアノのエンベロープとフルートのエンベロープ

(ii) 倍音 音声信号には,一つの周波数だけでなく,複数の周波数の成分が含まれている.その中で,最も低い周波数の成分を基音と呼び,基音より高い周波数の成分を倍音と呼ぶ.エンベロープと同様に,私たちの身の周りの音はそれぞれ固有の倍音構成をもっている.

図3 基音と倍音

図4 倍音の多い波形

音場再生技術

同じ音源から発せられた音声であっても,それが人の耳に届くまでには,壁にぶつかって反射したり,ある倍音だけが増幅されたり,吸収されたりして,元の音とは異なる音色で人の耳に届く.このように,実際に音声が人の耳に届くまでの道筋を含む空間を音場という.音場の典型例はホールである.そして,音場に響く音声を再生することを音場再生という.
音場再生の技術として,以下に二つの例を紹介する.
◆ホール音場再生 音波がホールの壁にぶつかったときに増幅,または吸収される倍音および残響として残る倍音(反射音)をシミュレートする.これは,実際にホールに響く音を再現するための技術である.
●サラウンド音場 再生人間の耳は二つあり,目と同様に,両耳の聞こえ方の違いから音の奥行きや広がりを感じとることができる.このように,音の奥行きや広がりを再現する技術をサラウンド音場再生と呼ぶ.
サラウンド音場再生を実現するために,ダミーヘッド(二つのマイクが装着された,人間の頭の形をした人工頭と呼ばれる録音装置)を用いて録音された音声を再生する技術もある.
エフェクタ
音場の再生には,反射音や残響音をシミュレートする技術のほかに,音声信号をエフェクタと呼ばれる回路に通すことによって音声を加工する技術がある.以下では代表的なエフェクタを紹介する.

◆イコライザ 入力音波に含まれる特定の倍音(周波数帯)を増幅または吸収するエフェクタ.音色を変化させるときに用いられる.
◆ピッチコントローラ ハーモナイザ,ピッチチェンジャとも呼ばれるエフェクタで,音色を変えずに音程を変更することができる.
◆コンプレッサ,エキスパンダ,リミッタ コンプレッサは音量を小さく,エキスパンダは音量を大きくするエフェクタ.リミッタは一定レベルを超えた音量をカットする.
◆フェーダ 音の立上がりや立下がりをスムーズにするエフェクタ.フェイドイン,フェイドアウトの効果を与える.
◆ミキサ 複数の音声信号を合成するためのエフェクタ.
◆ディレイ 指定した時間だけ遅らせた音声信号と,元の音声信号を合成するエフェクタ.余韻を残す効果がある.
◆エコーマシン エコー効果を与えるエフェクタ.ディレイを繰り返しかけることによって,残響効果を与えるエフェクタ.
◆リバーブレータ 延長時間の異なるディレイを複数加えることによって,広い空間での残響をシミュレートするためのエフェクタ.

練習問題

次のa.〜j.の文章の□を埋める適当な語句を回答群より選べ.

a.□は二つの音の周波数の隔たりを表す言葉である.
b.□ま,音波の振幅の大きさに相当する.
C.□ま,音を伝える媒質中の気圧(圧力)が音のないときの気圧より高くなりた変化分である.
d.人間の感覚を基準に音量を表したい場合□という単位を用いる.
e.最大音圧と最小音圧の差を□という.
f.音の立上がりから減衰して聞こえなくなるまでの音量の変化のパターンを口と恥
g.音声信号の中で,最も低い周波数の成分を基音とよび,基音より高い周波数の成分を□と呼ぶ.
h.音の奥行きや広がりを再現する技術を□音場再生と呼ぶ.
i.延長時間の異なるディレイエフェクトを複数加えることによって,広い空間での残響をシミュレートするためのエフェクタを□と呼ぶ.
j.□は音色を変化させるときに用いられるエフェクタである.

〈解答群〉
ア.音程
イ.音量
ウ.音圧
エ.phone
オ.リバープレータ
カ.イコライザ
キ.サラウンド
ク.ダイナミックレンジ
ケ.エンベロープ
コ.倍音



2.3 DTMとMIDI

ここがポイント!
コンピュータを使った音楽全体を総称してコンピュータミュージックと呼ぶが,特にパソコンを利用して簡単に机の上で作曲・編曲をすることをDTM(デスクトップミュージック)という.口TMに欠かせなし、MIDIに関する事項は検定に出題される可能性が高い.

MIDl

MIDIは1982年,ドイツのOberheim社,日本のROLAND社,米国のSequential Circuit社らによって提唱された音楽関連の統一規格である.「どの音程をどのような音色でどのくらいの時間鳴らすか」という情報を8ビットで構成データを用いてやり取りするためのインタフェース規格で,ステータスとデータの2種類に分けられている.
以下では,これら二つのメッセージの働きとその見分け方を解説する.また,実際にMIDIデータを送受信するときに必要となる知識としてMIDIチャネル,MIDIインタフェース,MIDI端子,MIDIシーケンサそしてシーケンスソフトについて解説する.

図1MIDIデータ

●ステータスメッセージ このメッセージは,「鍵盤が押された」または「ピッチホイールが操作された」など,今起こった出来事(イベント)が何であるかをMIDI音源に伝えるためのメッセージである.
●データメッセージ このメッセージは,ステータスメッセージの後に送られるメッセージで,イベントの詳細を決定するパラメータを表すデータである.たとえば,ステータスメッセージが「鍵盤が押された」(ノートオンメッセージ)であったとき,それに続くデータメッセージは「どの鍵盤が押されたのか」と「どのくらいのベロシティで押されたのか」を示す.
◆ステータスとデータの見分け方 送られてきたメッセージがステータスなのかデータなのかは,コードナンバーの違いによって識別される.
8ビット情報では,0から255までの数値を表すことができるが,前半の0から127まではデータメッセージ,後半の128から255まではステータスメッセージと決められている.
◆MIDIチャネル MIDIは複数の楽器を同時に制御して演奏を行うために16個のチャネルが用意されている.つまり,16台の異なるMIDI楽器を同時に使って演奏することができる.チャネル情報はMIDIデータのステータスメッセージに含まれている.
◆MIDIインタフェース MIDIデータは単なる8ビットのディジタル信号であるから,MIDIデータを出力しただけでは音を鳴らすことはできない.そこで,実際にMIDIを用いて演奏するには,MIDIデータを音源または楽器が読み取れる信号に変換する必要がある.このような機能をもったインタフェースをMIDIインタフェースという.
◆MID1端子 MIDIインタフェースを備えた音源,または楽器間でのMIDIデータのやり取りは,5ピンのDINコネクタつきのケーブル(MIDIケーブル)を通じて行われるが,情報の伝達方向が一方向に限られているのが特徴である.したがってほとんどのMIDI機材は,MIDI IN,MIDI OUT,MIDI THRUの三つの端子(MIDI端子)を備えている.
MIDI INは,外部MIDI機材から本機材へのMIDIデータの入口で,MIDI OUT,またはMIDI THRUと接続される.MIDI OUTは,本機材での演奏内容を伝えるMIDIデータの出口で,MIDI INと接続される.MIDI THRUは,外部MIDI機材から本機材へ入力(MIDI INに入力)されたMIDIデータを,何も手を加えずにそのままもう一つの外部MIDI機器へMIDIデータを出力するもので,MIDI INと接続される(本機材での演奏内容は出力されない).

図2MIDl端子

◆MIDlシーケンサ MIDIデータをシンセサイザやサンプラーなどのMIDI音源または楽器へ送信し制御する自動演奏装置がシーケンサである.ハードウェアとしてのシーケンサもあるが,パソコンを用いたDTMではシーケンスソフトが用いられることが多い.
◆シーケンスソフト コンピュータにMIDIデータを記録するためのインタフェースをもったソフトウェアをシーケンスソフトと呼ぶ.シーケンスソフトのインタフェースの代表的なものには,数値による表現,バーによる表現そして音符による表現がある.
(i) 数値による表現 数値による表現はパソコンのテンキーだけを使って入力できるため,慣れれば入力速度は速いが,音楽的な意味合いや音程の動きを読み取るのが難しい.
(ii) バーによる表現 バーによる表現の優れた点は,実際の演奏に出現する微妙な音長を視覚的に表すことができることである(実際に演奏家によって演奏される場合,それぞれ音の長さは音符で示された音長と微妙に異なる).
(iii) 音符による表現 音符による表現は,音楽の基礎知識をもったユーザに受け入れられやすい表現であるが,実際の演奏に近づけるために,別にテンポやベロシティを変更する必要がある.

MIDIデータの流れ

実際にMIDIデータがどのように流れるかを,パソコンをシーケンサとしてMIDI音源に接続した場合について解説する.
◆パソコンからのMIDlデータ出力 パソコンで編集されたMIDIデータはシリアルポート(Macintoshの場合モデム,またはプリンタポート,DOS/V機の場合RS-232C端子,または専用のMIDIポート)から出力され,MIDIインタフェースを備えた音源に送られる.
■MIDlINからの入力 MIDI IN端子を通じてMIDIデータを受け取った音源は,ステータスメッセージに含まれるチャネル情報をその音源が設定されているチャネル情報と照らし合わせる.そして両者が一致したときだけ,それに続くデータメッセージの内容にしたがって音を鳴らす.
●MDI THRUからの出力 MIDI INから受け取られたMIDIデータは,そのままMIDI THRUから出力される.

●MID1OUTからの出力MID1OUTからはその楽器で演奏された内容がデータとして出力される.MIDITHRUからは演奏内容は出力されないことに注意.

図3MIDIデータの流れ

MIDI音源としてのシンセサイザとサンプラー

現在では,簡単にパソコンにMIDIシーケンサとMIDI音源を内蔵することができる.しかし,パソコンが普及する以前は,MID1音源と言えばシンセサイザとサンプラーが代表的なものであった.ここでは,この二つの音源について解説する.
◆シンセサイザ 送られてきたMIDIデータに基づいて,実際に音を発する楽器がMIDI音源であるが,その代表的なものはシンセサイザである.シンセサイザは電子回路で音を合成し,さまざまな音を発生させる装置である.疑似的な楽器音や各種の動物の音声を合成して発生させるシンセサイザもある.楽器音を発生させるものには,アナログ式とディジタル式のものがあり,ディジタル式のものは,FM音源やPCM音源を使用しているものが多い.
■サンプラー 複数の音色の異なる音声信号を重ね合わせて目的の音色を作りだすシンセサイザと異なり,サンプラーはディジタル録音された生の音声をそのまま再生する方法で音を出す.サンプラーは録音できる音ならば動物の鳴き声や空缶を叩く音でも好きな音程で鳴らすことができる.もちろん,MIDIインタフェースを備えたサンプラーもある.

練習問題

MIDIシーケンサがインストールされているパソコン,およびMIDIインタフェースを搭載したシンセサイザとサンプラーを下図のようにケーブルで接続すると,2台の音源を同時に鳴らすことができた.図中の接続端子の名前をそれぞれ解答群より選べ.

〈解答群〉
ア,MIDI IN
イ.MIDI OUT
ウ.シリアルポート
エ.MIDI THRU


ドローツール,ペイントツール,フォトレタッチツール

ここがポイント!
パソコンを用いた2次元静止画像の作成や加工には,ドローツール,ペイントツールそしてフォトレタッチツールと呼ばれるソフトウェアが頻繁に用いられる.マルチメディア検定では,これらのツールを使いこなすために必要な知識と,画像形式の知識が必ず試される.

ベクトル画像とドローツール,

ベクトル画像は,直線や曲線の情報を点と点を補完する数式として定義する画像である.したがって,ベクトル画像では,図形をどのようなサイズに拡大,または縮小しても粗くなったり滑らかさに欠けたりすることがない。一般にドローソールと呼ばれるものは,ベクトル画像を描くためのソフトウェアまたはツールを指す.

図1 ベクトル画像*

図2 ラスタ画像
(財)画像情報教育振興協会 マルチメディア検定3級 平成10年度「前期1間旭より

ラスタ画像とペイントツール

ラスタ画像は,画像を行と列に細かく(例えば640×480に)分割し,各セル(ピクセル)に色や明るさを定義する画像である.ビットマップと呼ばれる場合もある(ただし,厳密にはビットマップ画像は,各ピクセルが白と黒だけであるモノクロ2階調の画像をいう.灰色を含むモノクロのラスタ画像はグレースケールビットマップ,色情報をもつラスタ画像はカラービットマップと呼ばれる).ラスタ画像は,拡大した場合に四角形のピクセルが見えて,図形の輪郭部分にはジャギー(ギザギザ)が現れるのが特徴である.ラスタ画像を描くためのソフトウェア,またはツールをペイントツールと呼ぶ.大きなサイズのラスタ画像を扱う場合,一般的にはベクトル画像のファイルよりサイズが大きいことに注意する必要がある.


フォトレタッチツール

ラスタ画像の中で,幅広いグレースケール(例えば16階調)と多種類(例えば256種類)の色から構成される写真などの画像を編集するためのソフトウェアまたはツールをフォトレタッチツールと呼ぶ.代表的なフォトレタッチツールにはAdobe社のPhoto shopがある.


フィルタ

フォトレタッチツールで頻繁に利用される機能にフィルタがある.フィルタは,画像の各セルの位置を移動したり,色を変更したりする機能で,代表的ものには以下のようなものがある(図3〜図8参照).
●シャープ 周囲のピクセル群と明るさの異なるピクセルを輪郭として認識し,その部分のコントラストを強くして,よりシャープな画像を得る.
●ボカし 輪郭部分のコントラストを下げることにより輪郭強調とは逆に輪郭をボカす.
●エンボス 浮き彫りにしたような画像に変換する.
●ポスタリゼーション 画像の階調変化を段階的に変化させ,なだらかな濃淡をなくして平板な色調の画像に変換する.
●輪郭抽出 周囲のピクセル群と明るさの異なるピクセルを輪郭として抽出し,描画する.


ガンマ曲線を用いたフィルタ

図9に示されるような入力レベルと出力レベルの関係を表した曲線をガンマ曲線と呼ぶ.ガンマ値は図中に示された傾きの大きさを表す指標である.このガンマ曲線をフィルタに用いることにより,コントラストを調整することができる.1より大きいガンマ値を用いると,明るい部分がより強調され,1より小さいと暗い部分が強調される.

図9 ガンマ曲線

2値化

写真画像のように,各ピクセルがさまざまな濃さのグレーに設定されている画像を階調画像という.これに対して,各ピクセルが白または黒だけに設定されいる画像を2値画像という.2値化とは,階調画像を2値画像に変換するデータ処理のことである.2値化に必要な技法を紹介する.
●閾値法 ある濃度以上の階調のグレーピクセルを黒に,それ以下の濃度のグレーピクセルを白に変換する方法.このとき用いる基準濃度の値を閾値と呼ぶ.この閾値を適当な値に設定することにより,汚れ部分を取り除くことができる.
●ディザ法 グレーの部分をピクセルに分解し,その階調度に従って白と黒のピクセルの集合に変換する.ピクセルの分割が細かければ,人間の目にはグレーに見える.ファクシミリや,濃度差の出せないカラープリンタがこの方式を用いている.
◆網点化法白 地に黒の網目模様を用いてグレーを表現する.細かい網目を用いることにより,ディザと同様に人間の目にはグレーに見える.
モノクロプリンタでグレーを表現する場合にこの方式を用いている.

図3 元の画像

図4 シャープ

 

図5 エンボス

図6 ボカし

図7 ポスタリゼーション

図8 輪郭抽出

図10 ガンマ曲線をフィルタに用いた処理

図11 閾値法による2値化

図12 ディザ法

図13 網点化法


レタッチ

画像の汚れ部分をきれいにしたり,使用目的に合わせて修正を加えたりする作業をレタッチという.フォトレタッチツールの名はこれに由来する.以下に代表的なレタッチ手法を紹介する.
◆ピクセルコピー ピクセルデータをコピーして別の場所に複製する.
◆ブラッシング ブラシを用いて色を塗ったような効果を得るツール.
◆トリミング 画像の中で指定した部分だけを残すツール.
●マスク 修正の対象とならない部分を指定する.


練習問題

下のa.〜j.の文章の□を埋める適当な語句を回答群より選べ.

a.□画像は拡大してもギザギザが現れない.
b.通常,ペイントツールで描いた絵は□画像である.
C.ビットマップを構成する最小単位を□と呼ぶ.
d.□を使うと,浮彫りにしたような効果が得られる.
e.□を使うと,なだらかな濃淡の変化をなくし,はっきりした画像を得ることができる.
f.口直を大きくすると,コントラストが強くなる.
9.各ピクセルがさまざ縦に設定されているグレー画像を□という.
h.各ピクセルが白または黒だけに設定されている画像を□という.
i.画像の柵をきれいにし,修正を加える作業を□という.
j.細かい網目模様を用いてグレーを表現する方法を□という.

〈解答群〉
ア.2値画像
イ.レタッチ
ウ.ピクセル
エ.エンボス
オ.網点化法
カ.ガンマ
キ.階調画像
ク.ラスタ
ケ.ベクトル
コ.ポスクリゼーション


文字コ一ドとフォント

ここがポイント!
文字を計算機で扱うために,文字ひとつひとつに文字コードが割り当てられる.文字コードの集まりが文字セットで,これに対して文字の形や大きさなどをデザインしたものがフォントである.

ASCIIとJIS X 0201

■ASCII 文字を1バイトで表した文字コードが1バイトコードで,28=256文字まで一度に表すことができる.また,2バイト=216=65536文字を表せるコードが2バイトコードである.欧文の場合はASCIIコードが典型的な1バイトコードである.ASCIIコードは1バイトのうち7ビットに英数字,記号,改行などの制御コードが割り当てられる.残りの1ビットはパリティビットで,誤り検出に用いられる.
■JIS X 0201 ASCIIのパリティビットに相当する部分を利用してカタカナを割り当てた和文用1バイトコード.このコードの128から255の間に割り当てられたカナ文字を慣習的に半角カナという.
◆7ビットコードと8ビットコード ASCIIコードのように,実質的には1バイト中の7ビットしか使わない文字コードを7ビットコード,JIS X 0201のように8ビットすべてを使うコードを8ビットコードといり.
源字コード
●JlS X 0208 漢字も扱えるようにした和文の文字セットがJIS X 0208である.仮名,英数字,記号,常用漢字を含む第一水準文字3489字と,人名や地名などに使われる第二水準の3390字に分かれる.JIS X 0208を計算機上で扱うための2バイトのコードに,JIS,EUC,SJISの3種類がある.
●JISコード 単にJISコードと呼ばれることが多いが,JIS X 0201やJIS X 0208と区別するために,国際規格としての名称1S0 202 2JPを使うほうがよい.日本最初の学術的実験インターネットであるJUNETで使われ,このためJUNETコードともいう.
■EUC 拡張UNIXコード.日本のほかにも韓国,中国などで独自の規格があり,日本語のコードは特にEUC-JPという.UNIXでは,電子メールにはJIS,そのほかの漢字コードにはEUCと使い分けてきた.
◆SJIS PC/AT互換機やマッキントッシュなど,パソコンで使われる文字セット.JIS X 0201とバイト単位で重ならないように,JIS X 0208のコードをシフトさせて作った文字コードである.

●そのほかの文字セット JIS X 0208と関係なく,中国や韓国,台湾の似た漢字を同じコードで表した文字セットにUnicodeがある.2バイト65536字で世界中すべての文字を表そうとするものであり,JavaやWindows NTなどで採用されたが,漢字圏からの批判が多く,規格化・普及は難航している.

フォント

文字の書体,あるいは字体のこと.和文ならば,新聞,雑誌などで最も広く使われている細明朝体見出し語などに使われる中ゴシック体が標準的に使われる.POP体や丸ゴシック体などはチラシ広告などに使われる.
欧文には,ルネサンス期に古代ローマの碑文を復興したローマン体が最も広く使われ,明朝体と同様に縦線が横線より太く,また明朝体のウロコに相当するセリフが特徴的である.セリフがないヘルベティカ,ペン字風のイタリック体もある.そのほか,基本フォントから斜体や太字体などが派生する.

図1 各種のフォント

◆フォントファミリーとフォントサイズ フォントは書体名と大きさで指定されるが,書体名はフォントファミリー,大きさはフォントサイズとも呼ばれる.フォントサイズはpt(ポイント)で表される.1ptは約1/72インチ,1インチは約25.4mmであるから,1ptは0.35mm程度である.インチはアメリカやイギリスで慣習的に使われる長さの単位.画素数や解像度もインチ単位のdpiで表されることが多い.
■ビットマップフォントとアウトラインフォント フォントは文字セットと対応させて計算機の上で扱われる.文字形状をフォントとして数値化する方法には大きく分けて二つある.一つは,文字をビットマップとして標本化する方法で,こうして得られるフォントをビットマップフォントという.もう一つは文字の輪郭線を直線や円弧などの数式で表したもので,アウトラインフォントという.
ビットマップフォントは,フォントサイズが固定されている場合には都合がよい.アウトラインフォントは,ディスプレイに表示するたびに輪郭線の内側を塗りつぶしてビットマップデータに変換(ラスタ化)するため,計算コストが大きいが,文字を自由に拡大・変形でき,常に高品質な文字表現が可能である.

図2 ビットマップフォントとアウトラインフォント

図3 アウトラインフォントのラスタ化

◆等幅フォントと可変幅フォント 文字幅や間隔が一定のフォントを等幅フォントというが,これに対して文字幅が文字によってそれぞれ違うフォントを可変幅フォントという.和文は原稿用紙のマス目に文字を埋めていくように,縦横整列した等幅・等間隔で書かれることが多い.しかし,欧文フォントはそのほとんどが可変幅フォントである.

図4 等幅フォントと可変幅フォント

練習問題

下の文章はフォントと文字セットの関係について述べたものである.□を埋める適当な語句を解答群より選べ.

フォントと文字セットはどちらも文字の集まりを指すが,フォントは文字の書体や大きさを,文字セットは文字のコードを定めたものである.文字コードはJISやISOなど,国内外の標準化組織によって定められており,[a.],[b.],[c.]などがある.[a.]は英数字や改行などの制御コードを1バイトで表した文字セット,[b.]は[c.]に半角カナを追加したものである.また,[c.]はJIS X 0208に基づいた和文の2バイト文字セットの国際規格であり,電子メールなどやネットニュースなどで標準の文字セットとして用いられている.インターネットでは文字化けなどの問題を起こさないように,明確に定められた文字セットを用いるか,またはヘッダで文字セットを明示する必要がある.
フォントには,サイズが固定された[d.]と,サイズに依存しない輪郭線で定義された[e.]の2種類がある.DTPの発達に伴って[e.]が主流になってきている.

〈解答群〉
ア.IEEE1394
イ.IS0 2022 JP
ウ.JIS X 0201
工.ASCII
オ.EUC-JP
カ.SJIS
キ.アウトラインフォント
ク.プロポーショナルフォント
ケ.ビットマップフォント


DTP

ここがポイント!
かつて出版は,執筆,作図,校正,組版,製版,印刷,製本などの多くの工程に分かれていたが,DTPによって,執筆から組版までを,デスクトップ環境で,ごく少ない工程で行うことが可能になった.

DTPの構成

原稿や図面から,印刷用の版を作る工程をプリプレスというが,このプリプレスの主要部分である組版を,パソコン上で行うのがDTPである.
組版はかつて植字と呼ばれ,独立した専門職であったが,DTPの登場で,デザイナや執筆者,編集者などが,SOHOでプリプレス作業を完了し,印刷所や出力センターに版を持ち込んで印刷できるようになった.
◆レイアウト DTPの作業は,まず,コラムやマージンなどの,ページ上の区割りを決めることから始まる.さらにどの枠にどの図や文書などの要素を当てはめ,埋めていくかを決める.これをレイアウト,または割付けという.文書や図はあらかじめワープロやペイント系ソフト,ドロー系ソフト,フォトレタッチ系ソフトなど,ほかのソフトで作成しておく.ディスプレイ上に図やコラムなどの要素が実際に印刷されるときと同じ体裁で表示され,リアルタイムで修正が加えられる.これがWYSIWYGである.
■組版 DTPソフトはレイアウトソフト,ページレイアウトソフトともいわれるが,組版ソフトともいわれるように,DTPの主な役割は組版である.組版とは,原稿を元に活字を組んで,図や写真などとともにレイアウトしていくことである.原稿ファイルを読み込み,ページ上の決められた枠の中を埋め尽くすように挿入していくことを流し込みという.章や節などの文書構造を含む長文の原稿も,コラムからコラム,ページからページに渡って自動的に流し込まれる.すでに挿入した図などの要素を避けるように文章を流し込むことを回り込みという.

図1 流し込み

図2 回り込み


ぺージ記述書語と製版

◎ページ記述言語ページ上の文書や図形などのあらゆるレイアウト情報を記述し,記録しておくためのプログラミング言語がページ記述言語である.ページ記述言語は文字や図などのあらゆる要素の配置を記述するレイアウト記述言語であり,要素はすべて図形として扱われる.
Adobe社のPostScriptが,DTP業界標準のページ記述言語である.
業務用の代表的なDTPソフト,Adobe社のPageMaker,QUARK社のQuarkXPressの両者がPostScriptを採用している.PostScriptデータを印刷所や出力センターに持ち込めば,PostScript対応イメージセッタで版下を作成し,製版・印刷できる.また,PostScript対応レーザプリンタにPostScriptデータを送って紙に印刷することもできる.
1985年に公開され,1990年にPostScriptレベル2が発表された.また,画像ファイル変換やマスク処理などの機能が強化されたPostScript3が1996年に新たに発表された.

図3 DTPと電子出版の形態

DTPの関関連分野

◆ワープロ系のDTP近年ではWindows上のワープロのDTP機能が注目されている.PageMakerやQuarkXPressなどの業務用ソフトは,もっぱらPostScript形式のデータやフォントを使っているが,Windows系ではTrueTypeという簡易フォントを使い,パソコン上でラスタ化し,Windows対応の安価なプリンタで印刷する手法が主流である.また,TrueTypeフォントで作成したデータをイメージセッタから高解像度出力する方法も採られている.

●電子出版,オンライン出版 版下を作成して商用印刷したり,レーザプリンタで紙に印刷するだけでなく,DTPの技術は電子出版やオンライン出版にも応用される.電子出版は,組版された結果を印刷することなく,CD-ROMなどのパッケージを制作することである.また,オンライン出版はWWWページをデザインしたり,ニュース記事・小説などをHTMLやPDFなどの文書ファイルに変換して,電子メール,WWW,パソコン通信を通じて配布,販売することである.

DTPの技術

◆執筆 文章の執筆にはワープロが使われる.FEPは自前の辞書を参照して,入力されたカナ,またはローマ字をカナ漢字交じりの文に変換する.文字の書体や大きさ,下線や斜体などの装飾もまたWYSIWYGの要領で入力・修正していく.現在では流し込みや割付けなどのDTP機能をもったワープロが普及しているので,執筆と平行して,ある程度の組版やレイアウト作業を済ませてしまうことが多い.
●スペーシング 文字間隔,単語間隔,行間隔,段落間の間隔など,ページ上の要素のさまざまな間隔を調整することをスペーシングという.
特に,欧文の単語間隔を均等に割り付けることをスペーシングということがある.単語の割付けには,一行の両端を揃えるための均等割付けのほかに,右端揃えや左端揃えなどがある.
■カーニング 文字間隔を広げたり狭めたりすることを特にカーニングという.欧文,和文の両方で行われるが,主に欧文の可変幅フォントの場合に重要な意味をもつ.一つの単語の中で文字間隔を均等に空けたり,均等に詰めたり,特定の隣り合う文字の間を詰めたりする.
カーニングの度合いは文字幅だけではなく,文字の形によって決まる.たとえば,Pという文字は右下に隙間があるので,Aのように左下がせり出した文字や,aのように背が低い文字を,Pの右下の隙間に潜り込ませることで,より自然な文字間隔を指定することができる.

図4 スペーシングとカーニング

練習問題

次の文章は組版について述べたものである.□を埋める適当な語句を解答群より選べ.

フォントには文字幅がすべて等しい[a.]フォントと,文字幅が文字ごとに違う[b.]フォントがある.和文は主に[a.]であり,欧文は[b.]である.和文は原稿用紙のます目に,文字を一つずつ入れていくように,縦横等間隔で並べれば美しく見えるが,欧文は文字ごとに幅を調節したり,単語の間の幅を調節しないと美しく見えない.
和文と欧文が混在しているとき,かつては和文を全角,欧文を半角文字で表し,半角を全角の半分の文字幅と定めて,[a.]で整形していた.しかし現在では,和文と欧文をそれぞれの規則で組版するようになり,全角,半角という言葉も使われないようになってきている.
欧文を整形するときに,一行の両端を揃えるために,単語の間の空白の間隔を調整することを[c.]という.これに対して,単語の中の文字間の間隔を調整することを[d.]という.
たとえば,P,A,Q,Rの4文字の幅がみな同じだとしても,PAと並べたときと,QRと並べたときでは,PAの方がQRよりも幅が[e.]なる.これは,PAの場合,Aの左下がPの右下にさらに潜り込むことができるからである.同様の理由で,TaとSbではTaの方が[f.]なる.

〈解答群〉
ア.広く
イ.狭く
ウ.可変幅
エ.等幅
オ.自由幅
カ.カーニング
キ.ヒーリングク.スペーシングケ.シェーディングコ.クーリング

知識を広げよう
組版はグーテンベルグの活版印刷術の普及以来,活字を一つずつ拾って版に組むことによって行われてきたが,近年では重い鉛の活字の代わりに,写真の現像の要領で文字や罫線を直接印画紙やフィルムに焼き付けるようになった.これが写真植字(写植)である.
さらに計算機が導入され,フォントをアウトラインフォントとしてデータ化し,原稿や図版などのデータをすべて計算機上で扱うようにしたのが電算写植.全自動電算写植機によって高速に組版可能で訂正も楽になった.今日のDTPの前身にあたる.


ディジタル画像

ここがポイント!
赤,緑,青の3色の要素からなる光の点,つまり画素を,縦横に並べたものがディジタルカラー画像である.カラー画像を取り込み,加工することによって,さまざまな形式の画像が得られる.

色空間

人の網膜には赤(R),緑(G),青(B)それぞれの波長の光を感じる細胞が並んでいる.人はこれら3種類の細胞が受容する刺激の強さの比率でさまざまな色を感じる.このためにRGBを3原色という.白色光や無彩色の光を感じるのはRGBの刺激がちょうど均等な場合である.R=G=B=0のときは光がないので全くの黒(K)である.RGBをそれぞれ1バイト,即ち256段階で表して,R=G:B=255のときを最も明るい白(W)とする.このように,色をRGB合わせて3バイト(=24ビット)で表すことをフルカラー,あるいは24ビットカラーという.
◆RGB空間 RGBを24ビットで表すと,256×256×256の立方体の格子に,すべての表現可能な色が含まれる.この空間をRGB空間という,この空間には256×256×256=(28)3:224=約1670万色が含まれる.KとWは対角線上の両端の頂点に位置する.

図1 RGB空間と色相環

●補色 RとGを混色すると,黄色(Y)を感じ,GとBの混色にシアン(C),BとRの混色にマゼンタ(M)を感じる.シアンは明るい水色,マゼンタは明るい紫色(濃いピンク色)である.RとC,GとM,BとYはRGB空間上で対角線の両端に位置し,互いに補色関係にあるという.KとWを通る無彩色の直線がちょうど一点に重なるようにRGB空間を平面に投影すると,RYGCBMR……という順番の色の輪ができる.この輪を色相環という.色相環で点対称の位置にある色は互いに補色である.
◆明度,彩度,色相 色相環の中心は無彩色で,中心から遠ざかるほどあざやかな色になる.色相環上の中心からの距離を彩度という.また,KとWの間でWに近いほど明度が大きいという.このように,明るさの度合いを明度で表し,あざやかさの度合いを彩度で表し,色の違いを色相で表した色空間をHSVという.HSV空間はRGB空間よりも人間の直感に近いために,色指定にしばしば使われる.また,多くのアプリケーションソフトは,色空間を色相と明度の矩形と,彩度のスライダの組で表す.

図2 HSV空間

図3 色相と明度の矩形


標本化と量子化

ディジタル画像はRGBで表された色を平面に格子状に並べたものである.ひとつひとつの格子点を画素という.画素は,平面に投影された像から色を読み取った点であるから,標本点ともいい,この点で値を採取することを標本化という.カメラやスキャナなどの画像入力装置から得られた標本値はRGBそれぞれ256段階の値に近似されるが,このようなとびとびの値に近似することを量子化といい,量子化された値を階調値という.

図4 画像の標本化.量子化.再標本化
◆拡大縮小 画像全体の範囲はそのままで,縦横の標本間隔を変えると,画像を拡大したり縮小したりできる.このとき,隣り合う画素をもとに,中間の画素の値を新たに作ることを補間という.補間には,内分値を使う双線形補間や,3次スプライン関数などで画素の変化を近似する双3次補間などがある.画像の拡大縮小は,すでに標本化された画像から新たに画素の並びを作り出すことであるから,再標本化ともいう.画像を平行四辺形や台形などの形に変形する場合にも再標本化を行う.
◆エイリアシング 標本化や再標本化によって生じる視覚的不具合のこと.画像の解像度を変えたときなどに起きる.標本点数が少ないか,標本間隔が大きすぎるために生じる.過標本化してエイリアシングを防ぐことをアンチエイリアシングというが,その分計算コストがかさむ.

図5 エイリアシング
◆ラスタデータとベクトルデータ画像データはラスタデータとも呼ばれ,これに対して輪郭線データや線画など,標本化されていない図形データはベクトルデータという.ベクトルデータは階調表現には向いていないが,解像度やデバイスに依存せず,拡大縮小などの変形が自在にできる.アウトラインフォントは典型的なベクトルデータであり,輪郭線は線分や円弧,3次曲線などの数式で表現される.ペイント系ソフト,フォトレタッチソフトはラスタデータを扱い,ドロー系ソフトはベクトルデータを生成する.微妙な階調表現を必要としない図形データはベクトルデータでもっているほうがエイリアシングなどの劣化がない.
ラスタデータをベクトルデータに変換することは容易ではないが,逆は標本化によって比較的簡単にできる.プリンタで印刷したりディスプレイに表示したりするために,拡大縮小したベクトルデータを特定の解像度でラスタデータに変換することをラスタ化という.

図6 ラスタチータとベクトルデータ

練習問題

次の文章は画像の標本化について述べたものである.□を埋める適切な語句を解答群から選べ.

色相環は三原色の赤([a.]),緑([b.]),青([c.])を基準にした中間色を円環状に配置したものである.[a.]と[b.]の混色は[d.],[b.]と[c.]の混色は[e.],[c.]と[a.]の混色は[f.]である.[a.]と[e.],[b.]と[f.],[c.]と[d.]は補色の関係にあって,混色するとすべて白になる.

〈解答群〉
ア.マゼンタ(M)
イ.シアン(C)
ウ.黄色(Y)
エ.G
オ.B
カ.R

知識を広げよう
加法混色と減法混色:CRT(ブラウン管)の上では,管面に塗布された蛍光物質に電子線が当たることによってRGBの三色が発光し,それらの混色によってさまざまな色が表現される.色が混ざるほど明るくなることから,この混色を加法混色という.原色のRGBよりも混色であるCMYが明るく,白はさらに明るい.ところがインクは原色ほど明るく,混色するほど暗くくすんだ色になる.そこで,印刷物など,インクを使った混色には,明るいCMYを原色として,RGBなどのより暗い色を混色して作り出す.このような混色を減法混色という.
CMYをすべて混色しても完全な黒を作り出すことは難しいので,カラー印刷ではさらに黒(K)を原色として加えて,CMYKの4色を原色として使う.CMYK以外の色のインクは「特色」といい,特定の色を混色せずに確実に指定したい場合や,金,銀のようにCMYKでは表現できない色を指定する場合に使われる.
10ビットや12ビットの量子化:フルカラー画像はRGBそれぞれ8ビット(=256階調)に量子化されており,視覚的には8ビットで十分滑らかな階調を表現できる.スキャナは10ビット(=1024階調)や12ビット(=4096階調)で画像を取り込むことがあるが,これは量子化された画像が暗すぎたり明るすぎたりして,階調の偏りを補正するときに,実質的な階調数が減ってしまうためである.また,X線CTなどの医用画像も8ビットより多くの階調で量子化されるが,これは画像処理によって細部を強調したりして,より精密な検査を行うためである.高品質な音声データは16ビットで量子化されるが,これは視覚よりも聴覚が,より広いダイナミックレンジをもっていることを意味しているといえる.


画像ファイル形式とフォトレタッチ

ここがポイント!
画像のしみや汚れを取り除いたり,色合いを調整することがフォトレタッチ.コラージュやモンタージュのような大胆な画像合成にも使われる.用途に合わせたさまざまな画像ファイルの形式がある.

フォトレタッチ

写真を計算機に取り込んで,さまざまな画像処理を施すことをフォトレタッチという,「フォトレタッチ=画像処理」と考えてよい.フォトレタッチソフトとしてはAdobe社のPhotoshopやPhotoDeluxeが有名である.フォトレタッチソフトはほとんどがさまざまな画像ファイル形式に対応しているので,画像ファイル形式変換ソフトとしても使われる.
●フィルタリング 画像全体にわたって画素値を変換したり,画素値に局所的な微分・積分処理などを施すこと.色調を変えたり,輪郭をなまらせたり強調したりできる.
●反転 ネガのように,最も明るい色が最も暗く,最も暗い色が最も明るくなるように階調値を入れ替えること.黄色は青に,青は黄色にというように,補色どうしも入れ替わる.
●ボスタリゼーション 意図的に階調数を減らし,ポスター画のような平板な感じの絵にすること.256階調を4ないしは6階調に落とす.
●コントラスト強調中間階調を減らし,白黒をはっきりさせること.
まったく中間階調をなくしてしまうことを2値化といい,そのような画像を2値画像(ビットマップ)という.
●ボカし 局所的に積分処理を施して,輪郭をボカすこと.ノイズを除去するためにも用いる.輪郭は画素値が急に変化している画素のこと.
エッジともいう.物体の外輪郭だけでなく,目や唇の境界などを含む.
●先鋭化 ボカしの逆操作で,画像に微分処理を施して輪郭を抽出し,元の画像に輪郭を合成して,輪郭を強調する(シャープにする)こと.
●エンボス 微分処理で輪郭だけを抽出し,浮彫りのような凸凹の効果を出すこと.
●モザイク 粗い格子で画素を区分して,格子内で画素値を平均化すること.解像度を落とした再標本化ということもできる.
●コラージュ,モンタージュ 複数の画像を組み合わせて,一部加筆して,実在しない画像を合成すること.マウスなどの指示装置で切り抜く領域の輪郭を指定したり,画素値がほぼ均等な領域を自動的に切り出し たりする.切抜きをクリッピングともいう.合成した境界部分はボカして目立ちにくく処理する.
●文字の影付け 文字をボカした画像を文字の奥に重ねること.奥行き感が出る.

図1さまざまなフィルタ


画像ファイル

●可逆圧縮と非可逆圧縮 画像は冗長なので,圧縮するとかなり小さくなる.このため特にネット上でやり取りされる画像ファイルは圧縮されることが多い.画質を全く落とさずに圧縮することを可逆圧縮といい,圧縮前の画像を完全に復元することができる.GIFやPNGに使われているLZW圧縮などが可逆圧縮.一方,非可逆圧縮は,目立たない冗長性を除去してさらに高い圧縮を行うもので,JPEGに使われているDCTが代表的な非可逆圧縮である.
●アーティファクト 非可逆な画像処理(再量子化,画像強調,画像復元,画像圧縮など)によって生じるさまざまな視覚的不具合のこと.JPEGやMPEGなどの高圧縮画像で顕著になる.情報量が少ない画像の解像度を無理に上げようとしたために起こる.圧縮率を小さくする,画像サイズを小さくするなどして,画質自体を向上させなくては根本的解決にならない.

図2 アーティファクト


◆限定色 フルカラー画像に含まれる1670万色の中から,実際に使われている色だけを抜き出して,色数を減らすこと.GIFなどで使われる.


画像フォーマット

●GIF アメリカのパソコン通信ネットワークCompuServeで定められた画像形式,256限定色なので,風景画や肖像画のように,色調が滑らかに変化する画像をGIF形式にすると,擬似輪郭が生じる.イラストやクリップアート,アイコンなど,もともと色数が少ない画像を高圧縮率で圧縮するために適している.動画用のアニメGIFや,背景を切り抜いた透過GIF(いずれもGIF89aと呼ばれるGIFの拡張形式)などがある.
■JPEG 画像処理技術者の集まりが定めた,風景画や肖像画などの,自然画を圧縮するための画像形式.圧縮率は高い.もともと色数が少ない画像をJPEG形式で圧縮すると,アーティファクトが目立つ.
●PNG フルカラー画像の可逆圧縮で,WWWコンソーシアムが提案した.画質を全く.落とさずに中程度の圧縮を実現する.
■TIFF Aldus社(現Adobe社)が提案した画像形式.可逆・非可逆,限定色,RGB,CMYKなどさまざまな種類の画像を一つの汎用形式に統合している.Adobe系のCGソフトで使われるほか,Macでは広く使われている.
◆IFF Amiga社が定めた画像形式.Amiga系のCGソフト(Light-Wave3Dなど)で使われる.非圧縮.
◆TGA Truevision社が定めた画像形式.Amiga系のCGソフトで使われる.非圧縮.
◆PICT MacOSで標準的に使われる画像ファイル形式.
◆BMP Windowsで標準的に使われる画像ファイル形式.非圧縮.

●PhotoCD 通常の写真フィルムをプリントせずCD-ROMに焼くときに使われる形式.ラボで頼めばプリントではなくPhoto-CDを作ってくれる.
■EPS 文書中に挿絵として挿入するために作られたPostScriptファイル.パソコン上でプレビューするための表示用のデータが添付される.

練習問題

下の文章は画像ファイル形式につして述べたものである.□を埋める適当な語句を解答群から選べ.

WWWで使われる静止画像形式には[a.]と[b.]がある.[a.]は[c.]色の限定色カラーで[d.]に適している.一方,[b.]は[e.]の圧縮のために作られた規格である.[a.],[b.]ともに非可逆な画像圧縮であるが,[b.]はもともと画像に[c.]以下の色しか含まれていないときには可逆圧縮となる.

〈解答群〉
ア.256
イ.65536
ウ.MPEG
エ.JPEG
オ.BMP
カ.GIF
キ.線画などのイラストやアイコンタ.風景や肖像などの自然画

知識を広げよう
OCR:光学式文字読みとり装置のことだが,現在ではスキャナに添付する文字読み取りソフトのことをOCRソフトと呼んでいる.文書画像や図面をスキャナから読み取り,文書領域や文字領域を自動的に抽出し,パターン認識手法を用いて,文字コードデータを生成する.葉書の郵便番号の読み取りには,さらに高度な手書き文字認識処理が行われる.OCRソフトは通常特定の書体の活字しか読み取れない.
ロッシー,ロスレス:可逆圧縮は元の画像を完全に復元できるので,無損失(ロスレス,1ossless)と呼ばれることがある.また,非可逆圧縮は損失があるので,ロッシー(lossy)とも呼ばれる.WWWでは可逆な画像のやり取りに使われる画像形式がなかったために,最近PNGという形式が提案された.これは可逆なLZW圧縮を使い,フルカラーの画像を符号化したものである.
ルミナンス,クロミナンス:非可逆圧縮では,RGBを明度(輝度信号,ルミナンス)とそれ以外の色情報(色差信号,クロミナンス)に分けて,輝度信号と色差信号を別々の圧縮率で圧縮することがある.これは,色差が輝度よりも劣化が目立たないために,高圧縮可能だからである.
アナログビデオ信号も輝度と色差に分けて時間軸方向に圧縮し,伝送する.



2.9 モデリング

ここがポイント!
形や動きなどを計算機の上で扱えるように数値化したものをモデルという.CGはモデルを得ることと,モデルを描くことに大きく分けられる.モデルの獲得をモデリング,モデルの描画をレンダリングという.

モデリングとレンタリング
モデリングはものの動きや形,表面の模様やツヤ,成長や侵食,流れや伝播など,現実世界のあらゆる事象を計算機の上で扱えるように数値化することである.したがって,その扱う範囲は限りなく広い.これに対してレンダリングは,いったんモデルとして獲得されたデータを,画像の上に描画することであるから,その守備範囲は狭いが深い.モデリングはそれぞれの事象に適したさまざまな手法が採られ,そのためにレンダリングから分離される.レンダリングは汎用的なインタフェースと,モデルを効率的に描画するように特化したハードウェアやソフトウェアを提供する.

図1 GUIモデラ

GUlモデラによるモデリング

GUIを駆使して,矩形または三角形のポリゴンを空間に配置し,色や模様などのポリゴンの属性を与える作業工程について解説する.
●3面図GUIモデラは上面図,側面図,正面図の互いに直交するS方向から見た図面を見ながら,WYSIWYGの手法でモデルを 作っていく,さらに透視図を見ながら,実際の3次元形状を確認する.透視図はポリゴン表示,メッシュ表示,またはOpenGLを用いた陰影付け表示によって,リアルタイムにおおまかなレンダリングを表示する.
●モデルの種類 ワイヤフレームモデルは頂点と辺の情報だけをもったモデルである.ワイヤフレームモデルの辺がどのように面を張るかを決めたものをサーフェスモデルという.サーフェスモデルの面はポリゴンともいい,レンダリングで陰影づけするための面の属性を割り当てる.

図2 ワイヤフレーム

図3 サーフェスモデル

●ソリッドモデルとCSG表現 立方体や円錐,球など,物体の内外判定が可能なプリミティブで表されるモデルをソリッドモデルという.いくつものプリミティブをAND,OR,差などの論理演算によって合成することによって,複雑な形状を作り出す.これをCSG表現という.

図4 CSG表現

●スイープ表現 曲線や面などをある曲線(スイープパス)に沿って動かすことを掃引,またはスイープという.スイープした結果得られる軌跡からスイープ表現形状が得られる.

図5 スイープ表現

●自由曲面 ベジエ曲面や双3次スプライン曲面などの自由曲面で滑らかな物体表面をモデリングする.制御点を動かすことによって面の形状を連続的に変化させることができる.

図6 自由曲面

●メタボール 正負の電荷を空間に配置してできる等電位面を物体形状のモデリングに応用したもの.泡やしずくのような不定形の物体のモデリングに使われるほか,人体などの複雑な形状を表現することもできる.

図7 メタボール

計源に基づくモデリング

自然なモデルを手作業でデザインすれば,丹念で長時間の労働が必要になる.そのため,センサを用いて自然界の動きや形を計測してモデリングする.レンジファインダやモーションキャブチャなどの技術が利用される.

図8 計測に基づくモデリング

手続き的なモデリング

モデルを数式やプログラムで定義し,計算機上で合成すること,樹木の構造や河川,雲,煙や炎などの,一見複雑ではあるが,単純なモデル化が可能な自然現象はフラクタルと総称される.樹木を生成する規則をLシステムといい,大理石や墨流し模様のようなテクスチャを作ることを手続き的テクスチャという.

図9 手続き的テクスチャ


物理に基づくモデリング

ボールがはねたり,旗がはためいたり,服が体にまとわりついたりというような物理現象を計算機上でリアルタイムでシミュレートしたり,滑らかで自然な動きを表現すること.デザインの手間を大幅に省略できる.

 

図10 物理に基づくモデリング

練習問題

下の文章はモデリングについて述べたものである.口を埋める適当な語句を解答群から選び,記号で答えよ.

モデルを獲得する方法には,[a.],[b.],[c.],[d.]などがある.[a.]は,三面図と透視図を見ながら,WYSIWYGの要領で,ポリゴンを細分化したり,面を引き出したりくぼませたりして,複雑な形状を対話的に作り出していく.[b.]は,雲や炎,樹木や河川などの,一見複雑に見える形状や動きを,フラクタルなどの数学的なモデルに基づいて計算機上で生成する.[c.]は,ボールが跳ねたり,服が体にまとわりついて動くなどの力学的な現象を計算機上でシミュレートして実現する.[d.]は,現実に存在する形や動きをセンサなどでモデルとして計算機に取り入れる方法である.モデリングはそれぞれ向き不向きがあるため,これらの手法を適宜組み合わせて効率化を図る.

<解答群>
ア.手続き的モデリング
イ.物理に基づくモデリング
ウ.直感的モデリング
エ.GUIモデラによるモデリング
オ.計測に基づくモデリング

知識を広げよう
モデリングと自然:自然界には膨大な情報が存在している.技術がどのように発達しても,それらすべてをモデルとして獲得し,計算機上で模倣することはできない.モデリングは,自然現象のほんの一部を数式などで取り出したものだという見きわめが必要.いかに巧妙な理論`モデルでも,モテル化されなかったほかの要素を見落としてしまうことになる.むしろ巧妙なモデルほどその欠点に気づきにくくなるといえる.人工生命,遺伝的アルゴリズム,神経回路網など,つぎつぎに新しい理論がCGのモデリングに応用されるが,流行を追っても現実世界を模倣できるとは限らない.
フラクタル,カオス,複雑系:一見無秩序に見える自然界の現象に,ある統計的な秩序が存在すること,無秩序にも,さまざまな段階があることを明らかにした理論がフラクタルやカオス,あるいは複雑系である.
カオスは無秩序のこと.フラクタルは細切れとか断片のこと.カオスや複雑系が時間軸に沿った変化を主に研究するのに対して,フラクタルはどらかといえば樹木や雲などの静止した形に注目する.しかしこれらは密接に関連している.フラクタルは驚くほど簡単な数式で自然界の複雑な現象を表現できることがある.炎や煙の表現に使うパーティクルシステム,手続き的テクスチャなどはそれらの理論がうまく役立った例である.



2.10 レンダリング

ここがポイント!
3次元のモデルや情景を2次元の映像上に表現することをレンダリングという.写真のような写実的なレンダリングのほかに,絵画風やイラスト風にアレンジしたデザインの要素を含むレンダリングもある.

順投影と逆投影

写実的なレンダリングは,カメラで風景を撮影するときと同じ要領で,まず3次元の情景を2次元に投影する.順投影は,物体を平面に投影し,その投影像の内側に含まれる画素を照明モデルに基づいて塗りつぶす.Zバッファ法やスキャンライン法など,比較的高速なレンダリングに使われる.一方,逆投影は,投影面上の各画素から情景の中へ逆投影した視線が,物体や光源とどのように交差するかによって画素の色を決める.レイトレーシングのような高画質のレンダリングに使われる.

図1 順投影

図2 逆投影

●フォトリアリズム 写真や実写ビデオのような現実感を数値計算で実現すること.厳密な光学モデルを考えて,光の挙動をシミュレートし,投影像を作り出す.


図3 写実的レンダリング

●絵画風レンダリング 光学的な厳密さよりも,デザイン的なおもしろさを強調している.ノンフォトリアリスティックレンダリングともいう.油彩画風,水彩画風,水墨画風,ペン画風の画像を生成する


図4 油彩風

.
図5 イラスト風


ポリゴンレンダリング

●Zバッファ法 ゲームセンターのりアルタイムの3DCGゲームはすべてポリゴンで描かれる.Zバッファ法にはポリゴンの陰影づけに特化した専用ハードウェアが用いられる.Zバッファ法は投影面にポリゴンを投影して塗りつぶす,順投影レンダリングである.

図6 Zバッファ法

●Zバッファ 投影面の各画素に,奥行き値(Z値)を格納するメモ

リ領域を確保する.これをZバッファといり.ます,Zバッファの奥行き値を十分に大きな値にしておく.一つずつポリゴンを読み込んで,その内部を塗りつぶすときに,ポリゴンの奥行き値を画素ごとにZバッファの奥行き値と比較する.ポリゴンの奥行き値がZバッファより小さければ手前にポリゴンがあると考えて塗りつぶし,Zバッファ値をポリゴンの奥行き値で更新する.そうでなければ塗りつぶさず,Zバッファ値もそのままにする.こうして,つぎつぎにポリゴンを読み込んで,手前のポリゴンで奥のポリゴンを塗りつぶしていく.

◆スキャンライン法 いったんすべてのポリゴンを投影し,走査線ごとに奥行き順にならべて,最も手前にあるポリゴンを描画する.比較的高速・高画質だが,ポリゴンの数が増えると遅くなるので,複雑な情景の描画には向いていない.順投影レンダリングの一種

 

図7 スキャンライン法

レイトレーシング

画素から伸ばした視線が物体とどのように交差するかによって画素値を決定することをレイトレーシング(逆投影レンダリング)という.光線を自在に屈折,反射させることができ,また画素から複数の視線を伸ばす過標本化,影づけなどの高度な光学的シミュレーションが可能である.
◆反射・透過・屈折・吸収 光は物体表面や異なる物質の境界面などで反射・透過・屈折し,また吸収される.吸収は物体内部でも生じる.

図8 レイトレーシング

図9 反射.透過.屈折.吸収

練習問題

下の文章はレンダリングについて述べたものである.口を埋める適当な語句を解答群より選べ.

レンダリング手法は,物体を投影して,投影像の内部を塗りつぶす順投影法と,投影面から視線を逆投影して物体と交差させて画素値を決める逆投影法がある.[a.]法は順投影レンダリングで,画像と同じ大きさの奥行き値の配列,つまり[a.]をもち,先に描かれたポリゴンのLに,手前のポリゴンをつぎつぎに塗り重ねていく.[b.]は視点から情景の中へ視線を伸ばし,視点から見える色や明るさを決定する逆投影レンダリングである.[c.]法は[c.]ごとに物体の奥行き順を計算し,手前の物体だけを塗りつぶす,順投影レンダリングである.
従来は写真のような現実感を追求した[d.]なレンダリングが主流であったが,最近は手書き風やイラスト風にアレンジした非[d.]な表現手法が盛んになった.また,数式によって表しにくい不規則で不定形な物体も,[e.]や[f.]などのモデルを使えば可能である.このように,レンダリングはより自由で多様な応用分野に広がりつつある.

〈解答群〉
ア.レイトレーシング
イ.スキャンライン
ウ.Zバッファ
エ.ミートボール
オ.メタボールカ.ラスタデータキ.ボリュームデータク.フォトリアリスティック

◆知識を広げよう
モデラとレンダラ:モデリングを行うソフトやハードがモデラで,レンダリングを行うソフトやハードがレンダラである.モデラはさまざまな方法でモデルを獲得する.モデルを統合して情景を記述する言語を情景記述言語という.Pixarが開発したRenderManなどの業務用の言語や,WWWで使われるVRMLなど多くの種類がある.また,それぞれの物体形状のモデリングにはDXF,3DSなどのデータ形式がある.
陰曲面と陽曲面:三次元座標の関数f(x,y,z):0を陰表現といい,陰表現された曲面が陰曲面.
球面や平面,円筒面や円錐など,方程式で表される曲面は陰曲面であり,レイトレーシングで多用される.メタボールやボリユームデータの場合には等値面ともいうが,同じものである.これに対して制御点の集まりで表されるベジェ曲面などの自由曲面は陽曲面という.陽曲面は方程式ではなく,二つの自由変数(パラメータ)が動いてできる軌跡として定義される.このためパラメトリック曲面とも言う.最終的に任意の精度でポリゴン分割されて,Zバッファ法などで陰影づけされる.


照明モデルとマッピング

ここがポイント!
視線方向と物体表面の向き,および光源の位置から,物体表面に入射した光がどのように反射するかを決めるモデルが照明モデルである.また,照明モデルに基づいて物体表面の明るさや色を決めることを陰影づけという.

陰影づけ

物体に照射され,反射される光をモデル化すること.拡散反射光と鏡面反射光,および環境光の三つの成分をもつ.
◎拡散反射光チョークや布地のように,ざらっとした光沢のない面に入射した光が,すべての方向に一様に反射する照明モデルのことをいう.Lambertモデルともいう.光源と面の傾きだけで決まる.光が面に垂直に入射したときが最も明るく,斜めから入射するほど暗くなる.

図1 拡散反射光

◎鏡面反射光入射した光が特定の方向に強く反射する照明モデルで,Phongの照明モデルが有名.光源の位置と面の傾き,および視点の位置によって反射光強度が決まる.

図2 鏡面反射光

○環境光光源の位置にかかわらず,すべての面に一様に入射して反射すると考える光で周囲に乱反射する間接照明光を簡易にモデル化したものをいう.光源から隠れた面が真っ暗にならないように,微量の環境光を加える.

図3 環境光

◎スムーズシェーディングポリゴンのつなぎ目がめだたないように滑らかに陰影づけすること.GouraudとPhongのスムーズシェーディングがある.ゲームなどリアルタイムのレンダリングにはより簡易なGouraudシェーディングが使われる.

図4 合成反射光

影づけ

光源と物体の間にほかの遮へい物体がある場合には,影をつける.照明モデルによる陰影づけをシェーディングというのに対して,遮へい関係を考慮した影づけはシャドウイングという.

図5陰影づけと影づけ


テクスチャとマッピング

物体の現実感や質感を,形状モデルや照明モデルだけで実現することは非常に難しい.このために,物体表面に画像を張りつけて,模様や凹凸などを表現する.これをマッピングという.映り込みや屈折,透過など,あらゆる物体表面の光学的性質がマッピングで代用される.

図6 テクスチャマッピングとバンプマッピング

●映り込み 完全な鏡面反射面では,鏡のように,入射光はただ一つの方向へ反射され,光源のぼけた反射像であるハイライトだけでなく,周囲の情景がすべて鮮明に映り込む.レイトレーシングは反射光を追跡して自然に映り込みを実現するが,ほかのレンダリングでは環境マッピングで代用する.

図7 映り込み

●テクスチャマッピング 物体表面に画像を張りつけること.顔の形状モデルに,顔の展開図を張りつけたり,胴体や手足のモデルに布地の模様を張りつけたりする.面の位相によって,円筒マッピング,球面マッピングなどがある.陰影づけや影づけなどの照明モデルと併用する.
●バンプマッピング 画像そのものではなく,凹凸を張りつけること.みかんの皮の細かなくぼみや,月面のクレータ,コインの彫刻のように,ごく細かな凹凸の表現に向いている.表面形状を変えることなく,表面の法線方向(面の向き)だけを変動させる.法線だけでなく.実際に形状を凹凸に変形させることを変位マッピングという.
●環境マッピング 天空などの遠景の映り込みをマッピングで実現することをいう.Zバッファやスキャンライン法などで映り込みを擬似的に実現する.遠景と物体の間をほかの物体がさえぎっても,環境マッピングは対応できない.
●ソリッドテクスチャ 立体の中身まで詰まったテクスチャ.フラクタル理論を使い,3次元座標の関数として手続き的に定義されることが多い.木目や大理石模様などのテクスチャが多用される.

図8 ソリッドテクスチャ


ラジオシティ

直射照明光だけでなく,壁と壁,床と壁などの相互の間接照明光を考慮に入れ,室内のぼんやりとした間接照明を表現できる.面と面の間の相互作用を計算するために,壁や床や家具の表面をパッチに細分化し,入射する光と放射する光の総和から面の色や明るさを決定する.

図9 ラジオシティ

練習問題

下の文章は陰影づけについて述べたものである.□を埋める適当な語句を解答群より選べ.

照明モデルは物体表面への光の入射と反射の関係を決めるモデルである.物体表面の陰影は,表面反射率や表面の滑らかさ,表面の向き,[a.]と[b.]の位置から決まる.最も簡単な照明モデルは,[a.]から入射した光がすべての方向に一様な強度で広がると考えるもので,[c.]モデルという.したがって,[a.]の位置と面の向きだけから面の明るさが決まる.面に垂直に外側に向いた方向を法線方向というが,法線方向と入射方向がちょうど逆向きのときに[口は最も強く,角度が浅くなるにつれて弱くなり,法線と入射光が垂直になると強度は0になる.
光沢やハイライトなどは[c.]モデルだけでは記述できない.[d.]モデルは,入射方向と法線方向に関して特定の方向に特に強く反射すると考えるモデルである.反射光のピークの方向に[b.]があるときに最も明るくなる.入射光と反射光がちょうどこのような条件を満たすのは,面がある特定の方向に向いている部分だけであり,ここがハイライトとなる.[c.]と[d.]を合わせると,自動車のボディのような光沢がある曲面を表現できる.

〈解答群〉
ア.環境光
イ.屈折光
ウ.透過光
エ.鏡面反射光
オ.拡散反射光カ.光源キ.焦点ク.視点ケ.消失点

知識を広げよう
エド・キャットマルとジム・プリン:CGの父と呼ばれるアイバン・サザランドに率いられた世界初の3DCGを研究する学科が,1968年にユタ大学に開かれ,テクスチャマッピングはここの博士課程の学生エド・キャットマルが開発した.また,キャットマルはZバッファ法や双3次曲面を開発したことでも知られる.彼はニューヨークエ科大学を経てジョージ・ルーカスのルーカスフィルムに移り,ルーカスフィルムのCG部門はILM(Industrial Lightand Magic)として分離し,現Apple社CEOのスティーブ・ジョブスに買収されてPixarというCG制作会社になった.キャットマルはPixarの創設者の一人で,トイストーリーなどの映画作品を制作している.
バンプマッピングを開発したのは同じサザランド学派のジム・プリンで,NASAのジェット推進研究所に所属し,1980年初頭のCQSM0Sというテレビ番組で使われた木星や土星,天王星などのCG制作にテクスチャマッピングやバンプマッピングを応用して,一躍有名になった.また,プリンはメタボールの開発者としても知られる.
なお,NASAのジェット推進研究所は,1998年,火星探査ロボット,マーズパスファインダのホームページを開設し,アクセスが殺到したことで再び有名になった.


コンピュータアニメーション

ここがポイント!
アニメーションの作画や実写映像編集の工程は今日ほとんどすべて計算機上でも行えるようになった.モデルをレイアウトして3口CGを制作し,映像・音声素材をつなぎ合わせて作品を完成させる.

アニメーション作画

●フレームアニメやビデオなどの動画を構成する時系列の各瞬間の静止画をフレームという.NTSCビデオは1秒間に30枚(正確には29.97枚)のフレームでできている.映画は1秒間に24枚.これらのフレームを1枚ずつ描き,音声を付加して動画を作成する.

図1 フレーム

●セルアニメセルという透過シートにアニメータがフレームを手描きして作るアニメ.前景と背景を別々に描いて何枚もセル画を重ねて1枚のフレームを完成させる.最も基本的なアニメ作成方法.
●キーフレームと中割りフレームのうちで,動作のつなぎ目にあたる重要なフレームがキーフレーム.セルアニメは,従来,キーフレームだけを熟練者が描き,その間のフレームは,前後のキーフレームを滑らかにつなぐように,多くのアシスタントが手分けして描いた.このように,キーフレームの間を埋めていく作業を中割りという.現在では計算機による自動中割りが実用化されている.3D CGでも動作の境界にあたる重要なフレームをキーフレームと呼び,中間フレームは補間して作成する.

 

図2 中割り

●モーションパス キーフレームだけをモデラで指定し,中間フレームの位置や向きは自由曲線で補間する.人体などの多関節物体の動きは,関節の位置や角度をモデラで与え,位置や角度を3次スプライン関数などで滑らかに補間する.このようにして得られる位置の軌跡がモーションパス.

図3 モーションパス

●モーフィング 実写映像は,中割りのための特徴点の対応関係が決まっていないので,あらかじめ手作業で対応点を指定して中割りする.二つのフレームの中で二人の人の鼻と鼻,目と目,口と口などをGUIで対応づけて,一方の人からもう一方の人の顔に滑らかに変化させる.
●インバースキネマティクス 多関節物体の姿勢を決める場合,すべての関節の角度を決めたときに,腕や足や指先などの位置が確定することを運動学という.これとは逆に,指先と腕の付け根の位置を与えたときに,その間の手首,肘などの関節角度を物理的に無理なく決めることを,逆運動学,すなわちインバースキネマティクスという.両足を地面につけたまま腰を動かして,膝や股関節の角度などを自動的に決めるときなどに使われる.

図4 インバースキネマティクス

●モーションブラー 動きブレのこと.カメラや物体が動いたときに,動いた方向に流れたようにボケるが,これを数値計算で実現するためには,時間軸方向の過標本化とアンチエイリアシングが必要.計算コストの上で高価であるが,実写との合成をふんだんに使う映画作品などの高品質な映像制作には欠かせない.

動画の編集

実写やアニメ,音声など,それぞれの素材(クリップ)をつなぎ合わせたり重ね合わせたりしてできる最終的な作品(ムービー)を作る.ファイル形式には,フレームごとに静止画として分かれた連番ファイルと,ひとまとまりになった動画ファイルがある.
●動画ファイル 動画編集に使われるファイル形式には,Windows系のVideo for Windows(AVI)と,Mac系のQuickTime(MOV)かある.AVI, MOVはさら圧縮,非圧縮などさまざまな形式にわけられる.また,機種に依存しない高圧縮動画の標準形式にMPEGがある.
●連番ファイル 時系列の静止画ファイルの集まり.圧縮画像にはJPEGが使われる.非圧縮,特にCGアニメ制作にはTGAが使われる.連番ファイルの名前は,たとえばclip001.jpg, clip002.jpg, clip003jpg,……となる.
●音声クリップ 音声の素材にはWindows Wave form(WAV)やAIFが使われることが多い.最近では高圧縮のMP3(MPEG1レイヤー3)が注目されている.
●ノンリニア編集 テープからテープヘクリップをつなぎ合わせる従来のビデオ編集に対して,ディジタル化されたクリップを任意の順番で編集することをノンリニア編集という.リアルタイムで動画ファイルを読み込み,録画再生する必要があるため,高速なハードディスクと転送バスが必要だが,最近は普通のパソコンでもノンリニア編集ができるようになりつつある.Adobe社のPremiereが標準的なノンリニア編集ソフト.
●アルファチャネル フレームと字幕の重ね合わせ(スーパーインポーズ)や,クリップ間の移り変わりの特殊効果などのために,フレームの透明度を決める画像.RGBチャネルに対してAチャネルなどという.
●コンパイル アニメーションではクリップを編集してムービーを生成することをいう.できあがったムービーはCD-ROMにMPEG形式で焼いたり,リアルタイム再生してビデオに録画する.
●モーション JPEG高圧縮静止画であるJPEGを時系列に並べることで動画ファイルとして利用するものをいう.圧縮率を変えることによって画質とハードウェアの能力を調整できる.
●MPEG1 CD-ROMに記録するために考案された動画ファイル形式で,NTSCと同程度の画質の実現を求めたもの.
●MPEG2 DVD用に開発された,本格的な商業映像用の動画形式.

図5 DVベースのノンリニア編集

●DVSoft DPS社が定めたDV用のAV1形式.圧縮率や画像サイズは固定されているが,簡易で高画質,かつ劣化がほとんどないノンリニア編集が可能である.IEEE1394インタフェースを必要とする.
●動画GIF 静止画像ファイル形式のGIFを拡張した動画ファイル形式.GIFアニメなどともいう.WWWの広告バナーで多用される.

練習問題

下の文章はノンリニアビデオ編集について述べたものである.□を埋める適切な語句を解答群より選べ.

デスクトップ環境でビデオを編集するには,実写映像やCGアニメーションなどの映像素材,ナレーションやBGMなどの音声素材,字幕などの静止画素材をすべてディジタイズして計算機にあらかじめ読み込んでおく.このような素材を[a.]という.音声[a.]にはWindowsの音声ファイル形式である[b.]や,Mac系のAIFFが使われる.映像[a.]には,Windows系の[c.]や,Mac系の[d.]が使われる.NTSCビデオ映像は1秒間に約[e.]枚の静止画からできていて,その一枚一枚の静止画を[f.]という.動画に字幕をスーパーインポーズするにはあらかじめ静止画[a.]を用意し,その[g.]で[f.]の透明度を設定して重ね合わせる.このようなビデオ編集を行う標準的なソフトにAdobe社の[f.]がある.

〈回答群〉
ア.Director
イ.WAV
ウ.Premiere
エ.フレーム
オ.アルファチャネル
カ.クリップ
キ.AVI
ク.QuickTime
ケ.24
コ.30

知識を広げよう
マルチメディアコンテンツ制作にはMacromedia杜のDirectorというソフトが使われるが,ビデオ作品制作にはPremiereが標準的に使われる.Directorで作られるコンテンツは,静止画を紙芝居のようにつぎつぎに提示したり,ボタンやBGMに音声クリップをつけることができる.動画クリップを使ったり,対話的にページを変えたりすることもできる.
一方,Premiereで制作される映像作品はNTSC形式のビデオを作ることが最終目的である.NTSCは720×480の大きさのフルカラー画像が1秒間に30枚必要であり,非圧縮の場合1秒当たり31MBものデータ量が必要である.このように,ノンリニア編集は膨大なデータ量を扱う必要があるために,非常に高価な業務用機での編集に限られてきたが,現在ではパソコンを使ったデスクトップ環境でもある程度のノンリニア編集ができるようになってきており,パッケージ制作とノンパッケージ制作の両方が可能なパソコンも市販されている.
ノンリニア編集は,NTSC信号非圧縮の業務用機,民生用のDVベースで圧縮率が1/5固定のもの,モーションJPEG系の圧縮率可変のものがある.このうち,DVベースのノンリニア編集が多く利用されるようになった.


2.13 オーサリング

ここがポイント!
マルチメディアコンテンツ制作におけるオーサリングとは,テキスト,サウンド,グラフィックスそしてアニメーションなどのディジタル素材を統合し,自分の考えていることを表現するための手段である.したがって,オーサリングはコンテンツ制作の最終段階に位置する重要な作業である.オーサリングの概念と,オーサリングツールについての知識は1・4節の「映像デザイン」と1・ト5節の「情報デザイン」と関連づけて覚えておくとよい.

オーサリングとは

マルチメディアコンテンツ制作におけるオーサリングは,構造(関係)デザインと,変化過程(遷移過程)デザインに分けられる.構造デザインは,ボタン,テキスト,グラフィックスそしてサウンドといったマルチメディアドキュメントを構成する要素間の論理的構造のデザインを意味する.1・5節で紹介した「情報とオブジェクトの関係」と「情報間の関係」と類似した概念である.変化過程デザインとは,ある状態からある状態へ遷移するときの過程(プロセス)のデザインを意味する.1・5節の「情報デザイン」の「情報の見せ方」と類似した概念で,1・4節の「映像デザイン」との関連も深い.

図1 構造と変化過程

●構造 要素間の構造のデザインでは,リニア構造,ディレクトリ構造,そしてWeb構造などが代表的なものである.リニア構造の例としてはスライドショー,ディレクトリ構造の例としてはウィンドウシステムのファイルシステム,そしてWeb構造の例としてWebサイトが挙げられる.
●変化過程 状態間の変化過程のデザインでは,ズームイン,ディゾルブ,そしてワイプなど映像編集技法や,サウンドロゴを応用することが考えられる.たとえば,スライドショーにワイプ効果を,フォルダシステムにズームイン・アウトを,ホームページでまちがえた場所をクリックするとアラームが鳴るといったデザインが考えられる.


プレゼンテーション作成ツールによるオーサリング

スライドショーをデザインすることはリニア構造に限定したオーサリングを行うことに等しい.したがって,PowerPointやClarisImpactなどのプレゼンテーションソフトは,リニア構造に限定したオーサリングツールと考2.ることができる.

表計算ソフトによるオーサリング

ExcelやLotus123などの表計算ソフトでは,マクロ機能をボタンやメニューコマンドとリンクさせることができるが,この機能を駆使してオーサリングを行うことができる.

DTPソフト

最近のDTPソフトは図形,表の編集そして画像・音声データの取込みが可能である.さらに,マクロ機能やHTML文書形式での保存機能を備えたDTPもある.このように高度に発達したDTPソフトは,オーサリングソフトと呼んでもよいであろう.

DVDソフト

DVDソフトはディジタル化された映像(音声を含む)をコンピュータ上で加工,編集するためのソフトである.多様な特殊効果をノンリニア編集によって実現できる.DTPソフトが文字を中心としたオーサリングソフトであるのに対し,DVDソフトは映像専門のオーサリングソフトと考えることができる.

マルチメティアオーサリンクツール

オーサリングをC言語などのプログラミング言語を用いて行うと,複雑で膨大な手順が必要である.また,プレゼンテーション,表計算,DTP,そしてDVDソフトを用いた場合,複雑な構造をもち,かつビジュアルなオーサリングを行うことは難しい.そこで,通常は専用のソフトウェアを用いて行われる.代表的なオーサリングソフトとして,以下にHyperCardとDirectorを紹介する.
◆HyperCard HyperCardはカード型データベースと呼ばれていたが,プレゼンテーション用のさまざまな特殊効果,オブジェクト指向のマクロ言語であるハイパースクリプトを備えた最初のソフトウェアである.このことから,オーサリングツールの草分けと考えることができる.
◆Director Directorは,映画撮影現場のメタファを用いたソフトウェアで,ソフト名は映画監督(director)に由来する.Directorの作業画面は以下のウィンドウから構成される.
(i)ステージ オーサリングによって制作されたプレゼンテーションムービーを表示させる場所.

(ii)キャストウィンドウ テキスト,サウンド,グラフィックスそしてアニメーションなどのディジタル素材を登録しておくためのウィンドウ.
(iii)制御パネル ムービーの再生,停止そして巻戻し,早送りなど行うためのパネルウィンドウ.
(iv)スコアウィンドウ横軸方向に時間,縦軸方向にチャネルを割り当てた2元表.時間はフレームといり単位で数えられ,スコアウィンドウはフレームとチャネルで分割されたセルで構成される.各セルには,どのキャストがステージ上のどの位置に配置されているかという情報が記述される.
(v) スクリプトウィンドウ LINGOと呼ばれるスクリプト言語を記述するためのウィンドウ.

図2 キャストウィンドウ,制御パネル,

図3 スクリプトウィンドウ

ホームページ

ホームページでは,テキスト,音声,画像,アニメーションをページ上にデザインすることができる.この点から,ホームページ作成用のツールはマルチメディアオーサリングツールと考えることができる.
ホームページで構造をデザインするにはHTMLのハイパーリンク機能を用いることができる.また,変化過程のデザインには,最近のWWWブラウザでサポートされるようになった以下のスクリプト言語,またはソフトウェアが有効である.
●Java Javaはアニメーションや音声をHTMLの中に組み込んで制御することのできるオブジェクト指向プログラミング言語である.
Javaで記述されたプログラムをアップレットといい,その種類や用途はクラスによって継承される.
●Shockwave ShockwaveはDirectorで作成したコンテンツをWWWブラウザで表示するための拡張ソフトである.特にインタラクティビティが要求されるデザインに応用される.
◆VRML ホームページ上で3次元CGを動かすための言語である.
Javaが2次元画像を制御するための言語であるのに対して,VRMLは3次元CGを実現するための言語である.

練習問題

下のa.〜j.の文章が説明している事項を解答群より選べ.

a.オーサリングソフトの草分けであるカード型データベース.
b.映画撮影のメタファを用いたマルチメディアオーサリングソフト.
c.リニア構造に限定したオーサリングツールと考えることができる.
d.アニメーションや音声をHTMLの中に組み込んで制御することのできるオブジェクト指向プログラミング言語.
e.ホームページ上で3次元CGを動かすための言語.
f.Directorで作成したコンテンツをWWWプラウザで表示するための拡張ソフト.
g.Directorで使用することのできるスクリプト言語.
h.Directorのウィンドウで,テキスト,サウンド,グラフィックスそしてアニメーションなどのディジタル素材を登録しておく.
i.フレームとチャネルで分割されたセルで構成されるDirectorのウィンドウ.各セルには,キャストの配置情報が記述される.
j.オーサリングにおいてデザインされるもの.

〈解答群〉
ア.Director
イ.構造と変化過程
ウ.Shockwave
エ.LINGO
オ.Java
カ.VRML
キ.PowerPoint
ク.HyperCard
ケ.キャストウィンドウコ.スコアウィンドウ


2.14 仮想現実と可視化

ここがポイント!
計算機上に構築された仮想世界に,どっぶりと浸り込んだような臨場感を与える仕組みが仮想現実.次世代のユーザインタフェースとして注目されている.可視化は計測された形や動きを目に見えるように処理すること.

仮想現実

仮想現実は,視覚だけでなく,聴覚や触覚など,あらゆる人間の感覚に訴えた,直感的なインタフェースを介して実現される計算機上の世界.現在すでに普及しているGUIのさらなる発展形と捉えられる.またできるだけ忠実に現実世界をシミュレートするという意味で,フライトシミュレータなどのシミュレータ開発の延長上にある.宇宙空間内の共同作業など,あらかじめ体験することが難しい状況でのシミュレーションにも用いられる.3D CGゲームヘの応用も盛んである.
●没入感 仮想現実世界にどっぶりと浸ったような臨場感のこと.仮想現実の重要なキーワード.没入感は,立体視や全周ディスプレイなどの映像表示デバイスによって実現される.
◆立体視 左右の目の位置が若干違うことで見え方に差ができる.これが視差である.立体視は視差によって情景の奥行きを知覚すること.

図1 立体後
●偏向板メガネ 光が横波であることを利用して,振動方向が互いに垂直な偏向光を左右のメガネの偏向板から通して見るためのメガネ.

図2 偏向板メガネ

●アナグリフ 左右にそれぞれ赤青のフィルタをつけたメガネを使う.赤と青の合成像がフィルタで分離されて立体視する.

図3 アナグリフ

●レンチキュラ かまぼこ型のレンズを表面に並べたディスプレイ.適度に離れて見ると,左右に別々の映像が提示される.

図4 レンチキュラ

●液晶シャッターメガネ メガネに液晶シャッターをつけてすばやく交互に左右の目をさえぎり,常に左右別々の映像を見るようにした装置.
●パノラマディスプレイ 周囲を取り囲み,人の視界を覆うような全周型のディスプレイ.プラネタリウムやパノラマ映像が従来から知られている.仮想現実で近年注目されている方法に,前方,左右上下の壁面や床面に投影型ディスプレイを配置して全周ディスプレイを実現するというものがある.

図5 パノラマディスプレイ(cave)

●HMD 頭にかぶって左右の目に別々の液晶ディスプレイで映像を提示する装置.頭の動きに連動して,提示する映像の視界を動かすため,頭の位置と向きを検出する空間位置センサが必要である.

図6 HMD

●データグローブ 指の曲がり具合を検出するセンサで,光ファイバを指に沿って這わせてある.指の曲がり具合に応じて光ファイバの光透過率が変化することを利用している.


図7 データグローブ

●空間位置センサ HMDやデータグローブに装着して,空間中の位置を検出する装置.コイルに発生する磁界を利用する磁気センサが主流.

図8 位種センサ


拡張現実

仮想現実の応用・発展形の一つ.半透過型の液晶ディスプレイを装備したHMDを用いて,現実の情景の上に,CG映像を重ね合わせて提示する.順路の誘導や,展示物の解説など,さまざまな用途がある.

図9拡張現実

可視化技術

●モーションキャブチャ 人体などの多関節物体の関節位置にセンサを取りつけて,関節位置を追跡し,動きを獲得する手法のことをいう.
●レンジファインダ 距離センサを用いて情景の奥行き値を計測する装置.距離計測には三角測量の原理やレーダーの原理が用いられる.距離の値を格子状に獲得することによって,距離画像(レンジデータ)を得る.レーザ光を照射する方法,パターン光を照射する方法などがある.

図10 レンジファインダ

●ボリュームレンダリング 物体表面だけでなく,内部の構造までデータとして用意し,描画すること.現在はX線CTやMRIなどの医用画像の可視化にほぼ限られているが,さまざまな分野への応用と発展が期待できる.物体の表面の陰影や反射だけでなく,物体内部の光の吸収などを表現する.

図11 ボリュームレンダリング

練習問題

下の文章は仮想現実に使われる映像ディスプレイについて述べたものである.□を埋める適当な語句を解答群より選べ.

計算機上に構築された仮想世界の中へ身を浸すような[a.]感を得るためには,視界全体を覆うような全周囲型のディスプレイを使ったり,[b.]を得るための特別なメガネを用いる.頭にすっぽりと装着する[c.]は,左右の目にそれぞれ液晶ディスプレイで視差を加えた異なる映像を提示する.[c.]は[d.]が取りつけてあり,頭の位置や向きの変化に応じて視界を移りがえる.[b.]を実現する簡易な装置には,赤青のフィルムを張ったメガネを使う[e.],左右の画像を交互に見るための[f.],かまぼこ型のレンズをディスプレイの縦方向に並べた[g.]などがある.

〈解答群〉
ア.偏向板メガネ
イ.レンチキュラ
ウ.立体視
エ.MDH
オ.液晶シャッターメガネ
カ.HMD
キ.アナグリフ
ク.没入
ケ.投射コ.位置センサ

知識を広げよう
3次元映像:平面の画像に対して,さまざまな立体的な映像の提示方法が考えれられているが,それらは3次元映像と総称される.両眼に視差を含む映像を提示するステレオ画像,何面ものスクリーンを一度に提示するパノラマ映像,メガネを使った立体映像などである.ホログラフィは古くから研究されてきた完全に3次元的な映像である.通常の映像は光の強度を感光フィルムやCCD上に結像させて記録する.しかし,ホログラフィは光の伝播方向や波面や波長など,波動の全情報を記録して再生する.次世代の3次元映像技術はホログラフィから学ぶところが大きい.
多視点画像計測:3次元映像を提示するためには3次元映像の計測技術や合成が必要である.この技術は多視点動画像計測と呼ばれ,3次元映像と密接に結びついている.多数のカメラをドーム状に配置して撮影した動画像を統合して,任意視点からの映像を合成する.ウォークスルーは,そうして得られた映像空間の中を自由に動き回ること.
コンピュータビジョンとグラフィックス:3次元映像の獲得と提示に,モデりングという要素を加味した技術がコンピュータビジョンである.人体などの多関節物体の姿勢や動きをモデル化すれば撮影条件の制約が少ないモーションキャブチャが実現できる.獲得されたモデルを使ってより広範なCGの応用分野に利用できる.ボりユームレンダリングなどの可視化技術との関連づけなど,研究テーマにはこと欠かない.

2.15 大容量記憶媒体

ここがポイント!
マルチメディアを介して音声や画像そして動画を容易に扱うことができるようになった要因に は,高速で安価なCPUの開発とならんで,大容量記録媒体の出現が挙げられる.しかし,各分野で研究されてきた記録媒体には,統一された規格はなく,さまざまな種類がある.そこで,マルチメディア検定ではさまざまな記録媒体の方式や利点などの知識が試される.本節では,大容量記録媒体の代表的なものとして磁気ディスク,光ディスク,そして光磁気ディスクの中から代表的なものを取り上げ,その原理と特徴について解説する.また,持ち運びの可能なリムーバブルディスクの中で一般的なものについて解説する.


磁気ディスク

コイルを磁石に近づけたり離したりするとコイルに電流が流れる.同様の原理から,平面状に小さな磁石を並べ,その上でコイルを動かすとコイルに電気信号が流れる.逆に,平面状の磁性体上にコイルを近づけて電流を流すとコイル付近の磁性体が磁化する.このとき,磁化する場所の配置をある情報に対応させておけば,コイルを動かしたときに流れる電気信号からその情報を取り出すことができる.磁気ディスクの原理は簡単にまとめるとこのようなものである.通常のオーディオテープも同様の原理で音声信号の記録および呼出しを行う.しかし,オーディオでは音声信号だけが扱われるのに対して,磁気ディスクでは文字,画像そして動画などさまざまな情報が扱われる.
磁気ディスクの種類として一般にはフロッピーディスクとハードディスクが挙げられる.以下にそれぞれの特徴について解説する.
●フロッピーディスク 磁性体を塗布した薄く柔らかいプラスチックのディスクである.安価で持ち運びが便利である.
●ハードディスク ハードディスクは磁性体を塗布したアルミニウムなどの硬いディスクで,フロッピーディスクの数百倍から数千倍の容量をもつ.また,読み取りのときに磁気ヘッドがディスクに直接触れず,ディスクを高速に回転させることが可能であるため,フロッピーディスクに比べて読み取りが速い.しかし,フロッピーディスクに比べてハードディスクは高価で,コンピュータ本体の内部に装備されていて持ち運びはできない.


光ディスク

でこぼこした鏡に光をあてると,反射光は,回折によって弱まったり,強まったりする.さらに,でこぼこがきわめて浅い場合には干渉によって光の強弱の差が大きくなる.光ディスクは,光の回折と干渉を利用して,アルミニウム膜にあてたレーザ光の反射光の強弱から情報を読み取る記録媒体である.
光ディスクについて注意すべき点は,通常の光ディスクでは情報の書込みが一度しかできないことである.情報の追記・書換えが繰り返しできる磁気ディスクと比べて,この点が欠点である.しかし,最近では追記のできる光ディスクやPD(90ページ)のように書換えのできる光ディスクも開発されている.
光ディスクの代表的なものを以下に挙げておく.
●CDとCD-ROM CDがもっぱら音声と画像情報を記録するのに対し,CD-ROMはコンピュータで扱う情報全般を記録することができる.ともに直径は12cmで容量は650MBである.
●レーザディスク もっぱら音声と画像情報を記録する記録媒体で,CDより大容量であるため映画ソフトに利用されることが多い.

図1 光ディスクの断面の樟式図と言寿みとり原玉里

光磁気ディスク

磁化した物質に偏光をあてると,反射光の偏光面は磁化の強さに対応して回転する.光磁気ディスクは,このような光の性質を利用して磁気ディスクにあてたレーザ反射光の偏光面の変化から,情報を読み取る記録媒体である.

図2 光磁気ディスクの読取り原理

情報の書込みは磁気ディスクと同じ原理で行われるが,レーザ光線をディスクに当てて磁性体に熱を与えて磁化する点が磁気ディスクと異なる.また,磁気ディスクがプラスチック板やアルミニウム板に磁性体を塗布したものを素材としているのに対し,光ディスクでは希土類一遷移金属のアモルファス合金が使われる.


リムーバブルディスク

単に大容量の記録媒体が必要であれば,記録媒体を大型化すればよい.しかし,今までに述べた記録媒体技術を使うことによって,大容量であると同時に小型化した大容量記録媒体を作ることができる.その結果,取りはずして持ち運ぶことのできる大容量のリムーバブルディスクが開発されている.以下にその代表的なものを紹介する.
●リムーバブル HDD通常のハードディスクはコンピュータの内部に装備され,取りはずして持ち運ぶことはできない.しかしSyQuestTechnology社の規格したリムーバブルハードディスクは,取りはずしの可能な特別なハードディスクである.大きさは3.5インチで270MBの容量をもつものが主流である.
●Zip フロッピーディスクが磁性体として酸化鉄をプラスチック板に塗布しているのに対して,Zipではメタル磁性体をプラスチック板に塗布しているため磁性層がフロッピーディスクに比べて薄い.このことにより,Zipはフロッピーディスクよりも高密度な記録を可能にしている.また,読み取り用の磁気ヘッドに関しても,直接ディスクに触れない方式であるため,ハードディスクと同様に高速の読み取りが可能である.直径は3.5インチ,容量は100MBで価格も手ごろである.
●PD 書換えのできる光ディスクである.光ディスクと同様の原理を利用しているため,CD-ROMなどとの互換性がある.直径は12cm,容量も650MBでCDと同じであるが,PDの場合はプラスチック製のカートリッジに入っていることがCDと異なる点である.
●MO 取りはずし可能な光磁気ディスクといえばMOがその代表である.直径は3.5インチでプラスティック製のカートリッジに入っている.容量は,従来は230MBであったが,最近では640MBのものが主流である.
●MD DATA オーディオ用CDに対してコンピュータ用CD-ROMがあるように,オーディオ用MDに対してコンピュータ用に開発されたのがMDDATAである.MOが直径3.5インチであるのに対してMDは直径2.5インチなので,携帯にはMOより便利である.ただし,容量は130MBでCD-ROMやMOより少ない.

練習問題下の文章の口を埋める適当な語句を解答群より選べ.

マルチメディアを介して音声や画像,そして動画を容易に扱うことができるようになった要因には,高速で安価なCPUの開発と並んで,[a.]の出現が挙げられる.[a.]には[b.]ティスク,[c.]ディスク,そして[d.]ディスクがあるが通常[b.]ディスクは情報の記録は一度しかできない.[c.]ディスクと[d.]ディスクについては,情報の記録に関する基本原理は同じであるが,読み取り方法は全く異なる.[c.]ディスクからの情報の読み取りは,[e.]の性質を利用していることが特徴である.
[f.]ディスクは[d.]ディスクの一つであるが,[g.]と比べると容量は著しく少ないので[a.]とは呼ばれない.[g.]は通常コンピュータの内部に装備されているが,取りはずして持ち運びのできる[h.][g.]も開発されている.

〈解答群〉
ア.大容量記録媒体
イ,光
ウ.光磁気
エ.磁気
オ.偏光
カ.フロッピー
キ.HDD
ク.リムーバブル

知識を広げよう
ユーロピウム添加イットリウムシリケイト:小指ほどの結晶に30時間分のテレビ画像が記録できる新しい画像記録媒体.ホログラフィの理論を利用した記録方式を採用していて,レーザ光を結晶中のユーロピウムイオンという物質にあて,その電子状態を変えることによって情報を記録する.1994年にNTT基礎研主幹研究員の光永正治氏が発表した新技術である.現在実用化はされていないが,将来の大容量記録媒体として覚えておくとよいキーワードである.

 

2.16 ディジタル通信とプロトコル

ここがポイント!
ディジタル通信の最も古い例は狼煙である.狼煙こよる情報通信では,「狼の糞を燃やして煙を上げる」とか,「どのような狼煙がどのような意味をもつか」などの,情報を送る側と送られる側で取り決められた「約束事」が必要である.同様にコンピュータ間のディジタル通信においてもさまざまな約束事(プロトコル)があり,このプロトコルに関する知識がディジタル通信を理解するには必須である.

OSIの7階層

ディジタル通信のプロトコルについては,ISOという国際的権威が関与している.ISOでは,ディジタル通信に関するプロトコルのさまざまなレベルを以下のOSIの7階層に分類している.
@物理層:信号を送るときの電圧や波形など電気的な条件の取決め.
Aデータリンク層:物理的取決めと情報を結びつける論理的な取決め.
Bネットワーク層:ネットワーク上での情報交換に関する取決め.
Cトランスポート層:@,A,Bの各層でのエラー対応に関する取決め.
Dセッション層:通信のときの言語に関する取決め.
Eプレゼンテーション層:文字コードや暗号に関する取決め.
Fアプリケーション層:WWWなどのネット上のサービスに関する取決め.

LAN関連のプロトコル

LANを使ってディジタル通信をするには,コンピュータとコンピュータを電気的に結びつけるための物理層と,電気信号を情報とリンクさせるためのデータリンク層のプロトコルが必要である.これらの2層のプロトコルとして最も普及しているのがイーサネットである.最近では,より高速化したイーサネットとして100Mbpsイーサネットも開発されている.
◆イーサネット Intel,DEC,Xeroxの3社が1980年に考案したLANのためのプロトコルで,PCやWS(ワークステーション)のLAN用として最も普及しているプロトコルである.イーサネットの伝送速度は10Mbpsで,一連のケーブルを複数のコンピュータで共用する媒体共用型LANである.現在用いられているケーブルは3種類で,バス型のLANに使用される10BASE5,10BASE2と,スター型LANに用いられる10BASE-Tがある.

図1 バス型のLAN

図2 スター型LAN

図3 リング型LAN

◎100Mbpsイーサネット 物理的なケーブルとしては10BASE-Tを使いながら伝送速度を10倍の100Mbpsに上げたものである.FastEthemet方式と100BASE-VG方式がある.

バックボーン関連のプロトコル

いくつかの小さい単位のLANをつなげて,より広域のLANを作るための基幹となる通信線をバックボーンと呼ぶ.バックボーンによく用いられる形としてリング型があるが,FDDIとトークンりングはリング型のバックボーンにそれぞれ独立したLANをぶら下げるときに用いられるプロトコルである.

FDDI
Fiber Distributed Datalnterface

●FDDI 最大延長200km,最速100Mbpsの伝送速度をもち,光ケーブルを用いたプロトコルである.最大1000台までの端末を接続することができる.LANそのものにも使用できるが,イーサネットを相互持続するためのバックボーンとして普及している.
●トークンリング IBMの開発した,リング型LANのためのプロトコルである.FDDIと同様にイーサネットを相互接続するためのバックボーンとして用いられることが多い.

広域LANのバックボーン関連のプロトコル

独立したLANを枝葉上にぶら下げるためのバックボーンとして用いられるプロトコルに,ATMとフレームリレーがある.FDDIとトークンリングは物理層とデータリンク層のプロトコルであるが,ATMとフレームリレーはそれらに加えてネットワーク層のプロトコルでもある.
ネットワーク層のプロトコルは情報交換に関する取決めである.このため,データの送信する側と受信する側で物理層とデータリンク層に関しては,同じプロトコルを使う必要はない.したがって異なるプロトコルを採用しているLAN同士を結ぶことができる,そこで,ATMとフレームリレーはより大規模で広域なネットワークのバックボーンに利用される機会が多くなるのである.
●ATM 送信するデータをセルという単位に分割し,必要時にのみ送信するプロトコルである.回線や交換機を必要なときだけ使うため,効率的なデータ送信ができる.同様の方式にインターネットで採用されているパケット通信があるが,各パケットが異なる長さをもつのに対して,セルは固定長であるため,交換機にかかる負担が少ない.
●フレームリレー 送信するデータをフレームという単位に分割し,送信するプロトコルである.パケット通信に比べて伝送制御などが簡略化されているため,高速な通信が可能である.


インターネット関連のプロトコル

インターネットで使われるプロトコルをTCP/IPという.TCP/IPとは,IP(ネットワーク層)とTCP(トランスポート層)の二つのプロトコルを意味する.しかし,広義にはインターネットやインターネットに接続されたLANで使用されるプロトコル全体を指し,イーサネットやFDDIなどの下層プロトコルから,WWWやDNSなどアプリケーション層のプロトコルまでを含む.WWWやDNSは一般にインターネット上のサーバと呼ばれるアプリケーションで,3・9節で解説されているので,ここでは狭義のTCP/IPとして,IPとTCPについて解説する.また,TCP/IPを用いた通信に欠かせないルータについても解説する.
●IP 送信するデータをパケットという単位に分割し,必要時にのみ送信するプロトコルである.ATMとの違いとして,ATMのセルはすべて同じ長さのデータであるのに対して,パケットのセルはデータによって長さが異なる点が挙げられる.第3層のプロトコルであるから,下位層の機能を使いつつ,データの転送制御を行う.

●TCP IPパケットが正しく転送されたかを監視し,制御するプロトコル.
●ルータ IPでは,送られてきたパケットの宛先がLAN内にない場合,ほかのネットワークへ転送する機能をもっている.このような機能をルーティングといい.中継するハードウェアをルータと呼ぶ.

モテム

インターネットやそれに接続されるイーサネットでは専用のケーブルを端末まで引いてくる必要がある.一方,電話回線は,すでに私たちの身の周りに張りめぐらされ,全世界規模の広域を網羅している通信網である.したがって,データ通信に電話回線を使わない手はない.そこで,アナログ信号用の電話回線を用いてディジタル通信を行うために開発されたのかモデムというA/D変換機である.モデムに関しては,Vシリーズという物理層のプロトコルがある.

ISDN

電話回線によるディジタル通信が普及し,モデムの通信速度では高まる需要に追いつかないという問題が浮上してきた.そこで,電話回線を用いたより高速のディジタル通信を可能にしょうという世界的な動きから開発されたのがISDNである.以下ではISDNの基本的プロトコルであるTAとDSU,そして関連事項としてS/T点の解説をする.
●TA モデムがパソコンなどから受け取ったディジタル信号をアナログ的に変復調して電話回線へ送るのに対して,TAは電話機やFAXから浮け取ったアナログ信号をISDN同線用のディジタル信号に変換して送るアダプタである.したがって,TAはISDN対応の機器を使用する場合には必要ない.第1層のプロトコルに属する.
●DS U電話の交換局からの配線をISDN対応の電話機やFAX,そしてTAと相互接続させるための機器.第1層のプロトコルに属する.
●S/T点 DSUから見てTAやISDN対応機器側への出口をS点,TAやISDN対応機器から見てDSU側の出口をT点といい,二つを合わせてS/T点と呼ぶ.通常は図4のように一つの点として考えられる.

図4 TA,ISDN対応機器.DSUの接続図

B-ISDN

現在サービスが開始されているISDN(N-ISDN)では,ディジタル信号を一定の速度で送るSTMという方法が採用されている.しかし,常に通信能力分の回線や交換機の能力を保持する必要があるこの方式は,通信するデータ量が少ない場合には非効率である.そこで,次世代のISDNとして,ATM方法を採用したB-ISDNが研究開発されている.

練習問題

下のa.〜j.の文章内の□を埋める適当な語句を解答群より選べ.

a,ディジタル通信のプロトコルは,□という機関が関与している.
b.□はPCやWSのLANで最も普及しているプロトコルである.
c.いくつかの小さい単位のLANをつなげる基幹となる通信線を□と呼ぶ.
d.バックボーンに用いられるプロトコルにはATMや□がある.
e.インターネットで使われるプロトコルを総称して□と呼ぶ.
f.送られてきたパケットの宛先がLAN内になし・場合,ほかのネットワークへ転送する機能を□という.
g.電話回線網を利用したディジタル通信網を□とよぶ
h.□はISDN対応の機器を使用する場合には必要ない.
i.S/T点は,□とTA,またはISDN対応機器の間に存在する点である.
j.ATMを採用した新しいISDNを□と呼ぶ.

〈解答群〉
ア.TCP/IP
イ.ISO
ウ.バックボーン
エ.B-ISDN
オ.ISDN
カ.フレームリレーキ.ルーティングク.TAケ.DSUコ.イーサネット


2.17 放送システム

ここがポイント!
ディジタル通信技術の応用という点から,新しいメディアを用いた放送方式はマルチメディアと深い関連をもつ.マルチメディア検定でも放送技術に関する問題が出題されており,放送システムに関する知識は重要であるといえよう.本節では現在の放送技術に関する基本的な事項を解説し,ディジタル技術を応用した放送技術として,ハイビジョン,CATV,そしてISDBについて解説する.

現在のテレビジョン

ここでは,現在のテレビジョン技術について最も基本となる知識として,走査線,帰線期間,同期信号,そして放送方式について解説する.
●走査線 ディジタルでもアナログでも通信のときに送られる信号は1次元である.そこで,画像情報を送信するには,カメラによって撮影された2次元の画像情報(光電変換によって電荷量として蓄積されている)を1次元の信号に変換して送信する必要がある.
テレビジョンの画像情報送信では,走査という方法を用いて2次元画像情報を1次元信号に変換して送信している.走査は2次元の画像(電荷量)情報を走査線と呼ばれるきわめて幅の狭い平行線に沿って順次サンプリングする方法である.
●帰線期間 走査線は互いに交わらないため,サンプリングを行っている点が次の走査線を飛び移る時間帯は,送信が途切れる.この時間を帰線期間と呼ぶ.

図1 走査線と帰線期間

●同期信号 走査によって1次元化された画像信号を受け取った受信機(テレビ)側では,2次元画像への復元を行う必要がある.このため,走査の段階で,どの時間区分が帰線期間かを示すために同期信号が画像信号に入れ込まれている.受信側はこの同期信号を目印として,連続した走査線の区間を読み取り,2次元画像への復元を行っている.
テレビ画面を撮影したシーンで,テレビの画面が途中で断絶されて上下に分かれているように見える場合がある.これは,撮影するカメラの走査と,撮影されるテレビの走査の同期が一致していないために起こる現象である.
●NTSC,PAL,SECAM方式 カラーテレビでは,カラーをRGBの3原色に分光して撮影した画像を走査して送受信すればよい.しかし,このようにして送信された画像信号は,従来の白黒テレビで受信することができない.そこで,白黒テレビとの整合性をとるため,RGBの3原色の情報を輝度情報と色情報に変換して送信する方法が考えられた.この場合,白黒テレビでは輝度情報だけに基づいて画像を復元する.実際の放送では,先に述べた方法に画質を向上させるさまざまな工夫が加えられているが,それらの方式は各国によって異なる.NTSC方式は日本,アメリカ,カナダで,PAL方式はイギリス,ドイツ,ブラジル,中国などで,SECAM方式はフランス,ロシア,東欧で採用されている.
●走査線の数 一つの2次元画面を何本の走査線に分解するかという問題は,PCMでサンプリング周波数をいくつに設定するかという問題に相当する.つまり,PCMでサンプリングレートを上げると音質が良くなるように,走査線の数が多いほど画質が良くなる.現状のテレビ放送方式では,NTSC方式で525本,PALおよびSECAM方式では625本,ハイビジョン(後述)では1125本の走査線数が採用されている.
●インタレース走査 一つの画面を走査するには,ある程度の時間がかかる.走査時間は1/100秒単位のごく短い時間であるが,画面のちらつきの原因となる.そこで,実際に使用されている放送方式では,インタレース走査という方式を採用して,ちらつきを最小限におさえる努力がなされている.インタレース走査とは,通常の走査が画面の左上から右下に向かって順次走査するのに対して,走査位置をいくつか飛び越しながら行う走査である.たとえば,2:1インタレースの飛び越し走査では,一つの画面を奇数番めの走査線からなる粗い画像信号と,偶数番めの走査線からなる粗い画像信号に分けて送受信する.

図2 インタレース走査

●フレーム周波数とフィールド周波数インタレース走査では,一つの画面を複数の粗い画面に分解して走査するが,この粗い画面1枚分の画像情報をフィールドと呼ぶ.そして,1画面に含まれるすべてのフィールドを合わせてフレームと呼ぶ.このとき,1秒間に送信されるフレーム数をフレーム周波数,フィールド数をフィールド周波数と呼ぶ.NTSC方式ではフレーム周波数が30で,インタレース比が2:1であるから,フィールド周波数は60となる.

ハイビジヨン

1953年に米国で実用化され,1960年に日本で採用されたNTSC方式は,当時の社会的,技術的条件から制約を受けていた.したがって,NTSC方式では,発達した技術を背景とした現在の社会ニーズに応えられない面がある.そこで,従来のテレビ画像より優れた臨場感・迫力・美しさをもつテレビ放送技術として開発されたのがハイビジョンである.ここでは,ハイビジョンの特徴である画面サイズと走査方式について解説する.
●アスペクト比(16:9) さまざまな実験から,画面のアスペクト比(縦横比)は5:3が最も好まれることが知られている.一方映画のアスペクト比としては1,3:1.0〜2.7:1.0が採用されている.そこでハイビジョンでは,実験で最も好まれたアスペクト比と映画のアスペクト比の折衷案としてアメリカのSMPTEが推奨した16:9をアスペクト比として採用している,
●走査方 式標準の人間の視力を1.0として,ハイビジョンの画面サイズで走査線が見えなくなる最低の走査線数は,100本と試算される.これに,現行のNTSC,PALそしてSECAMへの変換のしやすさを考慮して,ハイビジョンの走査線数は1125本と決められた.また,実験結果から,画像数が60/秒以上の場合にはちらつきが感じられず,動きの再現性については30/秒で十分に滑らかであると感じられることがわかっている.このことから,ハイビジョンでは,インタレース比として2:1を,フィールド周波数として60Hzを採用している.

●MUSE方式 ハイビジョン信号は,映像用としてRGBそれぞれに30MHzの信号帯域を,音声用として20kHzの信号帯域に4チャンネルを必要とする.しかし,実際のハイビジョンにおける伝送・放送・記録では,これらをMUSE方式という方式で8.1MHzに帯域圧縮している.そのためには映像情報を大幅に圧縮する必要がある.MUSE方式では,動画と静止画に対する人間の目の反応の違いを利用し,映像を動き部分と静止の部分に分解し,圧縮している.

その他の新しいテレビ放送システム

ディジタル放送技術の発達は,以上に紹介したほかにも,さまざまなサービスを生み出している.そこで,いくつかの新しい放送システムを紹介する

●CATV 伝達媒体として,空中(電波)ではなくケーブルを用いたテレビ放送をCATVと呼ぶ.地域密着型の自主放送サービスに利用されることが多く,一部では双方向サービスも実用化されている.ケーブルとして同軸または光ケーブルが用いられ,放送を見るためにはセットトップボックスと呼ばれる装置が必要である.また,パソコンを接続するには,ケーブルモデムという特殊なモデムが必要である.

●衛星データチャネル放送 衛星放送のテレビ番組を補完する情報・データの放送サービスと,衛星放送と独立した情報・データの放送サービスからなる放送システムを衛星データチャネル放送と呼ぶ.映像放送に加えて,文字放送やパソコンで受信可能なコンピュータプログラム(テレソフトウェア)の放送が特筆すべき点である.
●FM多重放送 現行のFMステレオ放送に使用されている周波数帯より上の周波数帯を使用した多重放送システムである.テレビ放送に比べると伝達容量が少ないが,簡便な放送設備で放送局を開設できるという利点がある.また,自動車など移動体向けのサービスに有利である.
●ISDB 一つの搬送波上に音声,映像,静止画像,データ,文字,ファクシミリなどをのせた統合ディジタル放送の構想が,ISDBと名づけられている.地上放送用の周波数帯がほぼ利用されつくされていることから,ISDBの実現には衛星放送の利用が最適であると考えられている.

練習問題

下のa.〜k.の文章内の□を埋める適当な語句を解答群より選べ.

a.□の本数が多いほどテレビ画面の質が良い.
b.□周波数が大きいほどテレビ画面の質が濃い.
c.日本のテレビは□方式を採用している.
d.ハイビジョンの□は16:9である.
e.ハイビジョンの走査線数は□本である.
f.□走査とは,走査線を飛び越しながら行う走査である.
g.衛星を用いた□では,コンピュータプログラムも放送される.
h.□放送は現行のFM放送より上の周波数帯を使用する.
i.CATVをパソコンに接続するには□が必要である.
j.□は,次世代の統合ディジタル多重放送の構想である.
k.ハイビジョンでは,映像と音声信号を□方式で圧縮している.

〈解答群〉
ア.インタレース
イ.ISDB
ウ.NTSC
エ.フィールド
オ.走査線
カ.MUSE
キ.ケーブルモデム
ク.1125
ケ.FM多重
コ.データ放送
サ.アスペクト比