画像作成ツール

ドローツール、ペイントツール、フォトレタッチツール


パソコンを用いた2次元静止画像の作成や加工には、ドローツール、ペイントツールそしてフォトレタッチツールと呼ばれるソフトウェアが頻繁に用いられる。マルチメディア検定では、これらのツールを使いこなすために必要な知識と、画像形式の知識が必ず試される。


ベクトル画像とドローツール

ベクトル画像は、直線や曲線の情報を点と点を補完する数式として定義する画像である。したがって、ベクトル画像では、図形をどのようなサイズに拡大、または縮小しても粗くなったり滑らかさに欠けたりすることがない。一般にドローツールと呼ばれるものは、ベクトル画像を描くためのソフトウェアまたはツールを指す。

図1 ベクトル画像

図2 ラスタ画像

 


ラスタ画像とペイントツール

ラスタ画像は、画像を行と列に細かく(例えば640×480に)分割し、各セル(ピクセル)に色や明るさを定義する画像である。ビットマップと呼ばれる場合もある(ただし、厳密にはビットマップ画像は、各ピクセルが白と黒だけであるモノクロ2階調の画像をいう。
灰色を含むモノクロのラスタ画像はグレースケールビットマップ、色情報をもつラスタ画像はカラービットマップと呼ばれる)。ラスタ画像は、拡大した場合に四角形のピクセルが見えて、図形の輪郭部分にはジャギー(ギザギザ)が現れるのが特徴である。ラスタ画像を描くためのソフトウェア、またはツールをペイントツールと呼ぶ。大きなサイズのラスタ画像を扱う場合、一般的にはベクトル画像のファイルよりサイズが大きいことに注意する必要がある。


フォトレタッチツール

ラスタ画像の中で、幅広いグレースケール(例えば16階調)と多種類(例えば256種類)の色から構成される写真などの画像を編集するためのソフトウェアまたはツールをフォトレタッチツールと呼ぶ。代表的なフォトレタッチツールにはAdobe社のPhotoShopがある。


フィルタ

フォトレタッチツールで頻繁に利用される機能にフィルタがある。フィルタは、画像の各セルの位置を移動したり、色を変更したりする機能で、代表的ものには以下のようなものがある(図3〜図8参照)。

●シャープ 
周囲のピクセル群と明るさの異なるピクセルを輪郭として認識し、その部分のコントラストを強くして、よりシャープな画像を得る。

●ボカし 
輪郭部分のコントラストを下げることにより輪郭強調とは逆に輪郭をボカす。

●エンボス 
浮き彫りにしたような画像に変換する。

●ポスタリゼーション 
画像の階調変化を段階的に変化させ、なだらかな濃淡をなくして平板な色調の画像に変換する。

●輪郭抽出 
周囲のピクセル群と明るさの異なるピクセルを輪郭として抽出し、描画する。


ガンマ曲線を用いたフィルタ

図9に示されるような入力レベルと出力レベルの関係を表した曲線をガンマ曲線と呼ぶ。ガンマ値は図中に示された傾きの大きさを表す指標である。このガンマ曲線をフィルタに用いることにより、コントラストを調整することができる。1より大きいガンマ値を用いると、明るい部分がより強調され、1より小さいと暗い部分が強調される。

図9 ガンマ曲線

 

2値化

写真画像のように、各ピクセルがさまざまな濃さのグレーに設定されている画像を階調画像という。これに対して、各ピクセルが白または黒だけに設定されいる画像を2値画像という。2値化とは、階調画像を2値画像に変換するデータ処理のことである。2値化に必要な技法を紹介する。

●閾値法(しきいちほう)
ある濃度以上の階調のグレーピクセルを黒に、それ以下の濃度のグレーピクセルを白に変換する方法。このとき用いる基準濃度の値を閾値と呼ぶ。この閾値を適当な値に設定することにより、汚れ部分を取り除くことができる。

●ディザ法 
グレーの部分をピクセルに分解し、その階調度に従って白と黒のピクセルの集合に変換する。ピクセルの分割が細かければ、人間の目にはグレーに見える。ファクシミリや、濃度差の出せないカラープリンタがこの方式を用いている。

●網点化法
白地に黒の網目模様を用いてグレーを表現する。細かい網目を用いることにより、ディザと同様に人間の目にはグレーに見える。
モノクロプリンタでグレーを表現する場合にこの方式を用いている。


図3 元の画像

 

図4 シャープ

図5 エンボス

図6 ボカし

図7 ポスタリゼーション

図8 輪郭抽出
 

図10 ガンマ曲線をフィルタに用いた処理

図11 閾値法による2値化



図12 ディザ法


図13 網点化法


レタッチ

画像の汚れ部分をきれいにしたり、使用目的に合わせて修正を加えたりする作業をレタッチという。フォトレタッチツールの名はこれに由来する。以下に代表的なレタッチ手法を紹介する。

◆ピクセルコピー 
ピクセルデータをコピーして別の場所に複製する。

◆ブラッシング 
ブラシを用いて色を塗ったような効果を得るツール。

◆トリミング 
画像の中で指定した部分だけを残すツール。

●マスク 
修正の対象とならない部分を指定する。



文字コ一ドとフォント


文字を計算機で扱うために、文字ひとつひとつに文字コードが割り当てられる。文字コードの集まりが文字セットで、これに対して文字の形や大きさなどをデザインしたものがフォントである。



ASCIIとJIS X 0201

■ASCII 
文字を1バイトで表した文字コードが1バイトコードで、2の8乗=256文字まで一度に表すことができる。また、2バイト=2の16乗=65536文字を表せるコードが2バイトコードである。欧文の場合はASCIIコードが典型的な1バイトコードである。ASCIIコードは1バイトのうち7ビットに英数字、記号、改行などの制御コードが割り当てられる。残りの1ビットはパリティビットで、誤り検出に用いられる。

■JIS X 0201 
ASCIIのパリティビットに相当する部分を利用してカタカナを割り当てた和文用1バイトコード。このコードの128から255の間に割り当てられたカナ文字を慣習的に半角カナという。

◆7ビットコードと8ビットコード 
ASCIIコードのように、実質的には1バイト中の7ビットしか使わない文字コードを7ビットコード、JIS X 0201のように8ビットすべてを使うコードを8ビットコードという。

漢字コード
●JlS X 0208 
漢字も扱えるようにした和文の文字セットがJIS X 0208である。仮名、英数字、記号、常用漢字を含む第一水準文字3489字と、人名や地名などに使われる第二水準の3390字に分かれる。JIS X 0208を計算機上で扱うための2バイトのコードに、JIS、EUC、SJISの3種類がある。

●JISコード 
単にJISコードと呼ばれることが多いが、JIS X 0201やJIS X 0208と区別するために、国際規格としての名称1S0 202 2JPを使うほうがよい。日本最初の学術的実験インターネットであるJUNETで使われ、このためJUNETコードともいう。

■EUC 
拡張UNIXコード。日本のほかにも韓国、中国などで独自の規格があり、日本語のコードは特にEUC-JPという。UNIXでは、電子メールにはJIS、そのほかの漢字コードにはEUCと使い分けてきた。

◆SJIS 
PC/AT互換機やマッキントッシュなど、パソコンで使われる文字セット。JIS X 0201とバイト単位で重ならないように、JIS X 0208のコードをシフトさせて作った文字コードである。

●そのほかの文字セット 
JIS X 0208と関係なく、中国や韓国、台湾の似た漢字を同じコードで表した文字セットにUnicodeがある。2バイト65536字で世界中すべての文字を表そうとするものであり、JavaやWindows NTなどで採用されたが、漢字圏からの批判が多く、規格化・普及は難航している。


フォント

文字の書体、あるいは字体のこと。和文ならば、新聞、雑誌などで最も広く使われている細明朝体見出し語などに使われる中ゴシック体が標準的に使われる。POP体や丸ゴシック体などはチラシ広告などに使われる。
欧文には、ルネサンス期に古代ローマの碑文を復興したローマン体が最も広く使われ、明朝体と同様に縦線が横線より太く、また明朝体のウロコに相当するセリフが特徴的である。セリフがないヘルベティカ、ペン字風のイタリック体もある。そのほか、基本フォントから斜体や太字体などが派生する。

図1 各種のフォント

◆フォントファミリーとフォントサイズ 
フォントは書体名と大きさで指定されるが、書体名はフォントファミリー、大きさはフォントサイズとも呼ばれる。フォントサイズはpt(ポイント)で表される。1ptは約1/72インチ、1インチは約25.4mmであるから、1ptは0.35mm程度である。インチはアメリカやイギリスで慣習的に使われる長さの単位。画素数や解像度もインチ単位のdpiで表されることが多い。

■ビットマップフォントとアウトラインフォント 
フォントは文字セットと対応させて計算機の上で扱われる。文字形状をフォントとして数値化する方法には大きく分けて二つある。一つは、文字をビットマップとして標本化する方法で、こうして得られるフォントをビットマップフォントという。もう一つは文字の輪郭線を直線や円弧などの数式で表したもので、アウトラインフォントという。
ビットマップフォントは、フォントサイズが固定されている場合には都合がよい。アウトラインフォントは、ディスプレイに表示するたびに輪郭線の内側を塗りつぶしてビットマップデータに変換(ラスタ化)するため、計算コストが大きいが、文字を自由に拡大・変形でき、常に高品質な文字表現が可能である。



図2 ビットマップフォントとアウトラインフォント


図3 アウトラインフォントのラスタ化


◆等幅フォントと可変幅フォント 
文字幅や間隔が一定のフォントを等幅フォントというが、これに対して文字幅が文字によってそれぞれ違うフォントを可変幅フォントという。和文は原稿用紙のマス目に文字を埋めていくように、縦横整列した等幅・等間隔で書かれることが多い。しかし、欧文フォントはそのほとんどが可変幅フォントである。


図4 等幅フォントと可変幅フォント



DTP


かつて出版は、執筆、作図、校正、組版、製版、印刷、製本などの多くの工程に分かれていたが、DTPによって、執筆から組版までを、デスクトップ環境で、ごく少ない工程で行うことが可能になった。

DTPの構成

原稿や図面から、印刷用の版を作る工程をプリプレスというが、このプリプレスの主要部分である組版を、パソコン上で行うのがDTPである。
組版はかつて植字と呼ばれ、独立した専門職であったが、DTPの登場で、デザイナ-や執筆者、編集者などが、SOHOでプリプレス作業を完了し、印刷所や出力センターに版を持ち込んで印刷できるようになった。

◆レイアウト 
DTPの作業は、まず、コラムやマージンなどの、ページ上の区割りを決めることから始まる。さらにどの枠にどの図や文書などの要素を当てはめ、埋めていくかを決める。これをレイアウト、または割付けという。文書や図はあらかじめワープロやペイント系ソフト、ドロー系ソフト、フォトレタッチ系ソフトなど、ほかのソフトで作成しておく。ディスプレイ上に図やコラムなどの要素が実際に印刷されるときと同じ体裁で表示され、リアルタイムで修正が加えられる。これがWYSIWYGである。

■組版 
DTPソフトはレイアウトソフト、ページレイアウトソフトともいわれるが、組版ソフトともいわれるように、DTPの主な役割は組版である。組版とは、原稿を元に活字を組んで、図や写真などとともにレイアウトしていくことである。原稿ファイルを読み込み、ページ上の決められた枠の中を埋め尽くすように挿入していくことを流し込みという。章や節などの文書構造を含む長文の原稿も、コラムからコラム、ページからページに渡って自動的に流し込まれる。すでに挿入した図などの要素を避けるように文章を流し込むことを回り込みという。

図1 流し込み

図2 回り込み


ぺージ記述書語と製版

●ページ記述言語
ページ上の文書や図形などのあらゆるレイアウト情報を記述し、記録しておくためのプログラミング言語がページ記述言語である。ページ記述言語は文字や図などのあらゆる要素の配置を記述するレイアウト記述言語であり、要素はすべて図形として扱われる。

※ Adobe社のPostScriptが、DTP業界標準のページ記述言語である。
業務用の代表的なDTPソフト、Adobe社のPageMaker、QUARK社のQuarkXPressの両者がPostScriptを採用している。PostScriptデータを印刷所や出力センターに持ち込めば、PostScript対応イメージセッタで版下を作成し、製版・印刷できる。また、PostScript対応レーザプリンタにPostScriptデータを送って紙に印刷することもできる。
1985年に公開され、1990年にPostScriptレベル2が発表された。また、画像ファイル変換やマスク処理などの機能が強化されたPostScript3が1996年に新たに発表された。


図3 DTPと電子出版の形態



DTPの関連分野

◆ワープロ系のDTP
近年ではWindows上のワープロのDTP機能が注目されている。PageMakerやQuarkXPressなどの業務用ソフトは、もっぱらPostScript形式のデータやフォントを使っているが、Windows系ではTrueTypeという簡易フォントを使い、パソコン上でラスタ化し、Windows対応の安価なプリンタで印刷する手法が主流である。また、TrueTypeフォントで作成したデータをイメージセッタから高解像度出力する方法も採られている。

●電子出版、オンライン出版 
版下を作成して商用印刷したり、レーザプリンタで紙に印刷するだけでなく、DTPの技術は電子出版やオンライン出版にも応用される。電子出版は、組版された結果を印刷することなく、CD-ROMなどのパッケージを制作することである。また、オンライン出版はWWWページをデザインしたり、ニュース記事・小説などをHTMLやPDFなどの文書ファイルに変換して、電子メール、WWW、パソコン通信を通じて配布、販売することである。



DTPの技術

◆執筆 
文章の執筆にはワープロが使われる。FEPは自前の辞書を参照して、入力されたカナ、またはローマ字をカナ漢字交じりの文に変換する。文字の書体や大きさ、下線や斜体などの装飾もまたWYSIWYGの要領で入力・修正していく。現在では流し込みや割付けなどのDTP機能をもったワープロが普及しているので、執筆と平行して、ある程度の組版やレイアウト作業を済ませてしまうことが多い。

●スペーシング 
文字間隔、単語間隔、行間隔、段落間の間隔など、ページ上の要素のさまざまな間隔を調整することをスペーシングという。
特に、欧文の単語間隔を均等に割り付けることをスペーシングということがある。単語の割付けには、一行の両端を揃えるための均等割付けのほかに、右端揃えや左端揃えなどがある。

■カーニング 
文字間隔を広げたり狭めたりすることを特にカーニングという。欧文、和文の両方で行われるが、主に欧文の可変幅フォントの場合に重要な意味をもつ。一つの単語の中で文字間隔を均等に空けたり、均等に詰めたり、特定の隣り合う文字の間を詰めたりする。
カーニングの度合いは文字幅だけではなく、文字の形によって決まる。たとえば、Pという文字は右下に隙間があるので、Aのように左下がせり出した文字や、aのように背が低い文字を、Pの右下の隙間に潜り込ませることで、より自然な文字間隔を指定することができる。


図4 スペーシングとカーニング

 

知識を広げよう
組版はグーテンベルグの活版印刷術の普及以来、活字を一つずつ拾って版に組むことによって行われてきたが、近年では重い鉛の活字の代わりに、写真の現像の要領で文字や罫線を直接印画紙やフィルムに焼き付けるようになった。これが写真植字(写植)である。
さらに計算機が導入され、フォントをアウトラインフォントとしてデータ化し、原稿や図版などのデータをすべて計算機上で扱うようにしたのが電算写植。全自動電算写植機によって高速に組版可能で訂正も楽になった。今日のDTPの前身にあたる。




ディジタル画像


赤、緑、青の3色の要素からなる光の点、つまり画素を、縦横に並べたものがディジタルカラー画像である。カラー画像を取り込み、加工することによって、さまざまな形式の画像が得られる。

 

色空間

人の網膜には赤(R)、緑(G)、青(B)それぞれの波長の光を感じる細胞が並んでいる。人はこれら3種類の細胞が受容する刺激の強さの比率でさまざまな色を感じる。このためにRGBを3原色という。白色光や無彩色の光を感じるのはRGBの刺激がちょうど均等な場合である。R=G=B=0のときは光がないので全くの黒(K)である。RGBをそれぞれ1バイト、即ち256段階で表して、R=G=B=255のときを最も明るい白(W)とする。このように、色をRGB合わせて3バイト(=24ビット)で表すことをフルカラー、あるいは24ビットカラーという。

◆RGB空間 
RGBを24ビットで表すと、256×256×256の立方体の格子に、すべての表現可能な色が含まれる。この空間をRGB空間という、この空間には256×256×256=(28)3:224=約1670万色が含まれる。KとWは対角線上の両端の頂点に位置する。

図1 RGB空間と色相環

●補色 
RとGを混色すると、黄色(Y)を感じ、GとBの混色にシアン(C)、BとRの混色にマゼンタ(M)を感じる。シアンは明るい水色、マゼンタは明るい紫色(濃いピンク色)である。RとC、GとM、BとYはRGB空間上で対角線の両端に位置し、互いに補色関係にあるという。KとWを通る無彩色の直線がちょうど一点に重なるようにRGB空間を平面に投影すると、RYGCBMR……という順番の色の輪ができる。この輪を色相環という。色相環で点対称の位置にある色は互いに補色である。

◆明度、彩度、色相 
色相環の中心は無彩色で、中心から遠ざかるほどあざやかな色になる。色相環上の中心からの距離を彩度という。また、KとWの間でWに近いほど明度が大きいという。このように、明るさの度合いを明度で表し、あざやかさの度合いを彩度で表し、色の違いを色相で表した色空間をHSVという。HSV空間はRGB空間よりも人間の直感に近いために、色指定にしばしば使われる。また、多くのアプリケーションソフトは、色空間を色相と明度の矩形と、彩度のスライダの組で表す。

図2 HSV空間

図3 色相と明度の矩形


標本化と量子化

ディジタル画像はRGBで表された色を平面に格子状に並べたものである。ひとつひとつの格子点を画素という。画素は、平面に投影された像から色を読み取った点であるから、標本点ともいい、この点で値を採取することを標本化という。カメラやスキャナなどの画像入力装置から得られた標本値はRGBそれぞれ256段階の値に近似されるが、このようなとびとびの値に近似することを量子化といい、量子化された値を階調値という.


図4 画像の標本化。量子化。再標本化

◆拡大縮小 
画像全体の範囲はそのままで、縦横の標本間隔を変えると、画像を拡大したり縮小したりできる。このとき、隣り合う画素をもとに、中間の画素の値を新たに作ることを補間という。補間には、内分値を使う双線形補間や、3次スプライン関数などで画素の変化を近似する双3次補間などがある。画像の拡大縮小は、すでに標本化された画像から新たに画素の並びを作り出すことであるから、再標本化ともいう。画像を平行四辺形や台形などの形に変形する場合にも再標本化を行う。

◆エイリアシング 
標本化や再標本化によって生じる視覚的不具合のこと。画像の解像度を変えたときなどに起きる。標本点数が少ないか、標本間隔が大きすぎるために生じる。過標本化してエイリアシングを防ぐことをアンチエイリアシングというが、その分計算コストがかさむ。


図5 エイリアシング

◆ラスタデータとベクトルデータ
画像データはラスタデータとも呼ばれ、これに対して輪郭線データや線画など、標本化されていない図形データはベクトルデータという。ベクトルデータは階調表現には向いていないが、解像度やデバイスに依存せず、拡大縮小などの変形が自在にできる。アウトラインフォントは典型的なベクトルデータであり、輪郭線は線分や円弧、3次曲線などの数式で表現される。ペイント系ソフト、フォトレタッチソフトはラスタデータを扱い、ドロー系ソフトはベクトルデータを生成する。微妙な階調表現を必要としない図形データはベクトルデータでもっているほうがエイリアシングなどの劣化がない。
ラスタデータをベクトルデータに変換することは容易ではないが、逆は標本化によって比較的簡単にできる。プリンタで印刷したりディスプレイに表示したりするために、拡大縮小したベクトルデータを特定の解像度でラスタデータに変換することをラスタ化という。


図6 ラスタデータとベクトルデータ

 

知識を広げよう
加法混色と減法混色:CRT(ブラウン管)の上では、管面に塗布された蛍光物質に電子線が当たることによってRGBの三色が発光し、それらの混色によってさまざまな色が表現される。色が混ざるほど明るくなることから、この混色を加法混色という。
原色のRGBよりも混色であるCMYが明るく、白はさらに明るい。ところがインクは原色ほど明るく、混色するほど暗くくすんだ色になる。そこで、印刷物など、インクを使った混色には、明るいCMYを原色として、RGBなどのより暗い色を混色して作り出す。このような混色を減法混色という。
CMYをすべて混色しても完全な黒を作り出すことは難しいので、カラー印刷ではさらに黒(K)を原色として加えて、CMYKの4色を原色として使う。CMYK以外の色のインクは「特色」といい、特定の色を混色せずに確実に指定したい場合や、金、銀のようにCMYKでは表現できない色を指定する場合に使われる。

10ビットや12ビットの量子化:フルカラー画像はRGBそれぞれ8ビット(=256階調)に量子化されており、視覚的には8ビットで十分滑らかな階調を表現できる。スキャナは10ビット(=1024階調)や12ビット(=4096階調)で画像を取り込むことがあるが、これは量子化された画像が暗すぎたり明るすぎたりして、階調の偏りを補正するときに、実質的な階調数が減ってしまうためである。また、X線CTなどの医用画像も8ビットより多くの階調で量子化されるが、これは画像処理によって細部を強調したりして、より精密な検査を行うためである。高品質な音声データは16ビットで量子化されるが、これは視覚よりも聴覚が、より広いダイナミックレンジをもっていることを意味しているといえる。



画像ファイル形式とフォトレタッチ


画像のしみや汚れを取り除いたり、色合いを調整することがフォトレタッチ。コラージュやモンタージュのような大胆な画像合成にも使われる。用途に合わせたさまざまな画像ファイルの形式がある。

フォトレタッチ

写真を計算機に取り込んで、さまざまな画像処理を施すことをフォトレタッチという、「フォトレタッチ=画像処理」と考えてよい。フォトレタッチソフトとしてはAdobe社のPhotoshopやPhotoDeluxeが有名である。フォトレタッチソフトはほとんどがさまざまな画像ファイル形式に対応しているので、画像ファイル形式変換ソフトとしても使われる。

●フィルタリング 
画像全体にわたって画素値を変換したり、画素値に局所的な微分・積分処理などを施すこと。色調を変えたり、輪郭をなまらせたり強調したりできる。

●反転 
ネガのように、最も明るい色が最も暗く、最も暗い色が最も明るくなるように階調値を入れ替えること。黄色は青に、青は黄色にというように、補色どうしも入れ替わる。

●ボスタリゼーション 
意図的に階調数を減らし、ポスター画のような平板な感じの絵にすること。256階調を4ないしは6階調に落とす。

●コントラスト強調
中間階調を減らし、白黒をはっきりさせること。
まったく中間階調をなくしてしまうことを2値化といい、そのような画像を2値画像(ビットマップ)という。

●ボカし 
局所的に積分処理を施して、輪郭をボカすこと。ノイズを除去するためにも用いる。輪郭は画素値が急に変化している画素のこと。
エッジともいう。物体の外輪郭だけでなく、目や唇の境界などを含む。

●先鋭化 
ボカしの逆操作で、画像に微分処理を施して輪郭を抽出し、元の画像に輪郭を合成して、輪郭を強調する(シャープにする)こと。

●エンボス 
微分処理で輪郭だけを抽出し、浮彫りのような凸凹の効果を出すこと。

●モザイク 
粗い格子で画素を区分して、格子内で画素値を平均化すること。解像度を落とした再標本化ということもできる。

●コラージュ、モンタージュ 
複数の画像を組み合わせて、一部加筆して、実在しない画像を合成すること。マウスなどの指示装置で切り抜く領域の輪郭を指定したり、画素値がほぼ均等な領域を自動的に切り出し たりする。切抜きをクリッピングともいう。合成した境界部分はボカして目立ちにくく処理する。

●文字の影付け
文字をボカした画像を文字の奥に重ねること。奥行き感が出る。

図1さまざまなフィルタ


画像ファイル

可逆圧縮と非可逆圧縮 
画像は冗長なので、圧縮するとかなり小さくなる。このため特にネット上でやり取りされる画像ファイルは圧縮されることが多い。画質を全く落とさずに圧縮することを可逆圧縮といい、圧縮前の画像を完全に復元することができる。GIFやPNGに使われているLZW圧縮などが可逆圧縮。一方、非可逆圧縮は、目立たない冗長性を除去してさらに高い圧縮を行うもので、JPEGに使われているDCTが代表的な非可逆圧縮である。

アーティファクト 
非可逆な画像処理(再量子化、画像強調、画像復元、画像圧縮など)によって生じるさまざまな視覚的不具合のこと。JPEGやMPEGなどの高圧縮画像で顕著になる。情報量が少ない画像の解像度を無理に上げようとしたために起こる。圧縮率を小さくする、画像サイズを小さくするなどして、画質自体を向上させなくては根本的解決にならない。



図2 アーティファクト


◆限定色 
フルカラー画像に含まれる1670万色の中から、実際に使われている色だけを抜き出して、色数を減らすこと。GIFなどで使われる。


画像フォーマット

●GIF 
アメリカのパソコン通信ネットワークCompuServeで定められた画像形式、256限定色なので、風景画や肖像画のように、色調が滑らかに変化する画像をGIF形式にすると、擬似輪郭が生じる。イラストやクリップアート、アイコンなど、もともと色数が少ない画像を高圧縮率で圧縮するために適している。動画用のアニメGIFや、背景を切り抜いた透過GIF(いずれもGIF89aと呼ばれるGIFの拡張形式)などがある。

■JPEG 
画像処理技術者の集まりが定めた、風景画や肖像画などの、自然画を圧縮するための画像形式。圧縮率は高い。もともと色数が少ない画像をJPEG形式で圧縮すると、アーティファクトが目立つ。

●PNG 
フルカラー画像の可逆圧縮で、WWWコンソーシアムが提案した。画質を全く。落とさずに中程度の圧縮を実現する。

■TIFF 
Aldus社(現Adobe社)が提案した画像形式。可逆・非可逆、限定色、RGB、CMYKなどさまざまな種類の画像を一つの汎用形式に統合している。Adobe系のCGソフトで使われるほか、Macでは広く使われている。

◆IFF 
Amiga社が定めた画像形式。Amiga系のCGソフト(Light-Wave3Dなど)で使われる。非圧縮。

◆TGA 
Truevision社が定めた画像形式。Amiga系のCGソフトで使われる。非圧縮。

◆PICT 
MacOSで標準的に使われる画像ファイル形式。

◆BMP 
Windowsで標準的に使われる画像ファイル形式。非圧縮。

◆PhotoCD 
通常の写真フィルムをプリントせずCD-ROMに焼くときに使われる形式。ラボで頼めばプリントではなくPhoto-CDを作ってくれる。

◆EPS 
文書中に挿絵として挿入するために作られたPostScriptファイル。パソコン上でプレビューするための表示用のデータが添付される。


知識を広げよう
OCR:
光学式文字読みとり装置のことだが、現在ではスキャナに添付する文字読み取りソフトのことをOCRソフトと呼んでいる。文書画像や図面をスキャナから読み取り、文書領域や文字領域を自動的に抽出し、パターン認識手法を用いて、文字コードデータを生成する。葉書の郵便番号の読み取りには、さらに高度な手書き文字認識処理が行われる。OCRソフトは通常特定の書体の活字しか読み取れない。

ロッシー、ロスレス:
可逆圧縮は元の画像を完全に復元できるので、無損失(ロスレス、1ossless)と呼ばれることがある。また、非可逆圧縮は損失があるので、ロッシー(lossy)とも呼ばれる。WWWでは可逆な画像のやり取りに使われる画像形式がなかったために、最近PNGという形式が提案された。これは可逆なLZW圧縮を使い、フルカラーの画像を符号化したものである。

ルミナンス、クロミナンス:
非可逆圧縮では、RGBを明度(輝度信号、ルミナンス)とそれ以外の色情報(色差信号、クロミナンス)に分けて、輝度信号と色差信号を別々の圧縮率で圧縮することがある。これは、色差が輝度よりも劣化が目立たないために、高圧縮可能だからである。
アナログビデオ信号も輝度と色差に分けて時間軸方向に圧縮し、伝送する。


CG

モデリング


形や動きなどを計算機の上で扱えるように数値化したものをモデルという。CGはモデルを得ることと、モデルを描くことに大きく分けられる。モデルの獲得をモデリング、モデルの描画をレンダリングという。

モデリングとレンタリング
モデリングはものの動きや形、表面の模様やツヤ、成長や侵食、流れや伝播など、現実世界のあらゆる事象を計算機の上で扱えるように数値化することである。したがって、その扱う範囲は限りなく広い。これに対してレンダリングは、いったんモデルとして獲得されたデータを、画像の上に描画することであるから、その守備範囲は狭いが深い。モデリングはそれぞれの事象に適したさまざまな手法が採られ、そのためにレンダリングから分離される。レンダリングは汎用的なインタフェースと、モデルを効率的に描画するように特化したハードウェアやソフトウェアを提供する。

図1 GUIモデラ


GUlモデラによるモデリング

GUIを駆使して、矩形または三角形のポリゴンを空間に配置し、色や模様などのポリゴンの属性を与える作業工程について解説する。

●3面図
GUIモデラは上面図、側面図、正面図の互いに直交するS方向から見た図面を見ながら、WYSIWYGの手法でモデルを 作っていく、さらに透視図を見ながら、実際の3次元形状を確認する。透視図はポリゴン表示、メッシュ表示、またはOpenGLを用いた陰影付け表示によって、リアルタイムにおおまかなレンダリングを表示する。

●モデルの種類 
ワイヤフレームモデルは頂点と辺の情報だけをもったモデルである。ワイヤフレームモデルの辺がどのように面を張るかを決めたものをサーフェスモデルという。サーフェスモデルの面はポリゴンともいい、レンダリングで陰影づけするための面の属性を割り当てる。

図2 ワイヤフレーム

図3 サーフェスモデル

●ソリッドモデルとCSG表現 
立方体や円錐、球など、物体の内外判定が可能なプリミティブで表されるモデルをソリッドモデルという。いくつものプリミティブをAND、OR、差などの論理演算によって合成することによって、複雑な形状を作り出す。これをCSG表現という。

図4 CSG表現

●スイープ表現 
曲線や面などをある曲線(スイープパス)に沿って動かすことを掃引、またはスイープという。スイープした結果得られる軌跡からスイープ表現形状が得られる。

図5 スイープ表現

●自由曲面 
ベジエ曲面や双3次スプライン曲面などの自由曲面で滑らかな物体表面をモデリングする。制御点を動かすことによって面の形状を連続的に変化させることができる。

図6 自由曲面

●メタボール 
正負の電荷を空間に配置してできる等電位面を物体形状のモデリングに応用したもの。泡やしずくのような不定形の物体のモデリングに使われるほか、人体などの複雑な形状を表現することもできる。

図7 メタボール

計測に基づくモデリング

自然なモデルを手作業でデザインすれば、丹念で長時間の労働が必要になる。そのため、センサを用いて自然界の動きや形を計測してモデリングする。レンジファインダやモーションキャブチャなどの技術が利用される。

図8 計測に基づくモデリング


手続き的なモデリング

モデルを数式やプログラムで定義し、計算機上で合成すること、樹木の構造や河川、雲、煙や炎などの、一見複雑ではあるが、単純なモデル化が可能な自然現象はフラクタルと総称される。樹木を生成する規則をLシステムといい、大理石や墨流し模様のようなテクスチャを作ることを手続き的テクスチャという。

図9 手続き的テクスチャ


物理に基づくモデリング

ボールがはねたり、旗がはためいたり、服が体にまとわりついたりというような物理現象を計算機上でリアルタイムでシミュレートしたり、滑らかで自然な動きを表現すること。デザインの手間を大幅に省略できる。

 

図10 物理に基づくモデリング

知識を広げよう

モデリングと自然:
自然界には膨大な情報が存在している。技術がどのように発達しても、それらすべてをモデルとして獲得し、計算機上で模倣することはできない。モデリングは、自然現象のほんの一部を数式などで取り出したものだという見きわめが必要。いかに巧妙な理論`モデルでも、モテル化されなかったほかの要素を見落としてしまうことになる。むしろ巧妙なモデルほどその欠点に気づきにくくなるといえる。人工生命、遺伝的アルゴリズム、神経回路網など、つぎつぎに新しい理論がCGのモデリングに応用されるが、流行を追っても現実世界を模倣できるとは限らない。

フラクタル、カオス、複雑系:
一見無秩序に見える自然界の現象に、ある統計的な秩序が存在すること、無秩序にも、さまざまな段階があることを明らかにした理論がフラクタルやカオス、あるいは複雑系である。
カオスは無秩序のこと。フラクタルは細切れとか断片のこと。カオスや複雑系が時間軸に沿った変化を主に研究するのに対して、フラクタルはどらかといえば樹木や雲などの静止した形に注目する。しかしこれらは密接に関連している。フラクタルは驚くほど簡単な数式で自然界の複雑な現象を表現できることがある。炎や煙の表現に使うパーティクルシステム、手続き的テクスチャなどはそれらの理論がうまく役立った例である。



レンダリング


3次元のモデルや情景を2次元の映像上に表現することをレンダリングという。写真のような写実的なレンダリングのほかに、絵画風やイラスト風にアレンジしたデザインの要素を含むレンダリングもある。


順投影と逆投影

写実的なレンダリングは、カメラで風景を撮影するときと同じ要領で、まず3次元の情景を2次元に投影する。順投影は、物体を平面に投影し、その投影像の内側に含まれる画素を照明モデルに基づいて塗りつぶす。Zバッファ法やスキャンライン法など、比較的高速なレンダリングに使われる。一方、逆投影は、投影面上の各画素から情景の中へ逆投影した視線が、物体や光源とどのように交差するかによって画素の色を決める。レイトレーシングのような高画質のレンダリングに使われる。

図1 順投影

図2 逆投影

●フォトリアリズム 
写真や実写ビデオのような現実感を数値計算で実現すること。厳密な光学モデルを考えて、光の挙動をシミュレートし、投影像を作り出す。


図3 写実的レンダリング

●絵画風レンダリング 
光学的な厳密さよりも、デザイン的なおもしろさを強調している。ノンフォトリアリスティックレンダリングともいう。油彩画風、水彩画風、水墨画風、ペン画風の画像を生成する


図4 油彩風


図5 イラスト風


ポリゴンレンダリング

●Zバッファ法 
ゲームセンターのりアルタイムの3DCGゲームはすべてポリゴンで描かれる。Zバッファ法にはポリゴンの陰影づけに特化した専用ハードウェアが用いられる。Zバッファ法は投影面にポリゴンを投影して塗りつぶす、順投影レンダリングである。

図6 Zバッファ法

●Zバッファ 
投影面の各画素に、奥行き値(Z値)を格納するメモリ領域を確保する。これをZバッファといり。ます、Zバッファの奥行き値を十分に大きな値にしておく。一つずつポリゴンを読み込んで、その内部を塗りつぶすときに、ポリゴンの奥行き値を画素ごとにZバッファの奥行き値と比較する。ポリゴンの奥行き値がZバッファより小さければ手前にポリゴンがあると考えて塗りつぶし、Zバッファ値をポリゴンの奥行き値で更新する。そうでなければ塗りつぶさず、Zバッファ値もそのままにする。こうして、つぎつぎにポリゴンを読み込んで、手前のポリゴンで奥のポリゴンを塗りつぶしていく。

◆スキャンライン法 
いったんすべてのポリゴンを投影し、走査線ごとに奥行き順にならべて、最も手前にあるポリゴンを描画する。比較的高速・高画質だが、ポリゴンの数が増えると遅くなるので、複雑な情景の描画には向いていない。順投影レンダリングの一種

 

図7 スキャンライン法


レイトレーシング

画素から伸ばした視線が物体とどのように交差するかによって画素値を決定することをレイトレーシング(逆投影レンダリング)という。光線を自在に屈折、反射させることができ、また画素から複数の視線を伸ばす過標本化、影づけなどの高度な光学的シミュレーションが可能である。
◆反射・透過・屈折・吸収 光は物体表面や異なる物質の境界面などで反射・透過・屈折し、また吸収される。吸収は物体内部でも生じる。

図8 レイトレーシング


図9 反射,透過,屈折,吸収

 

◆知識を広げよう
モデラとレンダラ:モデリングを行うソフトやハードがモデラで、レンダリングを行うソフトやハードがレンダラである。モデラはさまざまな方法でモデルを獲得する。モデルを統合して情景を記述する言語を情景記述言語という。Pixarが開発したRenderManなどの業務用の言語や、WWWで使われるVRMLなど多くの種類がある。また、それぞれの物体形状のモデリングにはDXF、3DSなどのデータ形式がある。
陰曲面と陽曲面:三次元座標の関数f(x、y、z):0を陰表現といい、陰表現された曲面が陰曲面。
球面や平面、円筒面や円錐など、方程式で表される曲面は陰曲面であり、レイトレーシングで多用される。メタボールやボリユームデータの場合には等値面ともいうが、同じものである。これに対して制御点の集まりで表されるベジェ曲面などの自由曲面は陽曲面という。陽曲面は方程式ではなく、二つの自由変数(パラメータ)が動いてできる軌跡として定義される。このためパラメトリック曲面とも言う。最終的に任意の精度でポリゴン分割されて、Zバッファ法などで陰影づけされる。





照明モデルとマッピング


視線方向と物体表面の向き、および光源の位置から、物体表面に入射した光がどのように反射するかを決めるモデルが照明モデルである。また、照明モデルに基づいて物体表面の明るさや色を決めることを陰影づけという。

陰影づけ

物体に照射され、反射される光をモデル化すること。拡散反射光と鏡面反射光、および環境光の三つの成分をもつ。

◎拡散反射光
チョークや布地のように、ざらっとした光沢のない面に入射した光が、すべての方向に一様に反射する照明モデルのことをいう。Lambertモデルともいう。光源と面の傾きだけで決まる。光が面に垂直に入射したときが最も明るく、斜めから入射するほど暗くなる。

図1 拡散反射光

◎鏡面反射光
入射した光が特定の方向に強く反射する照明モデルで、Phongの照明モデルが有名。光源の位置と面の傾き、および視点の位置によって反射光強度が決まる。

図2 鏡面反射光

○環境光
光源の位置にかかわらず、すべての面に一様に入射して反射すると考える光で周囲に乱反射する間接照明光を簡易にモデル化したものをいう。光源から隠れた面が真っ暗にならないように、微量の環境光を加える。

図3 環境光

◎スムーズシェーディング
ポリゴンのつなぎ目がめだたないように滑らかに陰影づけすること。GouraudとPhongのスムーズシェーディングがある。ゲームなどリアルタイムのレンダリングにはより簡易なGouraudシェーディングが使われる。

図4 合成反射光


影づけ

光源と物体の間にほかの遮へい物体がある場合には、影をつける。照明モデルによる陰影づけをシェーディングというのに対して、遮へい関係を考慮した影づけはシャドウイングという。

図5陰影づけと影づけ


テクスチャとマッピング

物体の現実感や質感を、形状モデルや照明モデルだけで実現することは非常に難しい。このために、物体表面に画像を張りつけて、模様や凹凸などを表現する。これをマッピングという。映り込みや屈折、透過など、あらゆる物体表面の光学的性質がマッピングで代用される。

図6 テクスチャマッピングとバンプマッピング

●映り込み 
完全な鏡面反射面では、鏡のように、入射光はただ一つの方向へ反射され、光源のぼけた反射像であるハイライトだけでなく、周囲の情景がすべて鮮明に映り込む。レイトレーシングは反射光を追跡して自然に映り込みを実現するが、ほかのレンダリングでは環境マッピングで代用する。

図7 映り込み

●テクスチャマッピング 
物体表面に画像を張りつけること。顔の形状モデルに、顔の展開図を張りつけたり、胴体や手足のモデルに布地の模様を張りつけたりする。面の位相によって、円筒マッピング、球面マッピングなどがある。陰影づけや影づけなどの照明モデルと併用する。

●バンプマッピング 
画像そのものではなく、凹凸を張りつけること。みかんの皮の細かなくぼみや、月面のクレータ、コインの彫刻のように、ごく細かな凹凸の表現に向いている。表面形状を変えることなく、表面の法線方向(面の向き)だけを変動させる。法線だけでなく。実際に形状を凹凸に変形させることを変位マッピングという。

●環境マッピング 
天空などの遠景の映り込みをマッピングで実現することをいう。Zバッファやスキャンライン法などで映り込みを擬似的に実現する。遠景と物体の間をほかの物体がさえぎっても、環境マッピングは対応できない。

●ソリッドテクスチャ 
立体の中身まで詰まったテクスチャ。フラクタル理論を使い、3次元座標の関数として手続き的に定義されることが多い。木目や大理石模様などのテクスチャが多用される。

図8 ソリッドテクスチャ


ラジオシティ

直射照明光だけでなく、壁と壁、床と壁などの相互の間接照明光を考慮に入れ、室内のぼんやりとした間接照明を表現できる。面と面の間の相互作用を計算するために、壁や床や家具の表面をパッチに細分化し、入射する光と放射する光の総和から面の色や明るさを決定する。

図9 ラジオシティ

知識を広げよう
エド・キャットマルとジム・プリン
CGの父と呼ばれるアイバン・サザランドに率いられた世界初の3DCGを研究する学科が、1968年にユタ大学に開かれ、テクスチャマッピングはここの博士課程の学生エド・キャットマルが開発した。また、キャットマルはZバッファ法や双3次曲面を開発したことでも知られる。彼はニューヨークエ科大学を経てジョージ・ルーカスのルーカスフィルムに移り、ルーカスフィルムのCG部門はILM(Industrial Lightand Magic)として分離し、現Apple社CEOのスティーブ・ジョブスに買収されてPixarというCG制作会社になった。キャットマルはPixarの創設者の一人で、トイストーリーなどの映画作品を制作している。
バンプマッピングを開発したのは同じサザランド学派のジム・プリンで、NASAのジェット推進研究所に所属し、1980年初頭のCQSM0Sというテレビ番組で使われた木星や土星、天王星などのCG制作にテクスチャマッピングやバンプマッピングを応用して、一躍有名になった。また、プリンはメタボールの開発者としても知られる。
なお、NASAのジェット推進研究所は、1998年、火星探査ロボット、マーズパスファインダのホームページを開設し、アクセスが殺到したことで再び有名になった。



コンピュータアニメーション


アニメーションの作画や実写映像編集の工程は今日ほとんどすべて計算機上でも行えるようになった。モデルをレイアウトして3DCGを制作し、映像・音声素材をつなぎ合わせて作品を完成させる。

アニメーション作画

●フレームアニメやビデオなどの動画を構成する時系列の各瞬間の静止画をフレームという。NTSCビデオは1秒間に30枚(正確には29。97枚)のフレームでできている。映画は1秒間に24枚。これらのフレームを1枚ずつ描き、音声を付加して動画を作成する。

図1 フレーム

●セルアニメ
セルという透過シートにアニメータがフレームを手描きして作るアニメ。前景と背景を別々に描いて何枚もセル画を重ねて1枚のフレームを完成させる。最も基本的なアニメ作成方法。

●キーフレームと中割り
フレームのうちで、動作のつなぎ目にあたる重要なフレームがキーフレーム。セルアニメは、従来、キーフレームだけを熟練者が描き、その間のフレームは、前後のキーフレームを滑らかにつなぐように、多くのアシスタントが手分けして描いた。このように、キーフレームの間を埋めていく作業を中割りという。現在では計算機による自動中割りが実用化されている。3D CGでも動作の境界にあたる重要なフレームをキーフレームと呼び、中間フレームは補間して作成する。

 

図2 中割り

●モーションパス
キーフレームだけをモデラで指定し、中間フレームの位置や向きは自由曲線で補間する。人体などの多関節物体の動きは、関節の位置や角度をモデラで与え、位置や角度を3次スプライン関数などで滑らかに補間する。このようにして得られる位置の軌跡がモーションパス。

図3 モーションパス

●モーフィング 
実写映像は、中割りのための特徴点の対応関係が決まっていないので、あらかじめ手作業で対応点を指定して中割りする。二つのフレームの中で二人の人の鼻と鼻、目と目、口と口などをGUIで対応づけて、一方の人からもう一方の人の顔に滑らかに変化させる。

●インバースキネマティクス 
多関節物体の姿勢を決める場合、すべての関節の角度を決めたときに、腕や足や指先などの位置が確定することを運動学という。これとは逆に、指先と腕の付け根の位置を与えたときに、その間の手首、肘などの関節角度を物理的に無理なく決めることを、逆運動学、すなわちインバースキネマティクスという。両足を地面につけたまま腰を動かして、膝や股関節の角度などを自動的に決めるときなどに使われる。

図4 インバースキネマティクス


●モーションブラー 
動きブレのこと。カメラや物体が動いたときに、動いた方向に流れたようにボケるが、これを数値計算で実現するためには、時間軸方向の過標本化とアンチエイリアシングが必要。計算コストの上で高価であるが、実写との合成をふんだんに使う映画作品などの高品質な映像制作には欠かせない。

動画の編集

実写やアニメ、音声など、それぞれの素材(クリップ)をつなぎ合わせたり重ね合わせたりしてできる最終的な作品(ムービー)を作る。ファイル形式には、フレームごとに静止画として分かれた連番ファイルと、ひとまとまりになった動画ファイルがある。

●動画ファイル 
動画編集に使われるファイル形式には、Windows系のVideo for Windows(AVI)と、Mac系のQuickTime(MOV)かある。AVI、 MOVはさら圧縮、非圧縮などさまざまな形式にわけられる。また、機種に依存しない高圧縮動画の標準形式にMPEGがある。

●連番ファイル 
時系列の静止画ファイルの集まり。圧縮画像にはJPEGが使われる。非圧縮、特にCGアニメ制作にはTGAが使われる。連番ファイルの名前は、たとえばclip001。jpg、 clip002。jpg、 clip003jpg、……となる。

●音声クリップ 
音声の素材にはWindows Wave form(WAV)やAIFが使われることが多い。最近では高圧縮のMP3(MPEG1レイヤー3)が注目されている。

●ノンリニア編集 
テープからテープヘクリップをつなぎ合わせる従来のビデオ編集に対して、ディジタル化されたクリップを任意の順番で編集することをノンリニア編集という。リアルタイムで動画ファイルを読み込み、録画再生する必要があるため、高速なハードディスクと転送バスが必要だが、最近は普通のパソコンでもノンリニア編集ができるようになりつつある。Adobe社のPremiereが標準的なノンリニア編集ソフト。

●アルファチャネル 
フレームと字幕の重ね合わせ(スーパーインポーズ)や、クリップ間の移り変わりの特殊効果などのために、フレームの透明度を決める画像。RGBチャネルに対してAチャネルなどという。

●コンパイル 
アニメーションではクリップを編集してムービーを生成することをいう。できあがったムービーはCD-ROMにMPEG形式で焼いたり、リアルタイム再生してビデオに録画する。

●モーション 
JPEG高圧縮静止画であるJPEGを時系列に並べることで動画ファイルとして利用するものをいう。圧縮率を変えることによって画質とハードウェアの能力を調整できる。

●MPEG1 
CD-ROMに記録するために考案された動画ファイル形式で、NTSCと同程度の画質の実現を求めたもの。

●MPEG2 
DVD用に開発された、本格的な商業映像用の動画形式。

図5 DVベースのノンリニア編集


●DV 
DPS社が定めたDV用のAV1形式。圧縮率や画像サイズは固定されているが、簡易で高画質、かつ劣化がほとんどないノンリニア編集が可能である。IEEE1394インタフェースを必要とする。

●動画GIF 
静止画像ファイル形式のGIFを拡張した動画ファイル形式。GIFアニメなどともいう。WWWの広告バナーで多用される。


知識を広げよう
マルチメディアコンテンツ制作にはMacromedia杜のDirectorというソフトが使われるが、ビデオ作品制作にはPremiereが標準的に使われる。Directorで作られるコンテンツは、静止画を紙芝居のようにつぎつぎに提示したり、ボタンやBGMに音声クリップをつけることができる。動画クリップを使ったり、対話的にページを変えたりすることもできる。
一方、Premiereで制作される映像作品はNTSC形式のビデオを作ることが最終目的である。NTSCは720×480の大きさのフルカラー画像が1秒間に30枚必要であり、非圧縮の場合1秒当たり31MBものデータ量が必要である。このように、ノンリニア編集は膨大なデータ量を扱う必要があるために、非常に高価な業務用機での編集に限られてきたが、現在ではパソコンを使ったデスクトップ環境でもある程度のノンリニア編集ができるようになってきており、パッケージ制作とノンパッケージ制作の両方が可能なパソコンも市販されている。
ノンリニア編集は、NTSC信号非圧縮の業務用機、民生用のDVベースで圧縮率が1/5固定のもの、モーションJPEG系の圧縮率可変のものがある。このうち、DVベースのノンリニア編集が多く利用されるようになった。




 オーサリング


マルチメディアコンテンツ制作におけるオーサリングとは、テキスト、サウンド、グラフィックスそしてアニメーションなどのディジタル素材を統合し、自分の考えていることを表現するための手段である。したがって、オーサリングはコンテンツ制作の最終段階に位置する重要な作業である。オーサリングの概念と、オーサリングツールについての知識は1・4節の「映像デザイン」と1・ト5節の「情報デザイン」と関連づけて覚えておくとよい。

オーサリングとは

マルチメディアコンテンツ制作におけるオーサリングは、構造(関係)デザインと、変化過程(遷移過程)デザインに分けられる。構造デザインは、ボタン、テキスト、グラフィックスそしてサウンドといったマルチメディアドキュメントを構成する要素間の論理的構造のデザインを意味する。1・5節で紹介した「情報とオブジェクトの関係」と「情報間の関係」と類似した概念である。変化過程デザインとは、ある状態からある状態へ遷移するときの過程(プロセス)のデザインを意味する。1・5節の「情報デザイン」の「情報の見せ方」と類似した概念で、1・4節の「映像デザイン」との関連も深い。

図1 構造と変化過程


●構造 
要素間の構造のデザインでは、リニア構造、ディレクトリ構造、そしてWeb構造などが代表的なものである。リニア構造の例としてはスライドショー、ディレクトリ構造の例としてはウィンドウシステムのファイルシステム、そしてWeb構造の例としてWebサイトが挙げられる。

●変化過程 
状態間の変化過程のデザインでは、ズームイン、ディゾルブ、そしてワイプなど映像編集技法や、サウンドロゴを応用することが考えられる。たとえば、スライドショーにワイプ効果を、フォルダシステムにズームイン・アウトを、ホームページでまちがえた場所をクリックするとアラームが鳴るといったデザインが考えられる。


プレゼンテーション作成ツールによるオーサリング

スライドショーをデザインすることはリニア構造に限定したオーサリングを行うことに等しい。したがって、PowerPointやClarisImpactなどのプレゼンテーションソフトは、リニア構造に限定したオーサリングツールと考えることができる。


表計算ソフトによるオーサリング

ExcelやLotus123などの表計算ソフトでは、マクロ機能をボタンやメニューコマンドとリンクさせることができるが、この機能を駆使してオーサリングを行うことができる。


DTPソフト

最近のDTPソフトは図形、表の編集そして画像・音声データの取込みが可能である。さらに、マクロ機能やHTML文書形式での保存機能を備えたDTPもある。このように高度に発達したDTPソフトは、オーサリングソフトと呼んでもよいであろう。



DVDソフト

DVDソフトはディジタル化された映像(音声を含む)をコンピュータ上で加工、編集するためのソフトである。多様な特殊効果をノンリニア編集によって実現できる。DTPソフトが文字を中心としたオーサリングソフトであるのに対し、DVDソフトは映像専門のオーサリングソフトと考えることができる。



マルチメティアオーサリンクツール

オーサリングをC言語などのプログラミング言語を用いて行うと、複雑で膨大な手順が必要である。また、プレゼンテーション、表計算、DTP、そしてDVDソフトを用いた場合、複雑な構造をもち、かつビジュアルなオーサリングを行うことは難しい。そこで、通常は専用のソフトウェアを用いて行われる。代表的なオーサリングソフトとして、以下にHyperCardとDirectorを紹介する。

◆HyperCard 
HyperCardはカード型データベースと呼ばれていたが、プレゼンテーション用のさまざまな特殊効果、オブジェクト指向のマクロ言語であるハイパースクリプトを備えた最初のソフトウェアである。このことから、オーサリングツールの草分けと考えることができる。

◆Director 
Directorは、映画撮影現場のメタファを用いたソフトウェアで、ソフト名は映画監督(director)に由来する。Directorの作業画面は以下のウィンドウから構成される。
(i)ステージ オーサリングによって制作されたプレゼンテーションムービーを表示させる場所。

(ii)キャストウィンドウ テキスト、サウンド、グラフィックスそしてアニメーションなどのディジタル素材を登録しておくためのウィンドウ。
(iii)制御パネル ムービーの再生、停止そして巻戻し、早送りなど行うためのパネルウィンドウ。
(iv)スコアウィンドウ横軸方向に時間、縦軸方向にチャネルを割り当てた2元表。時間はフレームといり単位で数えられ、スコアウィンドウはフレームとチャネルで分割されたセルで構成される。各セルには、どのキャストがステージ上のどの位置に配置されているかという情報が記述される。
(v) スクリプトウィンドウ LINGOと呼ばれるスクリプト言語を記述するためのウィンドウ。

図2 キャストウィンドウ、制御パネル、

図3 スクリプトウィンドウ


ホームページ

ホームページでは、テキスト、音声、画像、アニメーションをページ上にデザインすることができる。この点から、ホームページ作成用のツールはマルチメディアオーサリングツールと考えることができる。
ホームページで構造をデザインするにはHTMLのハイパーリンク機能を用いることができる。また、変化過程のデザインには、最近のWWWブラウザでサポートされるようになった以下のスクリプト言語、またはソフトウェアが有効である。

●Java 
Javaはアニメーションや音声をHTMLの中に組み込んで制御することのできるオブジェクト指向プログラミング言語である。
Javaで記述されたプログラムをアップレットといい、その種類や用途はクラスによって継承される。

●Shockwave 
ShockwaveはDirectorで作成したコンテンツをWWWブラウザで表示するための拡張ソフトである。特にインタラクティビティが要求されるデザインに応用される。

◆VRML 
ホームページ上で3次元CGを動かすための言語である。
Javaが2次元画像を制御するための言語であるのに対して、VRMLは3次元CGを実現するための言語である。


 仮想現実(VR)と可視化


計算機上に構築された仮想世界に、どっぶりと浸り込んだような臨場感を与える仕組みが仮想現実。次世代のユーザインタフェースとして注目されている。可視化は計測された形や動きを目に見えるように処理すること。


仮想現実(VR)

仮想現実は、視覚だけでなく、聴覚や触覚など、あらゆる人間の感覚に訴えた、直感的なインタフェースを介して実現される計算機上の世界。現在すでに普及しているGUIのさらなる発展形と捉えられる。またできるだけ忠実に現実世界をシミュレートするという意味で、フライトシミュレータなどのシミュレータ開発の延長上にある。宇宙空間内の共同作業など、あらかじめ体験することが難しい状況でのシミュレーションにも用いられる。3D CGゲームヘの応用も盛んである。

●没入感 
仮想現実世界にどっぶりと浸ったような臨場感のこと。仮想現実の重要なキーワード。没入感は、立体視や全周ディスプレイなどの映像表示デバイスによって実現される。

◆立体視 
左右の目の位置が若干違うことで見え方に差ができる。これが視差である。立体視は視差によって情景の奥行きを知覚すること。

図1 立体後

●偏向板メガネ 
光が横波であることを利用して、振動方向が互いに垂直な偏向光を左右のメガネの偏向板から通して見るためのメガネ。

図2 偏向板メガネ


●アナグリフ 
左右にそれぞれ赤青のフィルタをつけたメガネを使う。赤と青の合成像がフィルタで分離されて立体視する。

図3 アナグリフ


●レンチキュラ 
かまぼこ型のレンズを表面に並べたディスプレイ。適度に離れて見ると、左右に別々の映像が提示される。

図4 レンチキュラ


●液晶シャッターメガネ 
メガネに液晶シャッターをつけてすばやく交互に左右の目をさえぎり、常に左右別々の映像を見るようにした装置。

●パノラマディスプレイ 
周囲を取り囲み、人の視界を覆うような全周型のディスプレイ。プラネタリウムやパノラマ映像が従来から知られている。仮想現実で近年注目されている方法に、前方、左右上下の壁面や床面に投影型ディスプレイを配置して全周ディスプレイを実現するというものがある。

図5 パノラマディスプレイ(cave)

●HMD 
頭にかぶって左右の目に別々の液晶ディスプレイで映像を提示する装置。頭の動きに連動して、提示する映像の視界を動かすため、頭の位置と向きを検出する空間位置センサが必要である。

図6 HMD

●データグローブ 
指の曲がり具合を検出するセンサで、光ファイバを指に沿って這わせてある。指の曲がり具合に応じて光ファイバの光透過率が変化することを利用している。


図7 データグローブ

●空間位置センサ 
HMDやデータグローブに装着して、空間中の位置を検出する装置。コイルに発生する磁界を利用する磁気センサが主流。

図8 位種センサ


拡張現実

仮想現実の応用・発展形の一つ。半透過型の液晶ディスプレイを装備したHMDを用いて、現実の情景の上に、CG映像を重ね合わせて提示する。順路の誘導や、展示物の解説など、さまざまな用途がある。

図9拡張現実


可視化技術

●モーションキャブチャ 
人体などの多関節物体の関節位置にセンサを取りつけて、関節位置を追跡し、動きを獲得する手法のことをいう。

●レンジファインダ 
距離センサを用いて情景の奥行き値を計測する装置。距離計測には三角測量の原理やレーダーの原理が用いられる。距離の値を格子状に獲得することによって、距離画像(レンジデータ)を得る。レーザ光を照射する方法、パターン光を照射する方法などがある。

図10 レンジファインダ

●ボリュームレンダリング 
物体表面だけでなく、内部の構造までデータとして用意し、描画すること。現在はX線CTやMRIなどの医用画像の可視化にほぼ限られているが、さまざまな分野への応用と発展が期待できる。物体の表面の陰影や反射だけでなく、物体内部の光の吸収などを表現する。

図11 ボリュームレンダリング


知識を広げよう
3次元映像:平面の画像に対して、さまざまな立体的な映像の提示方法が考えれられているが、それらは3次元映像と総称される。両眼に視差を含む映像を提示するステレオ画像、何面ものスクリーンを一度に提示するパノラマ映像、メガネを使った立体映像などである。ホログラフィは古くから研究されてきた完全に3次元的な映像である。通常の映像は光の強度を感光フィルムやCCD上に結像させて記録する。しかし、ホログラフィは光の伝播方向や波面や波長など、波動の全情報を記録して再生する。次世代の3次元映像技術はホログラフィから学ぶところが大きい。
多視点画像計測:3次元映像を提示するためには3次元映像の計測技術や合成が必要である。この技術は多視点動画像計測と呼ばれ、3次元映像と密接に結びついている。多数のカメラをドーム状に配置して撮影した動画像を統合して、任意視点からの映像を合成する。ウォークスルーは、そうして得られた映像空間の中を自由に動き回ること。
コンピュータビジョンとグラフィックス:3次元映像の獲得と提示に、モデりングという要素を加味した技術がコンピュータビジョンである。人体などの多関節物体の姿勢や動きをモデル化すれば撮影条件の制約が少ないモーションキャブチャが実現できる。獲得されたモデルを使ってより広範なCGの応用分野に利用できる。ボりユームレンダリングなどの可視化技術との関連づけなど、研究テーマにはこと欠かない。


 大容量記憶媒体


マルチメディアを介して音声や画像そして動画を容易に扱うことができるようになった要因に は、高速で安価なCPUの開発とならんで、大容量記録媒体の出現が挙げられる。しかし、各分野で研究されてきた記録媒体には、統一された規格はなく、さまざまな種類がある。そこで、マルチメディア検定ではさまざまな記録媒体の方式や利点などの知識が試される。本節では、大容量記録媒体の代表的なものとして磁気ディスク、光ディスク、そして光磁気ディスクの中から代表的なものを取り上げ、その原理と特徴について解説する。また、持ち運びの可能なリムーバブルディスクの中で一般的なものについて解説する。


磁気ディスク

コイルを磁石に近づけたり離したりするとコイルに電流が流れる。同様の原理から、平面状に小さな磁石を並べ、その上でコイルを動かすとコイルに電気信号が流れる。逆に、平面状の磁性体上にコイルを近づけて電流を流すとコイル付近の磁性体が磁化する。このとき、磁化する場所の配置をある情報に対応させておけば、コイルを動かしたときに流れる電気信号からその情報を取り出すことができる。磁気ディスクの原理は簡単にまとめるとこのようなものである。通常のオーディオテープも同様の原理で音声信号の記録および呼出しを行う。しかし、オーディオでは音声信号だけが扱われるのに対して、磁気ディスクでは文字、画像そして動画などさまざまな情報が扱われる。
磁気ディスクの種類として一般にはフロッピーディスクとハードディスクが挙げられる。以下にそれぞれの特徴について解説する。

●フロッピーディスク 
磁性体を塗布した薄く柔らかいプラスチックのディスクである。安価で持ち運びが便利である。

●ハードディスク 
ハードディスクは磁性体を塗布したアルミニウムなどの硬いディスクで、フロッピーディスクの数百倍から数千倍の容量をもつ。また、読み取りのときに磁気ヘッドがディスクに直接触れず、ディスクを高速に回転させることが可能であるため、フロッピーディスクに比べて読み取りが速い。しかし、フロッピーディスクに比べてハードディスクは高価で、コンピュータ本体の内部に装備されていて持ち運びはできない。


光ディスク

でこぼこした鏡に光をあてると、反射光は、回折によって弱まったり、強まったりする。さらに、でこぼこがきわめて浅い場合には干渉によって光の強弱の差が大きくなる。光ディスクは、光の回折と干渉を利用して、アルミニウム膜にあてたレーザ光の反射光の強弱から情報を読み取る記録媒体である。
光ディスクについて注意すべき点は、通常の光ディスクでは情報の書込みが一度しかできないことである。情報の追記・書換えが繰り返しできる磁気ディスクと比べて、この点が欠点である。しかし、最近では追記のできる光ディスクやPD(90ページ)のように書換えのできる光ディスクも開発されている。
光ディスクの代表的なものを以下に挙げておく。

●CDとCD-ROM 
CDがもっぱら音声と画像情報を記録するのに対し、CD-ROMはコンピュータで扱う情報全般を記録することができる。ともに直径は12cmで容量は650MBである。

●レーザディスク 
もっぱら音声と画像情報を記録する記録媒体で、CDより大容量であるため映画ソフトに利用されることが多い。

図1 光ディスクの断面の樟式図と言寿みとり原玉里


光磁気ディスク

磁化した物質に偏光をあてると、反射光の偏光面は磁化の強さに対応して回転する。光磁気ディスクは、このような光の性質を利用して磁気ディスクにあてたレーザ反射光の偏光面の変化から、情報を読み取る記録媒体である。

図2 光磁気ディスクの読取り原理

情報の書込みは磁気ディスクと同じ原理で行われるが、レーザ光線をディスクに当てて磁性体に熱を与えて磁化する点が磁気ディスクと異なる。また、磁気ディスクがプラスチック板やアルミニウム板に磁性体を塗布したものを素材としているのに対し、光ディスクでは希土類一遷移金属のアモルファス合金が使われる。


リムーバブルディスク

単に大容量の記録媒体が必要であれば、記録媒体を大型化すればよい。しかし、今までに述べた記録媒体技術を使うことによって、大容量であると同時に小型化した大容量記録媒体を作ることができる。その結果、取りはずして持ち運ぶことのできる大容量のリムーバブルディスクが開発されている。以下にその代表的なものを紹介する。

●リムーバブル 
HDD通常のハードディスクはコンピュータの内部に装備され、取りはずして持ち運ぶことはできない。しかしSyQuestTechnology社の規格したリムーバブルハードディスクは、取りはずしの可能な特別なハードディスクである。大きさは3。5インチで270MBの容量をもつものが主流である。

●Zip 
フロッピーディスクが磁性体として酸化鉄をプラスチック板に塗布しているのに対して、Zipではメタル磁性体をプラスチック板に塗布しているため磁性層がフロッピーディスクに比べて薄い。このことにより、Zipはフロッピーディスクよりも高密度な記録を可能にしている。また、読み取り用の磁気ヘッドに関しても、直接ディスクに触れない方式であるため、ハードディスクと同様に高速の読み取りが可能である。直径は3。5インチ、容量は100MBで価格も手ごろである。

●PD 
書換えのできる光ディスクである。光ディスクと同様の原理を利用しているため、CD-ROMなどとの互換性がある。直径は12cm、容量も650MBでCDと同じであるが、PDの場合はプラスチック製のカートリッジに入っていることがCDと異なる点である。

●MO 
取りはずし可能な光磁気ディスクといえばMOがその代表である。直径は3。5インチでプラスティック製のカートリッジに入っている。容量は、従来は230MBであったが、最近では640MBのものが主流である。

●MD DATA 
オーディオ用CDに対してコンピュータ用CD-ROMがあるように、オーディオ用MDに対してコンピュータ用に開発されたのがMDDATAである。MOが直径3。5インチであるのに対してMDは直径2。5インチなので、携帯にはMOより便利である。ただし、容量は130MBでCD-ROMやMOより少ない。

 

知識を広げよう
ユーロピウム添加イットリウムシリケイト:小指ほどの結晶に30時間分のテレビ画像が記録できる新しい画像記録媒体。ホログラフィの理論を利用した記録方式を採用していて、レーザ光を結晶中のユーロピウムイオンという物質にあて、その電子状態を変えることによって情報を記録する。1994年にNTT基礎研主幹研究員の光永正治氏が発表した新技術である。現在実用化はされていないが、将来の大容量記録媒体として覚えておくとよいキーワードである。


 

 ディジタル通信とプロトコル

ここがポイント!
ディジタル通信の最も古い例は狼煙である。狼煙こよる情報通信では、「狼の糞を燃やして煙を上げる」とか、「どのような狼煙がどのような意味をもつか」などの、情報を送る側と送られる側で取り決められた「約束事」が必要である。同様にコンピュータ間のディジタル通信においてもさまざまな約束事(プロトコル)があり、このプロトコルに関する知識がディジタル通信を理解するには必須である。


OSIの7階層

ディジタル通信のプロトコルについては、ISOという国際的権威が関与している。ISOでは、ディジタル通信に関するプロトコルのさまざまなレベルを以下のOSIの7階層に分類している。
@物理層:信号を送るときの電圧や波形など電気的な条件の取決め。
Aデータリンク層:物理的取決めと情報を結びつける論理的な取決め。
Bネットワーク層:ネットワーク上での情報交換に関する取決め。
Cトランスポート層:@、A、Bの各層でのエラー対応に関する取決め。
Dセッション層:通信のときの言語に関する取決め。
Eプレゼンテーション層:文字コードや暗号に関する取決め。
Fアプリケーション層:WWWなどのネット上のサービスに関する取決め。



LAN関連のプロトコル

LANを使ってディジタル通信をするには、コンピュータとコンピュータを電気的に結びつけるための物理層と、電気信号を情報とリンクさせるためのデータリンク層のプロトコルが必要である。これらの2層のプロトコルとして最も普及しているのがイーサネットである。最近では、より高速化したイーサネットとして100Mbpsイーサネットも開発されている。

◆イーサネット 
Intel、DEC、Xeroxの3社が1980年に考案したLANのためのプロトコルで、PCやWS(ワークステーション)のLAN用として最も普及しているプロトコルである。イーサネットの伝送速度は10Mbpsで、一連のケーブルを複数のコンピュータで共用する媒体共用型LANである。現在用いられているケーブルは3種類で、バス型のLANに使用される10BASE5、10BASE2と、スター型LANに用いられる10BASE-Tがある。

図1 バス型のLAN

図2 スター型LAN

図3 リング型LAN


◎100Mbpsイーサネット 
物理的なケーブルとしては10BASE-Tを使いながら伝送速度を10倍の100Mbpsに上げたものである。FastEthemet方式と100BASE-VG方式がある。


バックボーン関連のプロトコル

いくつかの小さい単位のLANをつなげて、より広域のLANを作るための基幹となる通信線をバックボーンと呼ぶ。バックボーンによく用いられる形としてリング型があるが、FDDIとトークンりングはリング型のバックボーンにそれぞれ独立したLANをぶら下げるときに用いられるプロトコルである。


FDDI
Fiber Distributed Datalnterface

●FDDI 
最大延長200km、最速100Mbpsの伝送速度をもち、光ケーブルを用いたプロトコルである。最大1000台までの端末を接続することができる。LANそのものにも使用できるが、イーサネットを相互持続するためのバックボーンとして普及している。

●トークンリング 
IBMの開発した、リング型LANのためのプロトコルである。FDDIと同様にイーサネットを相互接続するためのバックボーンとして用いられることが多い。

広域LANのバックボーン関連のプロトコル

独立したLANを枝葉上にぶら下げるためのバックボーンとして用いられるプロトコルに、ATMとフレームリレーがある。FDDIとトークンリングは物理層とデータリンク層のプロトコルであるが、ATMとフレームリレーはそれらに加えてネットワーク層のプロトコルでもある。
ネットワーク層のプロトコルは情報交換に関する取決めである。このため、データの送信する側と受信する側で物理層とデータリンク層に関しては、同じプロトコルを使う必要はない。したがって異なるプロトコルを採用しているLAN同士を結ぶことができる、そこで、ATMとフレームリレーはより大規模で広域なネットワークのバックボーンに利用される機会が多くなるのである。

●ATM 
送信するデータをセルという単位に分割し、必要時にのみ送信するプロトコルである。回線や交換
機を必要なときだけ使うため、効率的なデータ送信ができる。同様の方式にインターネットで採用されているパケット通信があるが、各パケットが異なる長さをもつのに対して、セルは固定長であるため、交換機にかかる負担が少ない。

●フレームリレー 
送信するデータをフレームという単位に分割し、送信するプロトコルである。パケット通信に比べて伝送制御などが簡略化されているため、高速な通信が可能である。


インターネット関連のプロトコル

インターネットで使われるプロトコルをTCP/IPという。TCP/IPとは、IP(ネットワーク層)とTCP(トランスポート層)の二つのプロトコルを意味する。しかし、広義にはインターネットやインターネットに接続されたLANで使用されるプロトコル全体を指し、イーサネットやFDDIなどの下層プロトコルから、WWWやDNSなどアプリケーション層のプロトコルまでを含む。WWWやDNSは一般にインターネット上のサーバと呼ばれるアプリケーションで、3・9節で解説されているので、ここでは狭義のTCP/IPとして、IPとTCPについて解説する。また、TCP/IPを用いた通信に欠かせないルータについても解説する。

●IP 
送信するデータをパケットという単位に分割し、必要時にのみ送信するプロトコルである。ATMとの違いとして、ATMのセルはすべて同じ長さのデータであるのに対して、パケットのセルはデータによって長さが異なる点が挙げられる。第3層のプロトコルであるから、下位層の機能を使いつつ、データの転送制御を行う。

●TCP 
IPパケットが正しく転送されたかを監視し、制御するプロトコル。

●ルータ 
IPでは、送られてきたパケットの宛先がLAN内にない場合、ほかのネットワークへ転送する機能をもっている。このような機能をルーティングといい。中継するハードウェアをルータと呼ぶ。


モテム

インターネットやそれに接続されるイーサネットでは専用のケーブルを端末まで引いてくる必要がある。一方、電話回線は、すでに私たちの身の周りに張りめぐらされ、全世界規模の広域を網羅している通信網である。したがって、データ通信に電話回線を使わない手はない。そこで、アナログ信号用の電話回線を用いてディジタル通信を行うために開発されたのかモデムというA/D変換機である。モデムに関しては、Vシリーズという物理層のプロトコルがある。



ISDN

電話回線によるディジタル通信が普及し、モデムの通信速度では高まる需要に追いつかないという問題が浮上してきた。そこで、電話回線を用いたより高速のディジタル通信を可能にしょうという世界的な動きから開発されたのがISDNである。以下ではISDNの基本的プロトコルであるTAとDSU、そして関連事項としてS/T点の解説をする。

●TA
モデムがパソコンなどから受け取ったディジタル信号をアナログ的に変復調して電話回線へ送るのに対して、TAは電話機やFAXから浮け取ったアナログ信号をISDN同線用のディジタル信号に変換して送るアダプタである。したがって、TAはISDN対応の機器を使用する場合には必要ない。第1層のプロトコルに属する。

●DSU
電話の交換局からの配線をISDN対応の電話機やFAX、そしてTAと相互接続させるための機器。第1層のプロトコルに属する。

●S/T点 
DSUから見てTAやISDN対応機器側への出口をS点、TAやISDN対応機器から見てDSU側の出口をT点といい、二つを合わせてS/T点と呼ぶ。通常は図4のように一つの点として考えられる。

図4 TA、ISDN対応機器。DSUの接続図



B-ISDN

現在サービスが開始されているISDN(N-ISDN)では、ディジタル信号を一定の速度で送るSTMという方法が採用されている。しかし、常に通信能力分の回線や交換機の能力を保持する必要があるこの方式は、通信するデータ量が少ない場合には非効率である。そこで、次世代のISDNとして、ATM方法を採用したB-ISDNが研究開発されている。



 放送システム


ディジタル通信技術の応用という点から、新しいメディアを用いた放送方式はマルチメディアと深い関連をもつ。マルチメディア検定でも放送技術に関する問題が出題されており、放送システムに関する知識は重要であるといえよう。本節では現在の放送技術に関する基本的な事項を解説し、ディジタル技術を応用した放送技術として、ハイビジョン、CATV、そしてISDBについて解説する。


現在のテレビジョン

ここでは、現在のテレビジョン技術について最も基本となる知識として、走査線、帰線期間、同期信号、そして放送方式について解説する。

●走査線 
ディジタルでもアナログでも通信のときに送られる信号は1次元である。そこで、画像情報を送信するには、カメラによって撮影された2次元の画像情報(光電変換によって電荷量として蓄積されている)を1次元の信号に変換して送信する必要がある。
テレビジョンの画像情報送信では、走査という方法を用いて2次元画像情報を1次元信号に変換して送信している。走査は2次元の画像(電荷量)情報を走査線と呼ばれるきわめて幅の狭い平行線に沿って順次サンプリングする方法である。

●帰線期間 
走査線は互いに交わらないため、サンプリングを行っている点が次の走査線を飛び移る時間帯は、送信が途切れる。この時間を帰線期間と呼ぶ。

図1 走査線と帰線期間


●同期信号 
走査によって1次元化された画像信号を受け取った受信機(テレビ)側では、2次元画像への復元を行う必要がある。このため、走査の段階で、どの時間区分が帰線期間かを示すために同期信号が画像信号に入れ込まれている。受信側はこの同期信号を目印として、連続した走査線の区間を読み取り、2次元画像への復元を行っている。
テレビ画面を撮影したシーンで、テレビの画面が途中で断絶されて上下に分かれているように見える場合がある。これは、撮影するカメラの走査と、撮影されるテレビの走査の同期が一致していないために起こる現象である。

●NTSC、PAL、SECAM方式 
カラーテレビでは、カラーをRGBの3原色に分光して撮影した画像を走査して送受信すればよい。しかし、このようにして送信された画像信号は、従来の白黒テレビで受信することができない。そこで、白黒テレビとの整合性をとるため、RGBの3原色の情報を輝度情報と色情報に変換して送信する方法が考えられた。この場合、白黒テレビでは輝度情報だけに基づいて画像を復元する。実際の放送では、先に述べた方法に画質を向上させるさまざまな工夫が加えられているが、それらの方式は各国によって異なる。NTSC方式は日本、アメリカ、カナダで、PAL方式はイギリス、ドイツ、ブラジル、中国などで、SECAM方式はフランス、ロシア、東欧で採用されている。

●走査線の数 
一つの2次元画面を何本の走査線に分解するかという問題は、PCMでサンプリング周波数をいくつに設定するかという問題に相当する。つまり、PCMでサンプリングレートを上げると音質が良くなるように、走査線の数が多いほど画質が良くなる。現状のテレビ放送方式では、NTSC方式で525本、PALおよびSECAM方式では625本、ハイビジョン(後述)では1125本の走査線数が採用されている。

●インタレース走査 
一つの画面を走査するには、ある程度の時間がかかる。走査時間は1/100秒単位のごく短い時間であるが、画面のちらつきの原因となる。そこで、実際に使用されている放送方式では、インタレース走査という方式を採用して、ちらつきを最小限におさえる努力がなされている。インタレース走査とは、通常の走査が画面の左上から右下に向かって順次走査するのに対して、走査位置をいくつか飛び越しながら行う走査である。たとえば、2:1インタレースの飛び越し走査では、一つの画面を奇数番めの走査線からなる粗い画像信号と、偶数番めの走査線からなる粗い画像信号に分けて送受信する。

図2 インタレース走査


●フレーム周波数とフィールド周波数
インタレース走査では、一つの画面を複数の粗い画面に分解して走査するが、この粗い画面1枚分の画像情報をフィールドと呼ぶ。そして、1画面に含まれるすべてのフィールドを合わせてフレームと呼ぶ。このとき、1秒間に送信されるフレーム数をフレーム周波数、フィールド数をフィールド周波数と呼ぶ。NTSC方式ではフレーム周波数が30で、インタレース比が2:1であるから、フィールド周波数は60となる。


ハイビジョン

1953年に米国で実用化され、1960年に日本で採用されたNTSC方式は、当時の社会的、技術的条件から制約を受けていた。したがって、NTSC方式では、発達した技術を背景とした現在の社会ニーズに応えられない面がある。そこで、従来のテレビ画像より優れた臨場感・迫力・美しさをもつテレビ放送技術として開発されたのがハイビジョンである。ここでは、ハイビジョンの特徴である画面サイズと走査方式について解説する。

●アスペクト比(16:9) 
さまざまな実験から、画面のアスペクト比(縦横比)は5:3が最も好まれることが知られている。一方映画のアスペクト比としては1、3:1。0〜2。7:1。0が採用されている。そこでハイビジョンでは、実験で最も好まれたアスペクト比と映画のアスペクト比の折衷案としてアメリカのSMPTEが推奨した16:9をアスペクト比として採用している、


●走査方式
標準の人間の視力を1。0として、ハイビジョンの画面サイズで走査線が見えなくなる最低の走査線数は、100本と試算される。これに、現行のNTSC、PALそしてSECAMへの変換のしやすさを考慮して、ハイビジョンの走査線数は1125本と決められた。また、実験結果から、画像数が60/秒以上の場合にはちらつきが感じられず、動きの再現性については30/秒で十分に滑らかであると感じられることがわかっている。このことから、ハイビジョンでは、インタレース比として2:1を、フィールド周波数として60Hzを採用している。


●MUSE方式 
ハイビジョン信号は、映像用としてRGBそれぞれに30MHzの信号帯域を、音声用として20kHzの信号帯域に4チャンネルを必要とする。しかし、実際のハイビジョンにおける伝送・放送・記録では、これらをMUSE方式という方式で8。1MHzに帯域圧縮している。そのためには映像情報を大幅に圧縮する必要がある。MUSE方式では、動画と静止画に対する人間の目の反応の違いを利用し、映像を動き部分と静止の部分に分解し、圧縮している。


その他の新しいテレビ放送システム

ディジタル放送技術の発達は、以上に紹介したほかにも、さまざまなサービスを生み出している。そこで、いくつかの新しい放送システムを紹介する


●CATV 
伝達媒体として、空中(電波)ではなくケーブルを用いたテレビ放送をCATVと呼ぶ。地域密着型の自主放送サービスに利用されることが多く、一部では双方向サービスも実用化されている。ケーブルとして同軸または光ケーブルが用いられ、放送を見るためにはセットトップボックスと呼ばれる装置が必要である。また、パソコンを接続するには、ケーブルモデムという特殊なモデムが必要である。


●衛星データチャネル放送 
衛星放送のテレビ番組を補完する情報・データの放送サービスと、衛星放送と独立した情報・データの放送サービスからなる放送システムを衛星データチャネル放送と呼ぶ。映像放送に加えて、文字放送やパソコンで受信可能なコンピュータプログラム(テレソフトウェア)の放送が特筆すべき点である。

●FM多重放送 
現行のFMステレオ放送に使用されている周波数帯より上の周波数帯を使用した多重放送システムである。テレビ放送に比べると伝達容量が少ないが、簡便な放送設備で放送局を開設できるという利点がある。また、自動車など移動体向けのサービスに有利である。

●ISDB 
一つの搬送波上に音声、映像、静止画像、データ、文字、ファクシミリなどをのせた統合ディジタル放送の構想が、ISDBと名づけられている。地上放送用の周波数帯がほぼ利用されつくされていることから、ISDBの実現には衛星放送の利用が最適であると考えられている。