音楽CDとは
音楽CDが規格化されたのが1980年で、かなりの歳月が流れていますが、今でも
現役の規格として使われています。
そんな音楽CDについて再度確認という意味で説明していきます。
なるべくわかりやすく書いていきますので、「そんなものなんだー」という感じで
理解していただければと思います。
また、PCオーディオを始めたいけど、専門用語?が多くて何を意味しているのか分からない
と言う方の参考にもなればと思います。
音楽CDの規格
正確にはCD-DA(Compact Disc Digital Audio)という名称です。
名前にもあるようにコンパクトディスクにデジタルオーディオを入れたものとなります。
コンパクトディスクは主に12cmの円盤です。ちょっと前までは8cmシングルCDなんかも
普通に販売されていました。
皆さんご存知のようにCDプレーヤーやパソコンに入れると再生できます。
知らない人がいないくらい普及しているものですね。
まずは、主な仕様を紹介しておきます。
データ形式
|
LinearPCM(リニアPCM、LPCM)
|
サンプリング周波数
|
44,100Hz
|
量子化ビット数
|
16bit
|
チャンネル数
|
2ch
|
と、こんな仕様になっています。
(1980年当時のデジタル機器の性能からみて、かなりのハイスペックな仕様だと思います)
あんまり意識していないというか知らない方も多いのではないかと思います。
ここではまだ上の仕様の意味が分からなくてもOKです。説明していきます。
音とは
CDの仕様を説明する前に「音」と言うものを簡単に説明しておきます。
音とは振動波です。
空気でなくても何か伝えるもの(金属や液体)があれば振動して伝わります。
絵で描くと下のように表せます。(厳密に書くと物理学みたくなるので・・・雰囲気だけ描きます)
縦軸が音の大きさ、横軸が時間としています。
音の大きさはよくデジベル[db]という単位で表します。
実際には空気中の圧力変化が起きているので音圧[Pa]とも言います。(波形でいうと振幅)
いわゆるアンプと呼ばれるものはこの音の大きさを変える(増幅)させるものです。
横軸は時間なので時間が経つにつれて、音圧が変化していることを表しています。
音の基本としてはこれだけです。
しかし、これだけで音楽になるのか?と思われるかもしれません。
そうです。ここまででは音の強弱しか表現できていません(笑)
音の高さと言うのが表現できていません。音の高さは波の間隔で決まります。
波の間隔が短いもの(左)が高い音、波の間隔が長いもの(右)が低い音となります。
この間隔(音の高さ)を表すのに使うのが周波数[Hz:ヘルツ]になります。
(間隔は周期Tといいますがあまりオーディオではでてこないのでヘルツだけ説明しています)
Hzは1秒間にどれぐらい振動しているかというのを表しています。
つまり、間隔が短い波であれば周波数Hzは高く、間隔が長い波だと周波数Hzは低くなります。
(上の適当に描いた図だと左が12Hzで右が1Hzになります。)
実際の音楽で言うと、ラ音(A4)が440Hzという周波数になります。調律するときは
1秒間に440回振動する音を基準としているということです。
この音がわかれば絶対音感があるということになります。
人間が聞こえる周波数というのが一般的に20Hz〜20,000Hz(20kHz)とされていますが、
これは人によって違いますので、参考値になります。歳をとると周波数の高い(=高周波)は
聞き取れなくなってきます^^;
いわゆるイコライザというものは、この周波数帯を強調したり弱くしたりする機能です。
例えばfoobar2000のイコライザ。下に周波数が書いてあって、その周波数の音の大きさ[dB]を調整できます。左側が低い周波数(低音)、右側が高い周波数(高音)になります。
ドンシャリにしたい場合は、左側と右側をあげてやればよいです。(上の画像の設定は適当です)
こんな感じで音楽は音の大きさと振動の数で表現されています。
つまりこの波形を記録してやれば音楽を流すことが出来ると言うことです。
では、音楽CDの仕様を見ていきます。
アナログ波形をデジタルに
音について説明してきましたが、自然界で聞こえる音はアナログです。
つまり厳密な数値で表すことのできない波です。
このアナログの波形をデジタルに置き換えなければ音楽CDは作れません。
「デジタルとは」で説明しているように0、1で波を表現しないといけないわけです。
ではどのような方法を取っているかと言うと、仕様にかかれているように、
リニアPCMという形式でデジタルにしています。
PCMとは「pulse code modulation」で日本語では「パルス符号変調」といいます。
リニアと付いていますが、これは先ほどの波形をそのままパルス符号変調するという意味です。
急に訳がわからない言葉がでてきましたね。
とにかくアナログの波形をデジタルに置き換えたいわけです。そこでパルス符号変調と言われる
ものを使っていると思ってください。
アナログの波形を一定のサンプリング周期(データ化する間隔)でデジタルに置き換えます。
イメージとしては下の図になります。
緑色のカクカクした線がデジタルに置き換えたものになります。
アナログの線を消すと下のようになります。
見てのとおりカクカクした波に見えます。つまりデジタルはアナログの波形を近似している
だけで完全にアナログの波形を再現できているわけではないということです。
デジタルでは縦軸をビットで表します。CD-DAの仕様では量子化ビット数がこれに該当します。
CD-DAでは16ビット[bit]と決められています。
図の緑色の棒の高さの種類がどれだけあるかというのがビット数で決まってきます。
1bitで0と1の2種類が表せますので、
2bitで00,01,10,11の4種類(十進数:0〜3)・・・と見ていくと、
4bitで0〜15(16種類)
8bitで0~255(256種類)
16bitで0〜65,535(65,536種類)
となります。CD-DAの場合、縦軸は0~65,535で表されます。これがアナログ波形の
音の大きさになります。かなり細かくデータ化されているので音楽CDはちゃんと聞こえるわけです。
次に横軸の時間を見てみましょう。
横軸は時間ですが、どれくらいの間隔でデータ化するか(上で説明したビットで表す間隔)を
決めなければいけません。図では緑色の棒の横幅がそれにあたります。
CD-DAではサンプリング周波数が44,100ヘルツ[Hz]と決められています。
言い換えると、1秒間に44,100回データ化しているという意味です。
すごい回数と言うことが分かると思います。
ヘルツと言えば音の高さを表すのに使っていましたよね。
しっかりと区別しておきたいのですが、サンプリング周波数44,100Hzというのは固定で
データ化する間隔です。それとは関係なく演奏によって常に変化する波が音の高さのHzです。
音の説明で少し書きましたが、人間の聞こえる範囲と言うのが20Hz〜20,000Hzが一般的と
言われています。つまり、この周波数を表現するには最低20,000Hzのサンプリング周波数が
必要となりますが、サンプリングのタイミングによってはうまく再現できない可能性があります。
そのため、音楽CDではサンプリング周波数44,100Hzというものを使っています。
(おそらく容量の問題もあってこうなっているのだと思います)
あとチャンネル数2chは、そのままの意味で右と左(ステレオ)で別々の音を流せると言う意味です。
こんな風にアナログの波形をデジタルに置き換えています。
デジタルに置き換わった時点で0,1のデータになっていることが分かったと思います。
この0,1のデータが変わらない限り、アナログ変換した後の波形は変わらない(音質は変わらない)
と言うことになります。
万が一、デジタルの時点で何らかの不具合(転送ミス、ノイズ)で1ビット0→1に
変わったとしても1/44,100=0.0000226秒のことなので気づけるかどうかは・・・わかりません。
人間が気が付くような変化があるようであれば、かなりのビットがオリジナルよりも変化している
と考えられます。
ただ、ソフトウェアなどでデジタル→アナログ変換でそのままではなく、何か処理が加えられたり、
DACなどでフィルターやアンプが加えられた場合、アナログの波形が変化しますので
聞こえ方は変わってきます。デジタルの状態で変化することはほとんどありません。
(EACはCDからデジタル信号を間違えないように読み込むようにしているだけで、
音質がアップするとかそういうソフトではありません)
容量について
アナログをデジタルに置き換えることを説明しましたが、
アナログの波を全て再現しようとすると、ものすごい容量になってしまいます。
(デジタル化とはそんなものですが)ある程度妥協してデータ化する必要があります。
もちろん、量子化ビット数や、サンプリング周波数を増やせばアナログ波形に近くなって
原音に近くなりますが、容量が多くなってしまいます。
音楽CDの場合を計算してみると、
16bitのデータを1秒間に44,100回、ステレオで使っているので
16[bit]×44,100[回/s]×2[ch]=1,411,200[bit/s]=1411.2[Kbit/s]となります。
(Kbitキロビットについて知りたい方は、
キロ、メガ、ギガについてを参照してください)
「転送速度bpsとは」に書いてある値と一致していますね。
圧縮していないそのままのリニアPCMの容量はこんなふうに求めることが出来ます。
1秒間に1411.2Kbit使用して、CD1枚には74分収録できる規格となります。
(普通のデータを書き込むのと違ってエラー訂正分の容量を使わないため、メディアの容量
表示よりも多く入るようになっています。)
最後に
音楽CDについて少しは理解できましたでしょうか?
一応、用語も含めて説明しましたので、音楽CDに限らずいろいろなところで使えるかと思います。
例えば・・・
これを見て、
24bit/96kHz音源・・・あぁ。音の大きさの種類が24ビット(0〜16,777,215)で
サンプリング周波数が96kHzの音が録音とか再生できる機器か、と
何となくわかった感じになりませんか?(笑)
イヤホンやスピーカーにも再生可能周波数というのが書いてあることがあるので、
参考にしてみるといいと思います。(広い領域をカバーしていてもいいとは限りませんが)