・作曲/理論/音響

圧縮音源

2014/11/04

MP3などに代表される圧縮(エンコード)された音源は
データ量を小さくするために、マスキング効果
人の聴覚特性である等ラウドネス曲線などの性質を利用して
符号化されたものになります。

私はCUBASE7で44.1kHz/24bitでプロジェクトを作成しています。

これは1秒間に44,100回サンプリング(標本化)し、
最大音量と無音を16,777,216段階で記録させており、
サンプリング出来る高域の上限は22kHz、
ダイナミックレンジは144dBになります。

CUBASEの内部処理は32bit floatで処理されています。

16bit(65,536段階)の256倍の解像度が24bit(16,777,216段階)。
32bitでは4,294,967,296段階。

じつに無音から最大音量を約43億段階で記録しているのです。
16bitの65,536倍の解像度であり、24bitの256倍倍の解像度です。

32bitで小数計算を行うfloatでは、
理論上クリップは発生しませんし解像度は無限大。

実際は0に近いほど解像度が上がるのですが
ノイズフロアレベルのところで高い解像度であっても
あまり意味のないような。(^^;

このことを考えるとDAWの内部処理が32bit floatなのは
解像度というよりは処理工程の都度に整数計算していたのでは
工程が多いほど整数にまるめられるので音が変わってしまうから
なのでしょう。

そんなことを考えながらミキサーのフェーダーを動かしていると、
あるトラックのフェーダーを上下させると別のトラックの聞こえ方が
違ってきます。

よくある経験ですよね。(^^)
これによって私はミックスの迷路に陥るのです。

ここで冒頭で書いた圧縮音源について少し考えたのです。

先に書いたとおり圧縮音源は人の聴覚特性であるマスキング効果や
等ラウドネス曲線などを利用して符号化しているのですが、
要は聴覚上あまり関係ない音を省いて、データ量が多く必要な高域は
ローパスフィルターでカットしてデータ量を小さくしています。

適度にLPFでカットしないと聞こえ方が
良くないということもありますが。

とすると、PCMデータにEQを使用するとマスキング効果で
埋もれていた音が出てくることになりますが、エンコードされた
ものにEQを使用してもその周波数が単に増減するだけなのでしょうか。

もちろん残されたデータ部分でのマスキング効果は発生するでしょう。

PCに保管してあるCDは昔に取り込んだものは160kbps、
少し前でも320kbpsでした。

WMAでは160kbps、192kbpsでエンコードすると19kHz少し手前で
ローパスフィルターが掛かっているようでした。

256kbps以上では20kHzでLPFが掛かっているので、
そもそも20kHz以上が記録されていないCD-DAでは
256kbps以上で問題はないだろうと思ってでした。

最近では2TBのHDDが1万円も出せば買えるようなので、
PCにCDを取り込む際にエンコードする必要性もないのでしょう。

これまでは特に意識せず、20kHzにLPFがあるビットレートで
エンコードしていましたが、再生側でEQする時のことを考えれば
無圧縮で取り込むのが一番のようですね。

今日は何となくダラ~と書いてみました。(^^)

-・作曲/理論/音響