ex gigaB

半角板と濡れ場スレ住民各位のためにオナっといてやる。

DTV - 音声の項

駄文が見つかりました。

基礎知識

音声は映像と比べてとっつきやすいように思えるが、映像のように同時再生による比較が難しい。主観の排除がポイント。

音声データの形式

未だにmidiの仕様を理解できないオレ様でもわかるような記事をそのうち書く。

音声エンコードとMP3

映像に比べれば音声データのファイルサイズははるかに小さいのだから、音質だけを求めるならCD-DA≒リニアPCM≒WAVのまま保存すれよい。またLossLess圧縮を使わない限りどんな形式でも劣化が生じるのは当然なのだから細かい音質の違いなどどうでもいい、と割り切れるなら現時点で最も浸透しているフォーマットであるMPEG Audio Layer 3、いわゆるMP3で保存するのに問題はない(実際WMAやATRAC3とAACとMP3でどれだけ違いを認識できるんだか)。割り切れない人にはこの先参考になりませんぜ。

MP3はMPEG開発の副産物であるが、現在ほどハードディスクの大容量化が進んでいなかった20世紀末、CDの1/10の容量で済みパソコンで手軽にサウンドを楽しむことができるフォーマットとして注目を集めた。著作権が深刻な問題として認識されておらず、さらにP2Pによるファイル交換の仕組みも存在しなかった(それを支えるインフラも整っていなかった)こともあって、世界中でMP3による音楽配信サイトが乱立し実際にMPEGで使用されているMP2以上に浸透してしまった。サムデコという名前にピンとくる人もいるのではないかと思う。著作権管理機能が組み込まれていないコピーフリーフォーマットだが、ここまで浸透してしまった以上、いまさら他のフォーマットで置き換えるのは恐らく不可能だろう。いやコピーフリーだから浸透したともいえる。商用ベースの音楽ですらコピーコントロールCDやDRM付きのオンライン配信のほうが少数派となってしまった現状からしても。

余談

DVDの浸透を契機として面白い現象が起こった。DivXをはじめとする高性能コーデックの登場、ハードディスクの大容量&低価格化、光ファイバーによるネット環境の急速なブロードバンド化。オレ様が生きてきた中でこれほど「歯車が噛み合う」という表現がピッタリだった出来事はない。それぞれの普及が相乗効果を生み、さらに加速してゆく。どれかひとつ欠けてもP2Pの浸透はもっと後になっていたと思う。ちなみに初期のDVDの浸透に大きく貢献したのはPlayStation2である(確か発売から半年でそれまでの世界中のDVDプレーヤーの累計出荷台数を超えたらしい)。まさかPlayStation2が今の違法コピーが氾濫する状況を生んだとまではいわないが。

MP3を理解するうえで知っておきたいこと

MP3はさして高性能でもなければ高機能でもない。頑張ってID3タグで拡張してる程度。「通勤通学中にウォークマンでベスト盤を聴くような使い方にピッタリ」というのが本質。だからってわざわざ低いクオリティで保存することもないが、クオリティを追求するならリニアPCMFLAC、あるいはDVD-Audioで保存すべき(誤解を招きそうなので追記しておくけど、まだDVD-ARで録音可能な製品は出てないが、たとえば44.1KHzのCD-DAを192KHzにアップサンプリングしたところで、ソースのクオリティを超えることができるのだろうか?)。

なおPCMはアナログ信号をパルス変調する(リニア)量子化技術であり、実装する規格はCD-DAやDVD-Audioなど別に存在するため音質はそれぞれ異なる。

DVD-Audioには個人的にけっこう期待していたのだけど、普及する前に映像媒体のトレンドがBlu-Rayに移りそう。DVD-Audioの96KHz/24bitではMLPによる可逆圧縮となっているが、Dolby TRUE HDの場合転送レートは8Mbpsの非圧縮リニアPCMで8ch、dts HD Master Audioでは最大24.5Mbps(VBR)での音声記録が可能らしい(参考:SURROUND::WEB)。すごいのはわかる。ただCD-DAあたりと聴き比べて違いをどれだけ理解できるかは自信がないのでマルチトラック記録に対応したCD-DAくらいに考えてる。

グロッサリー

用語集って書けよ。

サンプリング周波数 [Smapling Rate]
1秒の音をどれだけ細かく区切れるか。数値が高いほど精密な計測をしているといえる。48KHzといった場合1秒間の振幅数が48000回、つまり1/48000秒単位で計測している。性質上、CD-DAで用いられる44.1KHzが多いがDVDで用いられる48KHzもときどき見かける。サンプリング=標本化はアナログ信号をデジタルに変換するための最初の工程で、続いて量子化を行う。
なお、“音”として実際に記録できるのはサンプリング周波数の半分となるため、20KHzの音を残したいならサンプリングは40KHzで行わないといけない。また人間の耳の可聴域はおおむね20~20000Hzというのが相場であるため、データ量節約ならびにフォールディングノイズ防止のため範囲外の低音をカットする仕組みがハイパスフィルタ、当然ローパスはその逆。ソフトによってはカット周波数を手動で設定できるものもある。試してみるとけっこう面白い。
まあどサンプリング周波数が高かろうと、たいていはスピーカーなどの再生側の周波数特性がそれをカバーし切れないもの(だからCDやDVDレベルで十分と考える)。
ビット数 [Bit]
正しくは量子化ビット数。1つの音をどれだけ細かく分解できるか。音とは空気を伝わる波であるが、デジタルはこの音の波を素の曲線のまま扱えないので、細かい階段に区切ってあげないといけない。この階段の数と思えばいい。階段が細かいほど原音に忠実といえる。やはりCD-DAで用いられる16bit(2の16乗=65536)が一般的。標本化→量子化を経た状態(A/D変換)が無圧縮データで、そのままではデータサイズが大きいため各種エンコード処理を施す。
なお、無圧縮データ以上の“音質”を後から実現することは不可能なため(サラウンド、DSPなどは単に聴きやすくするためのエフェクト)、マスターとするならできるだけ高精度なサンプリング&量子化を行う必要があるわけ。
ビットレート [Bitrate]
圧縮率。1秒間にどれだけの情報を詰め込めるか。当然数値が高いほど多くの情報を詰め込める。恐らく最も音質に直結しやすいのでみな気にするけど、192Kbps=24KB/secもあれば実用上そんなに問題はない。さすがに128Kbpsを切ると素人でも音質の違いがはっきりわかる。MP3の上限は320Kbps、DVDで用いられるMP2は384Kbps(アルゴリズムが異なるので高ビットレートだからといってMP2のほうが優れているわけではないというか、優れてないから上限が高いというか)。
CBRとVBR
固定ビットレート(CBR)と可変ビットレート(VBR)。音源の状態に応じて必要なビットレートを変化させるのがVBR。ファイルサイズを節約しつつ音質を下げたくない場合にVBRが有効だが、MP3のファイルサイズなんてタカが知れてるので、動画ほどVBRを使うメリットはないのでは。ぶっちゃけどちらを使うべきかはソース次第でもあるのだが(例えばピアニッシモからメゾフォルテの落差が激しいクラシックなんかはVBRの効果が出やすいんじゃないの)、俺は面倒なのでCBR320KBpsで固定してる。すぐ盗まれて運よく出てきても見る影もなく族車に改造されてることで有名なバイクにホンダのCBR400Fというのがあるが特に関係はない。
ノーマライズ
ソースによって異なるレベル(早い話がボリューム)を均一化すること。特に基準があるわけではないが、レベルが低いソースを基準にすると音が小さくて物足りないかヒスノイズに埋もれがちになり、高いソースを基準にするとレベル上げした曲のノイズがけっこう気になる。個人的には大音量で聴くことが多いので、歪まない範囲でプラスにゲインを振るのが好き。ソースにもよるけど、アベレージで-12dB、ピークで-3dBくらいが限界というのが俺なりの基準(個体差あり)。
ゲイン
入力/出力比。エンコードの際には元ソースに対する出力ファイル、再生の際には再生ソースに対するライン(スピーカー)出力を設定する。単位はdB、対数のため大雑把に値を変えると大変なことになる(おおむね3dBで倍の音量)。ピークと平均値のどちらかを基準として処理する実装が多い(ゲイン設定のないものも多い)。CDとMP3で音量が異なるのはたいていゲインの差。
ヒスノイズ
無音部分のサーッってやつ。SN比の悪いソースで効率のいいスピーカーを使ってるとものすごく気になる。気にならないレベルに抑えることは可能であっても、完全にゼロにするのは不可能じゃなかろうか。デスラー総統の部下にヒスというのがいる。閣下から軽く扱われていて常に不平をもらしていたそうだ。
プリエンファシス
高音ノイズの低減のために行われる、高周波数帯の信号増幅処理。再生時にはデエンファシスを行わないとシャカシャカ感が強くなる。まあ、俺は好みなのだが。プリエンファシス処理されていないソースに対してデエンファシスする必要はない。
ギャップレス再生 [Gapless Play]
MP3はその仕様上、普通に再生すると曲間にどうしても無音部分が生じてしまうため、コンピレーションやライブアルバムなどの連続再生には本質的に向かない。無音部分をなくすギャップレス再生を行うにはソフトウェア側で対応をしないといけないのだけど、そうすると(次の曲の先読みをしないといけないので)どうしても重くなる。なお代表的なエンコードエンジンであるLAMEは、コマンドラインの--nogapオプションでギャップレス再生に対応したエンコードが可能となっている(再生側の対応必須)。
何にしても擬似的に処理してるだけなので、真のギャップレス再生にするなら全トラックを連結して1つのファイルにするしかないのでは。使い勝手は落ちるだろうけど。
ID3タグ
MP3フォーマットは収録アルバムやトラック番号、アーチスト、ジャンルといった補足情報を埋め込むことが可能で、これがID3タグ。代表的なものはファイルプロパティで直接編集もできるけど、SuperTagEditormp3infpを筆頭にID3編集ソフトもたくさん存在する。でも“軽くて”使い勝手のいいソフトを見たことない。インターフェイスはExcelを参考にすればいいと思うのだが難しいのだろうか。難しいんだろうな。
大きく分けて、ID3v1とID3v2の2つの仕様があり、ファイルの記述箇所が異なるので両者の混在が可能(WindowsXPのファイルプロパティで設定できるのはv1)。もちろん各バージョンに再生ソフトが対応している必要があるが、今となっては文字数制限のきついv1は無視しても構わないと思う。v2はID3v2.2、ID3v2.3、ID3v2.4とリリースされているが下位互換性がないので注意が必要。
マルチチャンネル/マルチトラック
L+Rのステレオ2ちゃんねるもいちおうマルチではあるけど、マルチチャンネルといった場合5.1や7.1みたいなサラウンド形式などをさすことが多い。MP3は対応していないのでDVDソースからマルチチャンネルでエンコードする場合はAC3をそのまま使うか、DVD-Audioにする。
マルチトラックは一般的に録音時に用いられる言葉。これも2トラックをマルチとは呼ばない。3トラック(そんなの見たことない)以上のソースを独立して記録することを指す。
ジョイントステレオ
共包絡ステレオ、このへんからきな臭くなってくる。もともとはFMのモノラル/ステレオ放送の互換のための技術で、平たく言えば、左右チャンネルで同じ要素を取りまとめたステレオ。つまり通常のステレオよりもファイルサイズを小さく出来る≒その分を左右の差分に振り分けられるので音質は向上することはあっても劣化することはない(理論上は)。
そりゃ実装アルゴリズムがおかしかったら破綻することもだろうけどさ、それはそのプログラムが悪いのであって、ジョイントステレオそのものに問題があるわけじゃない。しかし原音に手を加える=忠実ではない、って思い込みでジョイントステレオ否定してるとしか考えられない人をよく見かける(あるいは言葉のイメージ的に擬似ステレオと錯覚してるのかもしれん)。まあそういう思い込みも主観的な音質には影響するのかもしれんが、だったら理屈っぽいこと言うのはナシだぜ、と。もちろんちゃんと原音とノーマルステレオとジョイントステレオの聴き比べをやって検証した結果こうだ、という人を否定するものではない。
音質
実はこの定義が一番悩ましいのかもしれない。オレは「どれだけ情報を詰め込めるのか」ってことと思ってるんだけどねっ!(だからジョイントステレオ>ノーマルステレオなわけ)。なんでそう思うかっていうとちゃんと理由があって、例えばクラシックのCD-DAの原盤にしたって実際にリアルにホールで聴くのと絶対に同じにはならないわけよ(ぶっちゃけ席ひとつ違っただけで同じではない)。だから原音に対する“忠実度”を音質と考えるのって危険な気がするの。言い換えれば原音に対する忠実度を絶対保証することは不可能だけど、情報量が多いほうが原音からの損失が少ない&アフターエフェクトの幅も大きい、だから音質≒情報量。
違う違う、そうじゃない(鈴木雅之風に って意見も当然あるんだろうけど、音質≒情報量って考えたほうが主観の排除はしやすいと思わんかね?ま、破綻さえしてなければいいんだよきっと。究極は個々の好みなんだしw

そもそも俺自身、情報量至上主義というわけでもない。画像で考えるとわかりやすいけれども、例えば色空間32bitの画像と16bitのそれとでは確かに情報量自体は前者が上回る。ただしホワイトバランスが狂ってて赤が赤くないよ!なんてこともあるわけ。相対的に情報量は欠落していても、実際の赤に近いのが16bit画像だったとしたら、鑑賞するのにどちらがよい?という話。だから音質&画質≒情報量であって、音質&画質=情報量ではないのよ。

・・・実のところ、ファイル交換を前提としないのであれば、より優れた圧縮フォーマットが存在する以上、マスターディスクを持ってる奴がMP3で保存するメリットというのはあまりないと思う。それでもMP3で保存するなら320Kbpsで。後からクオリティを上げることはできないのだから、この程度のファイルサイズをケチるのはバカバカしい(MP2同様、上限が384Kbpsだったらよかったのにね)。

余談

192Kbps以上でLAMEとかでエンコしたMP3とCD-DAの聞き比べをして、音質の違いがわかったらそいつはデビルイヤーの持ち主と思う。ただ、素人でもわかる違いがあるとすればゲインかな。それを勘違いして音質がどうこうって人は多そうな気がする。ゲイン低めにノーマライズするとノイズに埋もれがちだし(昔エンコされたと思われる128Kbps程度のMP3に多い)。

再生ソフト

PicaView1ファイルのみ再生したいときと複数ファイルを続けて再生したいときとでは、求められる使い勝手は異なるもの。かつて画像ビュアであるACDSee6.0のオマケ的存在いやむしろこっちが本命だった奴は相当いるだろ、にPicaViewというソフトがあって、ファイルを右クリックするだけで音声データを再生できるスグレモノとして重宝した。同じ操作で画像や動画のプレビューまで可能だったり俺の必需品だったのだけれども、WindowsXPのSP2以降、シェルの仕様変更で使えなくなってしまったのが残念。

実はプラグインファイルを書き換えるだけで使えることを知る。この情報をもとにいろいろ試した結果、ACDSee6.0同梱版のPicaViewだと何をやってもダメ(ACDSee本体も必ず必要だからかな?)。単体のPicaViewインストール後にACDSee8なり9なりProなりを入れてやればよい。またPicaViewインストール時にmsvcr71.dllが見つからないエラーが出る場合は、\Program Files\Common Files\ACD Systemsの中にあるのでこれを\Windows\system32に放り込んでやると解決する。32bitアプリなので64bit版のXPやVista、7では当然動かん。

そんなわけで久しぶりに右クリプレビューの快感を味わえることになったのだが、画像や動画、WAVやMIDIなんかはちゃんと再生できるのに肝心のMP3だとエラーになる。ものすごく切ない。そんなわけで、仕方なくSusieを併用しているのである(ワンクリック多い)。

2009-04-24追記:気がついたら再生できるようになっていた。

以下、Windows系のみ適当に紹介。ギャップレス再生に対応してないソフトをわざわざ使うくらいならWindowsMediaPlayerで十分というのが私見。

Sound Player Lilith & uLilith
このソフトが軽いといってる人が多いけどたいして軽くない。以前のマシンでは再生中にZIP書庫の解凍なんかやるとけっこう音飛びしたりした。それでもオレがデフォルトプレイヤーとして使ってる最大の理由はMP3のギャップレス再生に対応していた中では最も軽かったから(LAMEエンコードファイルなら、ノンストップ再生で可聴範囲でのズレはほぼないと思う)。スキン対応なので好みのインターフェイスで使うがよろし。俺はMUSCというのがお気に入り。バージョンが0.991bで止まってるのが気になる(BBSでは0.992bが告知されてたわ)。
付け加えるなら、音質が非常に良いらしい。オレにはわからんけど。あとゲインコントロールとかいろいろできるので、便利よ。Unicodeに完全対応させたのがuLilith。Lilithとスキンの互換性はなく、バグフィクスもまだまだ盛んだけれども、多国籍な音楽好きにはよいかもしれない。
APlayer
とりあえず再生してみる、といったときに便利なんだけど、256Kbps以上のビットレートにちゃんと対応してないのが不満(ゼロからだと音が出ない、少しシークすると鳴る)。軽いけどよく落ちる。更新もしてないようなのでもう使うことはないと思われ。
foobar2000
対応形式が豊富で柔軟なカスタマイズが可能なプレイヤー。各種変換も可能。エディタのようなインターフェイスは好みが分かれそう。ギャップレス再生可能。
1by1 日本語化
エクスプローラライクなインターフェイスが特徴のプレイヤー。フォルダを再生、という感覚。他のアプリとの連携も柔軟でギャップレス再生可能、使い勝手も良かったのだけれども、ちょと重すぎて遺憾ながら戦力外通知。
Winamp 日本語化
MP3浸透に大きく貢献したソフトだけど、今となってはMP3再生での優位性は特にない。ネトラジが聴ける、くらい。有名どころの中では軽いほう。公式に日本語対応してないので(その時点でふざけんなだろ)、必要に応じて別途日本語化しる。
WindowsMediaPlayer
ナマイキにもギャップレス再生対応など本質的に悪いソフトではないのだけど、デフォルトの設定では正直使い物にならない。コイツと付き合うなら、ID3タグにアルバム情報とかが含まれてると勝手にファイルをリネームしてくれる超絶ステキングな機能をまず無効にすることから。死ねばいいのに。決して軽くはないがiTunesに比べればぜんぜんマシ。
iTunes/QuickTime
QuickTimeが必要だわ常駐するわ重くて使い物にならないわAAC普及のためMP3の品質をわざと落としてるわ、ゴミソフトの代名詞とオレ様は認定しているのだが世界的には非常に普及しているらしい。マシンの処理が重かったら迷わず消すべきだ。ネトラジもといポッドキャスティングに対応してる。というか、iTunesのおかげでポッドキャスティングやネトラジが一般的になったといえる。メディア管理はそれなりに評価できるしID3タグ編集機能の使い勝手もわりとよい。それでも我慢できないくらい重い。Macではどうなのか知らないが。MPEG4系コーデックが必要でQuickTimePlayer入れてるだけ。まあ、FairPlayを浸透させた功績は認めてあげないとだけど。
常駐するqttask消す簡単な方法、qttask.exe削除して同名のフォルダ作っちゃえばいいんだよ。ファイルは上書きできるが存在するフォルダの上書きは原則としてできない、というウイルスやマルウェアなんかの免疫作るのと同じ手法≒ウイルスと同じレベルってことだね!
※最新版はついにqttask.exeが消えた。だからって今更使う気にはなれないのだが、iPod Shuffleを買ってしまったので仕方なく導入(Songbirdという選択もあるにはあるのだが)。
Real One Player
知名度は高いのに使ってる人を見たことがないという珍しい奴。iTunesほど重くはないが、常駐のウザったさは同じ。評価する点が何ひとつ見つからない。RealMediaコーデックが必要だから入れてるだけ。
携帯プレイヤーのおまけでくっついてきたようなソフト
端末の接続を監視するため常駐するケースがほとんどなのでいらない。ファイルの転送はUSBストレージとして認識させれば済む話だし、おまけソフトを経由させないと転送できないなんてのはプロダクトとして失格(開発者はきっと泣いている)。
SATIS D-218S
これ売れたのかな。

最近わりとギャップレス再生に対応してるソフトが増えてきたけど携帯プレーヤーではまだまだ少数派で、オレ様がPSPをウォークマン替わりにしている最大の理由もそのへんだったりする(iPodを好きになれなかったのもギャップレス再生への対応が遅かったから)。PSPだけじゃなくソニー製はほぼギャップレス再生に対応してるが、今のところPSPはID3タグのトラック番号までは見ていないようで、再生はタイトルのアルファベット順、同タイトルの場合ファイル名順になる。

どうでもいいことだがiPod nanoやiPod Shuffleに力を入れだしたあたりで、ようやくAppleも「そんな何十ギガもサウンドなんて持ち歩かねーよ、てかそもそも持ってねーよ」ってことがわかってきたんだろうな。それにわざわざ動画持ち歩く奴なんているのかね。どう贔屓目に見てもiPodシリーズは高すぎると思う。

でもShuffle4はちょっとほしいと思う。2ndのサイズとインターフェイスは最高だった。あるいはiPod touch+Pocket WiFi+Eneloop Stick Boosterな変態さんもありかもしれない。

編集ソフト

本稿の趣旨とは若干異なるが、もののついでなので。

mp3DirectCut
1by1の作者の手によるカット編集ソフト。インターフェイスはとてもわかりやすい。ロスレス編集可能。
Audacity
波形編集できるソフトとしては、フリーではこれが一番高機能ジャマイカ。
SoundEngine Free
編集というかエフェクト。WAVEファイルが対象であるがVBMP3.DLLを組み込めばMP3の読み込みも可能になる。MP3エンコードエンジンがGOGO.DLLのみなのが残念。

余談

マルチメディアファイルの管理って意外と面倒だけど、NTFSのシングルボリュームならMy Musicフォルダあたりにハードリンク作ったらどうかな。ほしたら実体(全部実体扱いなわけだが)をどこに移動しようがリネームしようがへっちゃらじゃんね。まあシングルボリューム運用自体限りなく不可能だけどさ。

注、c:\temp\hoge.txtはhoge.txtがc:\tempに保存されてるわけじゃない。保存場所はあくまでもセクタの位置であり、ファイル名もディレクトリもシェル上で参照するのための目印にすぎない。という理屈がわからないうちは手を出してはいけません。収集つかない事態になるから。

エンコードの際のツール

これまた趣旨違いだが、ここまで触れた以上は取り上げようかと。

CD2WAV
単体ではWAV形式に変換するだけだが、後述する午後のこ~だなどと連携することでMP3にエンコードできる。この手のソフトの基本機能であるCDDBからのアルバム情報取得に対応し、取得データをID3タグに反映も可能。ただID3タグの編集機能の使い勝手はイマイチ。ぶっちゃけオレ的には機能はこれで十分なんだが、起動時のスプラッシュがどうも。
LAME
たぶん世界で最も浸透しているMP3エンコーダ。エンコーダレベルでギャップレスに対応してるのはたぶんこれだけのはず(いちおうiTunesもらしい)。音質も非常によいと評判は高いけど、オレ様の耳では午後のこ~だとの違いがわからなかった(VBRなんて使わないし)。2009年時点での最新は3.98.xxだけど安定バージョンは3.97かな?
参考:LAME 3.98 stable コマンドラインオプション
午後のこ~だ
LAME3.88をベースにしたMP3エンコーダ、エンジンであるGOGO.DLLが様々なソフトで利用されており、かつては日本のMP3の大半がこれでエンコされていたと思われる。インストールの際わざわざコンパイルしているので環境に最適化されている(はず)。ぶっちゃけオレ的には性能はこれで十分なんだが、起動時のスプラッシュがどうも。
CDex
CD2WAV+午後のこ~だは3時88分で時間が止まったままなので最近はこっちを使う。まあVBRでエンコしない限り違いなんてわからんけど(≒CBR320Kbpsでしかエンコしないから違いなんてわからんけど)、FLACとかも手軽に扱えるし、CDDBとID3タグの連携もCD2WAVよりマトモ(あっちはトラック番号が付かねーんだよ)。
BonkEnc Audio Encoder
最近CDexが不調なので使いはじめたエンコーダ、個人的には気に入った。エンコード性能はよいと思うけど処理はやや重め。ルック&フィールが独特なので多少の慣れが必要かも。2009年8月の時点でのMP3エンコードエンジンはLAME Ver.3.98.3。ほか、OGGOgg、FLAC、WAV、MP4/AACなどにも対応している。
iTunes
MP3へのエンコでこれを使うのは間抜けだけれども、ストアでダウンロードしたM4Aファイルを変換するのに仕方なく、という感じ。
CD Manipulator
CDのリッピング(中身吸出し)ツール。CompactDiscの仕様書は通称レッドブックと呼ばれるが、AVEXを中心にリリースされているコピーコントロールCD(CCCD)は仕様を満たしていないので本当はCDではない(実際CCCDにはレッドブック準拠である証、CompactDiscのロゴはどこにもない)。まともなCDであればCD2WAVでエンコードできるのだが、CCCDは読み取りエラーになってしまう(それが目的だし)。そんなときにCD Manipulatorであれば吸いだせることが多い(まあドライブ自体がどうしようもない場合は諦めろ)。ルック&フィールはほとんどCloneCD。そして驚きのWindows 7対応
Exact Audio Copy 日本語化
通称EAC。ドライブごとにオフセットを調整できるなど、CD-DAの読み出しに関して非常に高精度であると評判のフリーソフト(実は30サンプルズレてました!というのは言わない約束)。アップサンプリングしてDVD-Audioを作る、なんてときにはこれを使うとよいかもしれない。MP3エンコードエンジンはLAMEのほか午後にも対応。

CD Manipulatorなどでリッピングしトラックイメージ(仮想のCD)を作成したら、CD売っ払う前に面倒でも必ず正常に再生できることを確認すること。吸出しに成功したように見えても音飛びが生じていることはけっこうある。なお再生の際にはDaemon Toolsなどの仮想マウントツールを使う。

余談

マスタリングとかするわけじゃあるまいし、自分の普段のリスニング環境で満足できるならそれで十分と思う。そうでなくても音質なんて嗜好性が高いんだから。更なる高みを目指すならこんな場末のサイトなんか参考にならんだろ。そりゃ専用のリスニングルームで100万単位でオーディオに金掛けられるなら話は別だけど、機材に500万とか掛けるなら、10万くらいでDSPあたりでいぢった音で納得しておいて、残りの490万をソフトに突っ込んだほうが健全なんじゃないの。

さらに余談だけど、個人的によいオーディというのは、フラットな音を出せることと思ってる。リアルが何かを知らないでより良くすることなんでできないじゃん(これは、サウンドに限らんね)。しかし残念ながらそんな機材も環境も、判別する耳もない。そんなわけで、俺好みでさえあればいい、という結論に落ち着く。そうでない場合、何が原因なのか、何をいじればいいのかを考えるようにしてる。

吸出し用ドライブ

リッピングの大前提として知っておくこと。CD-DAは仕様上セクタに対するアドレス情報が存在しないので、CD-ROMドライブにおいて読み込みが追従できずエラーが発生した場合、シークコマンドでエラー箇所の特定ができない。これは誤り訂正の精度云々ではなく、CD-DAのリッピングにおける根源的な問題(想定外の動きを要求してるわけだから、CD-DAを上手くリッピングできないドライブが欠陥品ってわけじゃない)。要するにエラーが起こるのはあたりまえ。

で、ドライブ何がよいのかだけど、正直オレ様にもわからん。まあ上記を踏まえると、ディスクがきちんと水平を保ち回転ムラがなく、ピックアップの追従性もよいこと、読み書きのオフセットが0(もしくはきっちり調整できること)、といったあたりが条件になるのだろう()。この手の検証に関して大御所であるCD-R実験室によれば、偶然ゲットできたLITE-ONのLTR-48246Sが非常によいらしくなんかトクした気分。おおむね、最近のマルチドライブよりも格安PCにくっついてきたようなCD-ROMのほうが安定して吸いだせることが多いようだ。

現在主力マシンで使用しているのはLGのコンボドライブGSA-4163B 「Write samples offset」 が±0のため、普通に音楽CDを焼くだけで位置ずれ、書き漏らしのない音楽CD作成が可能とのこと。発売当時に存在した各種プロテクトに対しても完璧に対応してるらしい。道理でこれまでリッピングで困ったことがないわけだ(ちょっと嬉しい)。

まあ、オフセットが2~30サンプルズレていたところで多くの人にとっては(あるいは多くのソースにおいては)可聴誤差とはならないと思われるが、厳密さを求めるなら少なくとも読み書きで異なるドライブを使うのはタブー。つまりどこぞで放流されたようなトラックイメージを焼いても原盤と同じになるはずもないぞ、と。

DVD-Audioを作ってみる

DVD-Audioは複数のサンプリングレートに対応しているので、目的に応じて音質を調整してやる。1枚のDVD-RにCD-DAと同等の音質(44.1kHz/16bit)であれば約7時間、最高品質の192kHz/24bitの場合約1時間の記録が可能(ともに2ch)。

つづくつづかない

思うのだが、DVD-AudioやSuper Audio CDがあまり普及しないのは、結局ほとんどの人が44KHz - 16bit PCMで十分満足してるからだろ?地上波デジタルと同じで、すでに十分普及して不満も特にないものを置き換えるには、利用者のメリットがほとんどないのよ。逆に、なんで大した音質でもないiPodなどなどが爆発普及したのか、本質的な理由を考えてみろよ。

人間の脳の処理能力を超える量の情報が溢れすぎた結果、世界全体が何事においても軽くなってるんだよ。まあ、どっちのが正しいとかいうつもりはないがね。

まあ、好きなものを追及するのを否定はしない。そんなこといってたら人生そのものがつまらなくなる。何事も意味なんてない、あるのは意思だけよ。

脚注

CDの1/10のファイルサイズ
CD-DAの音声は1411.2Kbpsで記録されているので、128KbpsでエンコードされたMP3(普及しだした頃はだいたいこれだった)はほぼ1/10のサイズとなる。今となっては意図的にそうでもしない限り、音楽を192Kbps以下でエンコする奴のほうが珍しい。
ジョイントステレオ
FM放送で用いられるミッドサイドステレオでは、主信号にモノラル音声M(L+R)、副信号に右(R)と左(L)の音声の差S(L-R)を用意し、実際のステレオ音声として右(R)にM-S=L+R-(L-R)=2Rを、左(L)にM+S=L+R+(L-R)=2Lを用いることでLとRを再現する(最後に2で割りゃいい)。つまり可逆変換である(実際には浮動小数点計算の丸め誤差の分だけ可逆ではないそうなのだけど、人間の耳に検出できる範囲のものではない)。LとRを別々に用意するよりもデータ量を減らすことができるが、左右の音の差が激しい場合にはLとRを独立して記録するノーマルステレオのほうが効率がよい。ジョイントステレオは状態によって両者を自動的に選択する方式。
こうやってジョイントステレオについてちゃんと説明してるページがあまりないので、妙な誤解や思い込みを持つ人がいるのではないか。
オフセット
ドライブごとに設定されている、読み書き開始位置。セクタ情報を持っているデータCDでは問題にならないが、オーディオCDではこれが極端にずれているとリッピング漏れ、ライティング漏れの原因になる。EACのようにドライブごとにオフセットを調整できるソフトも存在する。
参考:music pc - オフセットの真実