マルチメディア - 音声の項
駄文が見つかりました。
基礎知識
音声は映像と比べて情報量が少ないぶんとっつきやすいように思えるが、映像のように同時再生による比較が困難で、主観に左右されやすいわプラシーボの影響も受けやすいわ、実はとてもめんどくさい。
音声データの形式
未だにmidiの仕様を理解できないオレ様でもわかるような記事をそのうち書く。
音声エンコードとMP3
映像に比べれば音声データのファイルサイズははるかに小さいのだから、音質だけを求めるならCD-DA≒リニアPCM≒WAVのまま保存すれよい。またLossLess圧縮を使わない限りどんな形式でも劣化が生じるのは当然なのだから細かい音質の違いなどどうでもいい、と割り切れるなら現時点で最も浸透しているフォーマットであるMPEG Audio Layer 3、いわゆるMP3で保存するのに問題はない(実際WMAやATRAC3とAACとMP3でどれだけ違いを認識できるんだか)。割り切れない人にはこの先参考になりませんぜ。
MP3はMPEG開発の副産物であるが、現在ほどハードディスクの大容量化が進んでいなかった20世紀末、CDの1/10の容量で済みパソコンで手軽にサウンドを楽しむことができるフォーマットとして注目を集めた。著作権が深刻な問題として認識されておらず、さらにP2Pによるファイル交換の仕組みも存在しなかった(それを支えるインフラも整っていなかった)こともあって、世界中でMP3による音楽配信サイトが乱立し実際にMPEGで使用されているMP2以上に浸透してしまった。サムデコという名前にピンとくる人もいるのではないかと思う。著作権管理機能が組み込まれていないコピーフリーフォーマットだが、ここまで浸透してしまった以上、いまさら他のフォーマットで置き換えるのは恐らく不可能だろう。いやコピーフリーだから浸透したともいえる。商用ベースの音楽ですらコピーコントロールCDやDRM付きのオンライン配信のほうが少数派となってしまった現状からしても。
余談
DVDの浸透を契機として面白い現象が起こった。DivXをはじめとする高性能コーデックの登場、ハードディスクの大容量&低価格化、光ファイバーによるネット環境の急速なブロードバンド化。オレ様が生きてきた中でこれほど「歯車が噛み合う」という表現がピッタリだった出来事はない。それぞれの普及が相乗効果を生み、さらに加速してゆく。どれかひとつ欠けてもP2Pの浸透はもっと後になっていたと思う。ちなみに初期のDVDの浸透に大きく貢献したのはPlayStation2である(確か発売から半年でそれまでの世界中のDVDプレーヤーの累計出荷台数を超えたらしい)。まさかPlayStation2が今の違法コピーが氾濫する状況を生んだとまではいわないが。
MP3を理解するうえで知っておきたいこと
MP3はさして高性能でもなければ高機能でもない。頑張ってID3タグで拡張してる程度。「通勤通学中にウォークマンでベスト盤を聴くような使い方にピッタリ」というのが本質。だからってわざわざ低いクオリティで保存することもないが、クオリティを追求するならリニアPCMか可逆圧縮のFLACで保存すべきだろう。
なおPCMはアナログ信号をパルス変調する(リニア)量子化技術であり、実装する規格はCD-DAやDVD-Audioなど別に存在するため音質はそれぞれ異なる。
DVD-Audioには個人的にけっこう期待していたのだけど、普及する前に映像媒体のトレンドがBlu-Rayに移りそう。DVD-Audioの96KHz/24bitではMLPによる可逆圧縮となっているが、Dolby TRUE HDの場合転送レートは8Mbpsの非圧縮リニアPCMで8ch、dts HD Master Audioでは最大24.5Mbps(VBR)での音声記録が可能らしい(参考:SURROUND::WEB)。すごいのはわかる。ただCD-DAあたりと聴き比べて違いをどれだけ理解できるかは自信がないのでマルチトラック記録に対応したCD-DAくらいに考えてる。
グロッサリー
用語集って書けよ。
- サンプリング周波数 [Smapling Rate]
- 1秒の音をどれだけ細かく区切れるか。数値が高いほど精密な計測をしているといえる。48KHzといった場合1秒間の振幅数が48000回、つまり1/48000秒単位で計測している。性質上、CD-DAで用いられる44.1KHzが多いがDVDで用いられる48KHzもときどき見かける。サンプリング=標本化はアナログ信号をデジタルに変換するための最初の工程で、続いて量子化を行う。
- なお、“音”として実際に記録できるのはサンプリング周波数の半分となるため、20KHzの音を残したいならサンプリングは40KHzで行わないといけない。また人間の耳の可聴域はおおむね20~20000Hzというのが相場であるため、データ量節約ならびにフォールディングノイズ防止のため範囲外の低音をカットする仕組みがハイパスフィルタ、当然ローパスはその逆。ソフトによってはカット周波数を手動で設定できるものもある。試してみるとけっこう面白い。
- まあどサンプリング周波数が高かろうと、たいていはスピーカーなどの再生側の周波数特性がそれをカバーし切れないもの(だからCDやDVDレベルで十分と考える)。
- ビット数 [Bit]
- 正しくは量子化ビット数。1つの音をどれだけ細かく分解できるか。音とは空気を伝わる波であるが、デジタルはこの音の波を素の曲線のまま扱えないので、細かい階段に区切ってあげないといけない。この階段の数と思えばいい。階段が細かいほど原音に忠実といえる。やはりCD-DAで用いられる16bit(2の16乗=65536)が一般的。標本化→量子化を経た状態(A/D変換)が無圧縮データで、そのままではデータサイズが大きいため各種エンコード処理を施す。
- なお、無圧縮データ以上の“音質”を後から実現することは不可能なため(サラウンド、DSPなどは単に聴きやすくするためのエフェクト)、マスターとするならできるだけ高精度なサンプリング&量子化を行う必要があるわけ。
- ビットレート [Bitrate]
- 圧縮率。1秒間にどれだけの情報を詰め込めるか。当然数値が高いほど多くの情報を詰め込める。恐らく最も音質に直結しやすいのでみな気にするけど、192Kbps=24KB/秒もあれば実用上そんなに問題はない。さすがに128Kbpsを切ると素人でも音質の違いがはっきりわかる。MP3の上限は320Kbps、DVDで用いられるMP2は384Kbps(アルゴリズムが異なるので高ビットレートだからといってMP2のほうが優れているわけではないというか、優れてないから上限が高いというか)。
- CBRとVBR
- 固定ビットレート(CBR)と可変ビットレート(VBR)。音源の状態に応じて必要なビットレートを変化させるのがVBR。ファイルサイズを節約しつつ音質を下げたくない場合にVBRが有効だが、MP3のファイルサイズなんてタカが知れてるので、動画ほどVBRを使うメリットはないのでは。ぶっちゃけどちらを使うべきかはソース次第でもあるのだが(例えばピアニッシモからメゾフォルテの落差が激しいクラシックなんかはVBRの効果が出やすいんじゃないの)、俺は面倒なのでCBR192Kbpsで固定してる。すぐ盗まれて運よく出てきても見る影もなく族車に改造されてることで有名なバイクにホンダのCBR400Fというのがあるが特に関係はない。
- なお動画のVBRでは平均ビットレートと上限ビットレートを設定し2passでエンコードするのが一般的だが、固定量子化という方法もある。これはビットレートに上限を設けずソースに忠実に量子化するもので、ファイルサイズ予測がまったくできない。
- ゲイン
- 入力/出力比。感覚としては生録のレベル調整に似ている。エンコードの際には元ソースに対する出力ファイル、再生の際には再生ソースに対するライン(スピーカー)出力を設定する。単位はdB、対数のため大雑把に値を変えると大変なことになる(おおむね3dBで倍の音量)。ピークと平均値のどちらかを基準として処理する実装が多い(ゲイン設定のないものも多い)。CDとMP3で音量が異なるのはたいていゲインの差。
- ノーマライズ
- ソースによって異なるレベル(早い話がボリューム)を均一化すること。特に基準があるわけではないが、レベルが低いソースを基準にすると音が小さくて物足りないかヒスノイズに埋もれがちになり、高いソースを基準にするとレベル上げした曲のノイズがけっこう気になる。個人的には大音量で聴くことが多いのでプラスにゲインを振るのが好き。ソースにもよるけどアベレージで-12dB、ピークなら-3dBくらいがクリッピング歪みの発生しない限界というのが俺基準。とにかくソース次第だけどアベレージ-16dBくらいが一番多いかな。
- ヒスノイズ
- 無音部分のサーッってやつ。SN比の悪いソースで効率のいいスピーカーを使ってるとものすごく気になる。気にならないレベルに抑えることは可能であっても、完全にゼロにするのは不可能じゃなかろうか。デスラー総統の部下にヒスというのがいる。閣下から軽く扱われていて常に不平をもらしていたそうだ。
- 効率
- 信号処理能力の目安で入力をどれだけ振動に変換できるか。とりあえず同じボリュームでも効率がいいスピーカーは音がデカいと考えておけばいい。
- プリエンファシス
- 高音ノイズの低減のために行われる、高周波数帯の信号増幅処理。再生時にはデエンファシスを行わないとシャカシャカ感が強くなる。まあ、俺は好みなのだが。プリエンファシス処理されていないソースに対してデエンファシスする必要はない。
- ギャップレス再生 [Gapless Play]
- MP3はその仕様上、普通に再生すると曲間にどうしても無音部分が生じてしまうため、コンピレーションやライブアルバムなどの連続再生には本質的に向かない。無音部分をなくすギャップレス再生を行うにはソフトウェア側で対応をしないといけないのだけど、そうすると(次の曲の先読みをしないといけないので)どうしても重くなる。なお代表的なエンコードエンジンであるLAMEは、コマンドラインの--nogapオプションでギャップレス再生に対応したエンコードが可能となっている(再生側の対応必須)。
- 何にしても擬似的に処理してるだけなので、真のギャップレス再生にするなら全トラックを連結して1つのファイルにするしかないのでは。使い勝手は落ちるだろうけど。
- ID3タグ
- MP3フォーマットは収録アルバムやトラック番号、アーチスト、ジャンルといった補足情報を埋め込むことが可能で、これがID3タグ。代表的なものはファイルプロパティで直接編集もできるけど、SuperTagEditorやmp3infpを筆頭にID3編集ソフトもたくさん存在する。でも“軽くて”使い勝手のいいソフトを見たことない。インターフェイスはExcelを参考にすればいいと思うのだが難しいのだろうか。難しいんだろうな。
- 大きく分けて、ID3v1とID3v2の2つの仕様があり、ファイルの記述箇所が異なるので両者の混在が可能(WindowsXPのファイルプロパティで設定できるのはv1)。もちろん各バージョンに再生ソフトが対応している必要があるが、今となっては文字数制限のきついv1は無視しても構わないと思う。v2はID3v2.2、ID3v2.3、ID3v2.4とリリースされているが下位互換性がないので注意が必要。
- マルチチャンネル/マルチトラック
- L+Rのステレオ2ちゃんねるもいちおうマルチではあるけど、マルチチャンネルといった場合5.1や7.1みたいなサラウンド形式などをさすことが多い。MP3は対応していないのでDVDソースからマルチチャンネルでエンコードする場合はAC3をそのまま使うか、DVD-Audioにする。
- マルチトラックは一般的に録音時に用いられる言葉。これも2トラックをマルチとは呼ばない。3トラック(そんなの見たことない)以上のソースを独立して記録することを指す。
- ジョイントステレオ
- 共包絡ステレオ、このへんからきな臭くなってくる。もともとはFMのモノラル/ステレオ放送の互換のための技術で、平たく言えば、左右チャンネルで同じ要素を取りまとめたステレオ。つまり通常のステレオよりもファイルサイズを小さく出来る≒その分を左右の差分に振り分けられるので理論上は音質は向上することはあっても劣化することはない。この理屈を受け入れられない人はとっととお引取りください。
- そりゃ実装アルゴリズムがおかしかったら破綻することもだろうけどさ、それはそのプログラムが悪いのであって、ジョイントステレオそのものに問題があるわけじゃない。しかし原音に手を加える=忠実ではない、って思い込みでジョイントステレオ否定してるとしか考えられない人をよく見かける(あるいは言葉のイメージ的に擬似ステレオと錯覚してるのかもしれん)。まあそういう思い込みも主観的な音質には影響するのかもしれんが、だったら理屈っぽいこと言うのはナシだぜ、と。もちろんちゃんと原音とノーマルステレオとジョイントステレオの聴き比べをやって検証した結果こうだ、という人を否定するものではない。
- 音質
- 実はこの定義が一番悩ましいのかもしれない。オレは「どれだけ情報を詰め込めるのか」ってことと思ってるんだけどねっ!(だからジョイントステレオ>ノーマルステレオなわけ)。なんでそう思うかっていうとちゃんと理由があって、例えばクラシックのCD-DAの原盤にしたって実際にリアルにホールで聴くのと絶対に同じにはならないわけよ(ぶっちゃけ席ひとつ違っただけで同じではない)。だから原音に対する“忠実度”を音質と考えるのって危険な気がするの。言い換えれば原音に対する忠実度を絶対保証することは不可能だけど、情報量が多いほうが原音からの損失が少ない&アフターエフェクトの幅も大きい、だから音質≒情報量。つまり音質は主観ではなく客観基準で語るべきなのだ、ってのが持論。
- 違う違う、そうじゃない(鈴木雅之風に って意見も当然あるんだろうけど、音質≒忠実度ではなく、ましてや満足度や快適度でもなく、音質≒情報量ってしとくほうが主観の排除はしやすいと思わんかね?ま、破綻さえしてなければいいんだよきっと。究極は個々の好みなんだしw
まあこの持論にも穴があって、たとえば同じソースから違う種類のコーデックで圧縮したら同じファイルサイズだったとしよう、わしの持論だと「音質は同じ」ってことになる。でも方やMP3方やAACでサイズが同じだったら「AACのほうが音がいい!」ってなるに決まってる。情報量が少なくたって人間の聴覚(知覚)に影響がないものは識別できないから、音質≒情報量で押し通すのも無理があるのよね。
そもそもわし自身、情報量至上主義でもなんでもない。画像で考えるとわかりやすいけれども、例えば色空間32bitの画像と16bitのそれとでは確かに情報量自体は前者が上回る。ただしホワイトバランスが狂ってて赤が赤くないよ!なんてこともあるわけ。相対的に情報量は欠落していても、実際の赤に近いのが16bit画像だったとしたら、鑑賞するのにどちらがよい?という話。どこまでいっても音質&画質≒情報量が音質&画質=情報量になることはない。
音質や画質のような品質を語る場合、、主観的評価なのか客観的評価なのかを明確にしておくのが誤解を生まないポイント。そのうえで「個人の好み」と「個人の知覚」それぞれの差についてはあまり突っ込まないのがたぶん幸せな人生を送るポイントじゃないかねえ。
・・・実のところ、ファイル交換を前提としないのであれば、より優れた圧縮フォーマットが存在する以上、マスターディスクを持ってる奴がMP3で保存するメリットというのはあまりないと思う。それでもMP3で保存するなら192Kbps以上で。
再生ソフト
1ファイルのみ再生したいときと複数ファイルを続けて再生したいときとでは、求められる使い勝手は異なるもの。かつて画像ビュアであるACDSee6.0のオマケ的存在いやむしろこっちが本命だった奴は相当いるだろ、にPicaViewというソフトがあって、ファイルを右クリックするだけで音声データを再生できるスグレモノとして重宝した。同じ操作で画像や動画のプレビューまで可能だったり俺の必需品だったのだけれども、WindowsXPのSP2以降、シェルの仕様変更で使えなくなってしまったのが残念。
実はプラグインファイルを書き換えるだけで使えることを知る。この情報をもとにいろいろ試した結果、ACDSee6.0同梱版のPicaViewだと何をやってもダメ(ACDSee本体も必ず必要だからかな?)。単体のPicaViewインストール後にACDSee8なり9なりProなりを入れてやればよい。またPicaViewインストール時にmsvcr71.dllが見つからないエラーが出る場合は、\Program Files\Common Files\ACD Systemsの中にあるのでこれを\Windows\system32に放り込んでやると解決する。32bitアプリなので残念ながら64bit版のXPやVista、7では当然動かん。
そんなわけで久しぶりに右クリプレビューの快感を味わえることになったのだが、画像や動画、WAVやMIDIなんかはちゃんと再生できるのに肝心のMP3だとエラーになる。ものすごく切ない。そんなわけで、仕方なくSusieを併用しているのである(ワンクリック多い)。
2009-04-24追記:気がついたら再生できるようになっていた。
以下、そんな詳しくないけどWindows系のみ適当に紹介。ギャップレス再生に対応してないソフトをわざわざ使うくらいならWindowsMediaPlayerで十分というのが私見。
- Sound Player Lilith & uLilith
- AAC以外の主な形式に対応。機能や利便性はもっと優秀なのがいっぱいあると思うけど、これまで使った中では一番馴染んだ。ギャップレス再生の性能が良く、LAMEエンコードファイルなら、ノンストップ再生で可聴範囲でのズレはほぼないらしい。各種変換機能もそこそこ充実しておりSSEなどの拡張命令にも対応しているので処理もけっこう速い。ただライセンスの問題でMP3のエンコードには未対応(トランスコードによるMP3のゲイン変更は可能で、これがなかなか便利)。付け加えるなら、音質が非常に良いらしい。スキン対応なので好みのインターフェイスで使うがよろし。俺はMUSCというのがお気に入り。
- Unicodeに完全対応させたのがuLilith。旧Lilithとスキンの互換性はなくバグフィクスもまだまだ盛んだけれども、多国籍な音楽好きにはよいかもしれない。
- foobar2000
- 対応形式が豊富で柔軟なカスタマイズが可能なプレイヤー。各種変換も可能。エディタのようなインターフェイスは好みが分かれそう(俺はダメ)。
- 1by1 日本語化
- エクスプローラライクなインターフェイスが特徴のプレイヤー。フォルダを再生、という感覚。他のアプリとの連携も柔軟でギャップレス再生可能、使い勝手も良かったのだけれども、ちょと重すぎて遺憾ながら戦力外通知。
- WindowsMediaPlayer
- デフォルトの設定では正直使い物にならない。コイツと付き合うなら、ID3タグにアルバム情報とかが含まれてると勝手にファイルをリネームしてくれる超絶ステキングな機能をまず無効にすることから。死ねばいいのに。決して軽くはないがiTunesに比べればぜんぜんマシ。Ver.12はかなり軽量化されたらしい。
- iTunes/QuickTime
- QuickTimeが必要だわ常駐するわ重くて使い物にならないわAAC普及のためMP3の品質をわざと落としてるわ、ゴミソフトの代名詞とオレ様は認定しているのだが世界的には非常に普及しているらしい。ネトラジもといポッドキャスティングに対応してる。というか、iTunesのおかげでポッドキャスティングやネトラジが一般的になったといえる。メディア管理はそれなりに評価できるしID3タグ編集機能の使い勝手もわりとよい。それでも我慢できないくらい重い。Macではどうなのか知らないが。まあ、FairPlayを浸透させた功績は認めてあげないとだけど。
- そんなわけで、iPodのために入れてるけど常駐はさせてない。
- Songbird
- iTunes互換のサウンドマネージャー。
- SATIS D-218S
- これ売れたのかな。
iPod持ってる人はほぼiTunesに落ち着くんだろうね。オレも楽曲転送&目覚まし替わりにiTunes+iRemocon、主体的に聴くときはLilith。
編集ソフト
本稿の趣旨とは若干異なるが、もののついでなので。
- mp3DirectCut
- 1by1の作者の手によるカット編集ソフト。インターフェイスはとてもわかりやすい。ロスレス編集可能。
- Audacity
- 波形編集できるソフトとしては、フリーではこれが一番高機能ジャマイカ。
- SoundEngine Free
- 編集というかエフェクト。WAVEファイルが対象であるがVBMP3.DLLを組み込めばMP3の読み込みも可能になる。MP3エンコードエンジンがGOGO.DLLのみなのが残念。
余談
マルチメディアファイルの管理って意外と面倒だけど、NTFSのシングルボリュームならMy Musicフォルダあたりにハードリンク作ったらどうかな。ほしたら実体(全部実体扱いなわけだが)をどこに移動しようがリネームしようがへっちゃらじゃんね。まあシングルボリューム運用自体限りなく不可能だけどさ。
注、c:\temp\hoge.txtはhoge.txtがc:\tempに保存されてるわけじゃない。保存場所はあくまでもセクタの位置であり、ファイル名もディレクトリもシェル上で参照するのための目印にすぎない。という理屈がわからないうちは手を出してはいけません。収集つかない事態になるから。
エンコードの際のツール
これまた趣旨違いだが、ここまで触れた以上は取り上げようかと。
- CD2WAV
- 単体ではWAV形式に変換するだけだが、後述する午後のこ~だなどと連携することでMP3にエンコードできる。この手のソフトの基本機能であるCDDBからのアルバム情報取得に対応し、取得データをID3タグに反映も可能。ただID3タグの編集機能の使い勝手はイマイチ。ぶっちゃけオレ的には機能はこれで十分なんだが、起動時のスプラッシュがどうも。
- LAME
- たぶん世界で最も浸透しているMP3エンコーダ。エンコーダレベルでギャップレスに対応してるのはたぶんこれだけのはず(いちおうiTunesもらしい)。音質も非常によいと評判は高いけど、オレ様の耳では午後のこ~だとの違いがわからなかった(VBRなんて使わないし)。2009年時点での最新は3.98.xxだけど安定バージョンは3.97かな?
- 参考:LAME 3.98 stable コマンドラインオプション
- 午後のこ~だ
- LAME3.88をベースにしたMP3エンコーダ、エンジンであるGOGO.DLLが様々なソフトで利用されており、かつては日本のMP3の大半がこれでエンコされていたと思われる。インストールの際わざわざコンパイルしているので環境に最適化されている(はず)。ぶっちゃけオレ的には性能はこれで十分なんだが、起動時のスプラッシュがどうも。
- CDex
- CD2WAV+午後のこ~だは3時88分で時間が止まったままなので最近はこっちを使う。まあVBRでエンコしない限り違いなんてわからんけど(≒CBR320Kbpsでしかエンコしないから違いなんてわからんけど)、FLACとかも手軽に扱えるし、CDDBとID3タグの連携もCD2WAVよりマトモ(あっちはトラック番号が付かねーんだよ)。
- BonkEnc Audio Encoder
- 最近CDexが不調なので使いはじめたエンコーダ、個人的には気に入った。エンコード性能はよいと思うけど処理はやや重め。ルック&フィールが独特なので多少の慣れが必要かも。2009年8月の時点でのMP3エンコードエンジンはLAME Ver.3.98.3。ほか、OGGOgg、FLAC、WAV、MP4/AACなどにも対応している。
- iTunes
- MP3へのエンコでこれを使うのは間抜けだけれども、ストアでダウンロードしたM4Aファイルを変換するのに仕方なく、という感じ。
- CD Manipulator
- CDのリッピング(中身吸出し)ツール。CompactDiscの仕様書は通称レッドブックと呼ばれるが、AVEXを中心にリリースされているコピーコントロールCD(CCCD)は仕様を満たしていないので本当はCDではない(実際CCCDにはレッドブック準拠である証、CompactDiscのロゴはどこにもない)。まともなCDであればCD2WAVでエンコードできるのだが、CCCDは読み取りエラーになってしまう(それが目的だし)。そんなときにCD Manipulatorであれば吸いだせることが多い(まあドライブ自体がどうしようもない場合は諦めろ)。ルック&フィールはほとんどCloneCD。そして
驚きのWindows 7対応
。 - Exact Audio Copy 日本語化
- 通称EAC。ドライブごとにオフセットを調整できるなど、CD-DAの読み出しに関して非常に高精度であると評判のフリーウェア(実は30サンプルズレてました!というのは言わない約束)。アップサンプリングしてDVD-Audioを作る、なんてときにはこれを使うとよいかもしれない。MP3エンコードエンジンはLAMEのほか午後にも対応。
CD Manipulatorなどでリッピングしトラックイメージ(仮想のCD)を作成したら、CD売っ払う前に面倒でも必ず正常に再生できることを確認すること。吸出しに成功したように見えても音飛びが生じていることはけっこうある。なお再生の際にはDaemon Toolsなどの仮想マウントツールを使う。
余談
マスタリングとかするわけじゃあるまいし、自分の普段のリスニング環境で満足できるならそれで十分と思う。そうでなくても音質なんて嗜好性が高いんだから。更なる高みを目指すならこんな場末のサイトなんか参考にならんだろ。そりゃ専用のリスニングルームで100万単位でオーディオに金掛けられるなら話は別だけど、機材に500万とか掛けるなら、10万くらいでDSPあたりでいぢった音で納得しておいて、残りの490万をソフトに突っ込んだほうが健全なんじゃないの。
さらに余談だけど、個人的によいオーディというのは、フラットな音を出せることと思ってる。リアルが何かを知らないでより良くすることなんでできないじゃん(これは、サウンドに限らんね)。しかし残念ながらそんな機材も環境も、判別する耳もない。そんなわけで、俺好みでさえあればいい、という結論に落ち着く。そうでない場合、何が原因なのか、何をいじればいいのかを考えるようにしてる。
吸出し用ドライブ
リッピングの大前提として知っておくこと。CD-DAは仕様上セクタに対するアドレス情報が存在しないので、CD-ROMドライブにおいて読み込みが追従できずエラーが発生した場合、シークコマンドでエラー箇所の特定ができない。これは誤り訂正の精度云々ではなく、CD-DAのリッピングにおける根源的な問題(想定外の動きを要求してるわけだから、CD-DAを上手くリッピングできないドライブが欠陥品ってわけじゃない)。要するにエラーが起こるのはあたりまえ。
で、ドライブ何がよいのかだけど、正直オレ様にもわからん。まあ上記を踏まえると、ディスクがきちんと水平を保ち回転ムラがなく、ピックアップの追従性もよいこと、読み書きのオフセットが0(もしくはきっちり調整できること)、といったあたりが条件になるのだろう()。この手の検証に関して大御所であるCD-R実験室によれば、偶然ゲットできたLITE-ONのLTR-48246Sが非常によいらしくなんかトクした気分。おおむね、最近のマルチドライブよりも格安PCにくっついてきたようなCD-ROMのほうが安定して吸いだせることが多いようだ。
現在主力マシンで使用しているのはLGのコンボドライブGSA-4163B。 「Write samples offset」 が±0のため、普通に音楽CDを焼くだけで位置ずれ、書き漏らしのない音楽CD作成が可能
とのこと。発売当時に存在した各種プロテクトに対しても完璧に対応してるらしい。道理でこれまでリッピングで困ったことがないわけだ(ちょっと嬉しい)。
まあ、オフセットが2~30サンプルズレていたところで多くの人にとっては(あるいは多くのソースにおいては)可聴誤差とはならないと思われるが、厳密さを求めるなら少なくとも読み書きで異なるドライブを使うのはタブー。つまりどこぞで放流されたようなトラックイメージを何の意識もせずに焼いても原盤と同じになるはずもないぞ、と。
脚注
- CDの1/10のファイルサイズ
- CD-DAの音声は1411.2Kbpsで記録されているので、128KbpsでエンコードされたMP3(普及しだした頃はだいたいこれだった)はほぼ1/10のサイズとなる。今となっては意図的にそうでもしない限り、音楽を192Kbps以下でエンコする奴のほうが珍しい。
- まあ192Kbpsもあればどの圧縮形式でも可聴誤差はほぼなくなるので、それ以下のビットレートとする必要があるならMP3以外を選ぶべき。
- ジョイントステレオ
- FM放送で用いられるミッドサイドステレオでは、主信号にモノラル音声M(L+R)、副信号に右(R)と左(L)の音声の差S(L-R)を用意し、実際のステレオ音声として右(R)にM-S=L+R-(L-R)=2Rを、左(L)にM+S=L+R+(L-R)=2Lを用いることでLとRを再現する(最後に2で割りゃいい)。つまり可逆変換である(実際には浮動小数点計算の丸め誤差の分だけ可逆ではないそうなのだけど、人間の耳に検出できる範囲のものではない)。LとRを別々に用意するよりもデータ量を減らすことができるが、左右の音の差が激しい場合にはLとRを独立して記録するノーマルステレオのほうが効率がよい。ジョイントステレオは状態によって両者を自動的に選択する方式。
- そんなわけで、ひとつの曲の中でノーマルステレオとミッドサイドステレオが切り替わることで情報密度に差が生じ、それが忠実度に影響するという考え方であれば理解できる。ただしそれは音質という観点で語るべき話ではないと思う(じゃないと固定量子化VBR以外は全滅する)。
- こうやってジョイントステレオについてちゃんと説明してるページがあまりないので、妙な誤解や思い込みを持つ人がいるのではないか。
- オフセット
- ドライブごとに設定されている、読み書き開始位置。セクタ情報を持っているデータCDでは問題にならないが、オーディオCDではこれが極端にずれているとリッピング漏れ、ライティング漏れの原因になる。EACのようにドライブごとにオフセットを調整できるソフトも存在する。
- 参考:music pc - オフセットの真実