音声圧縮 (audio compression)
音声をデジタル表現したデータの容量を、一定の計算手順(アルゴリズム)に従って削減すること。元のデータを一切改変せず完全に復元できるように圧縮する「可逆圧縮」と、データを改変したり間引いたりして、完全には元のデータに戻らない「非可逆圧縮」(不可逆圧縮)の2つの手法があり、後者が主流となっている。
音声は再生時には最終的にアナログの音波となって人間の耳に届くため、プログラムなどと違って1ビットでも変化するとまったく違って聞こえるということはない。このため、人間の耳の特性を利用して音質の劣化を感じにくいように元のデータの一部を改変したり間引いたりすることにより、劇的に圧縮率を高める非可逆圧縮の技術が幅広く研究されてきた。現在広く使われている音声圧縮のアルゴリズムやファイル形式などはほとんどが非可逆圧縮方式を採用している。
代表的な非可逆圧縮の音声形式にはMP3、WMA(Windows Media Audio)、AAC(Advanced Audio Coding)、Ogg Vorbis、ATRAC3などの種類がある。これらは多くの場合、圧縮の際のサンプリング周波数やビットレートなどを指定することができ、音質の劣化を許容するほど高い圧縮率を得られる。形式にもよるが、概ね元データの1/10程度までの圧縮率ならばほとんど音質の劣化を感じないと言われる。
近年では、記録メディアの容量単価が劇的に低下したことを受けて、通常のファイル圧縮などと同じで原理的にまったく音質が劣化しない可逆圧縮のアルゴリズムやファイル形式も一般的に使われるようになりつつある。可逆圧縮の音声形式にはWMA Lossless、FLAC(Free Lossless Audio Codec)、Monkey’s Audio、Perfect Clarity Audio、Apple Losslessなどがある。圧縮率は音声の内容に大きく影響を受けるため一概には言えないが、音楽CDなどを音源とする場合、概ね半分から1/3程度に圧縮できることが多いようである。