很多聽音樂的朋友對於所聽的音樂檔案是什麼樣的格式 (例如:mp3、wav、wmv....) 並不十分深入研究,尤其針對音頻編碼是什麼?也許半知未解,正好最近在網路上看了些關於音頻編碼的介紹覺得十分的受教,因此便post上來和大家分享。我的經驗告訴我對於音質的好壞會影響我對音樂的感動與否,而好的音樂雖然大快人心,但若音質沒搞好聽起來如同破銅爛鐵般的話,對音樂的感動可能大大減半了,畢竟原本那個音樂的製作人想傳達的原始本意,並不是經過大量失真的效果,接下來要提出的這些是希望大家對音質本身能夠更瞭解一些,而能選擇更接近適合漬己耳朵的音頻格式,來寧聽所喜歡的音樂,並享受它。

wma.jpg  


以下為所收集的資料,希望能增加大家對音頻編碼的認識:

 

一、關於音頻編碼

自然界中的聲音非常複雜,波形極其複雜,通常我們採用的是脈衝代碼調製編碼,即 PCM 編碼。PCM 通過抽樣、量化、編碼三個步驟將連續變化的模擬訊號轉換為數字編碼。

 

1、什麼是采樣率和采樣大小(位/bit)?

聲音其實是一種能量波,因此也有頻率和振幅的特徵,頻率對應於時間軸線,振幅對應於電平軸線。波是無限光滑的,絃線可以看成由無數點組成,由於存儲空間是相對有限的,數字編碼過程中,必須對絃線的點進行采樣。采樣的過程就是抽取某點的頻率值,很顯然,在一秒中內抽取的點越多,獲取得頻率資訊更豐富,為了復原波形,一次振動中,必須有 2 個點的采樣,人耳能夠感覺到的最高頻率為 20 kHz,因此要滿足人耳的聽覺要求,則需要至少每秒進行 40 k 次采樣,用 40 kHz 表達,這個40 kHz 就是采樣率。我們常見的 CD,采樣率為 44.1 kHz。光有頻率資訊是不夠的,我們還必須獲得該頻率的能量值並量化,用於表示訊號強度。量化電平數為 2 的整數次冪,我們常見的 CD 16 bit 的采樣大小,即 2 16 次方。采樣大小相對采樣率更難理解,因為要顯得抽像點,舉個簡單例子:假設對一個波進行 8 次采樣,采樣點分別對應的能量值分別為 A1-A8,但我們只使用 2 bit 的采樣大小,結果我們只能保留 A1-A8 4 個點的值而捨棄另外4個。如果我們進行 3 bit 的采樣大小,則剛好記錄下 8個點的所有資訊。采樣率和采樣大小的值越大,記錄的波形更接近原始訊號。

 

2、有損和無損

根據采樣率和采樣大小可以得知,相對自然界的訊號,音頻編碼最多只能做到無限接近,至少目前的技術只能這樣了,相對自然界的訊號,任何數字音頻編碼方案都是有損的,因為無法完全還原。在計算機應用中,能夠達到最高保真水平的就是 PCM 編碼,被廣泛用於素材保存及音樂欣賞,CDDVD 以及我們常見的 WAV 檔案中均有應用。因此,PCM 約定俗成了無損編碼,因為 PCM 代表了數字音頻中最佳的保真水準,並不意味著 PCM 就能夠確保訊號絕對保真,PCM 也只能做到最大程度的無限接近。我們而習慣性的把MP3列入有損音頻編碼範疇,是相對 PCM 編碼的。強調編碼的相對性的有損和無損,是為了告訴大家,要做到真正的無損是困難的,就像用數字去表達圓周率,不管精度多高,也只是無限接近,而不是真正等於圓周率的值。

 

3、為什麼要使用音頻壓縮技術

要算一個 PCM 音頻流的碼率是一件很輕鬆的事情,采樣率值×采樣大小值×聲道數 bps。一個采樣率為 44.1 KHz,采樣大小為 16 bit,雙聲道的 PCM 編碼的 WAV 檔案,它的數據速率則為 44.1 K×16×2 =1411.2 Kbps。我們常說 128 K MP3,對應的 WAV 的參數,就是這個 1411.2 Kbps,這個參數也被稱為數據頻寬,它和 ADSL 中的頻寬是一個概念。將碼率除以 8,就可以得到這個WAV 的數據速率,即 176.4 KB/s。這表示存儲一秒鐘采樣率為 44.1 KHz,采樣大小為 16 bit,雙聲道的 PCM 編碼的音頻訊號,需要 176.4 KB 的空間,1 分鐘則約為 10.34 M,這對大部分用戶是不可接受的,尤其是喜歡在電腦上聽音樂的朋友,要降低磁片佔用,只有 2 種方法,降低采樣指標或者壓縮。降低指標是不可取的,因此專家們研發了各種壓縮方案。由於用途和針對的目標市場不一樣,各種音頻壓縮編碼所達到的音質和壓縮比都不一樣,在後面的文章中我們都會一一提到。有一點是可以肯定的,他們都壓縮過。

 

4、頻率與采樣率的關係

採樣率表示了每秒對原始訊號采樣的次數,我們常見到的音頻檔案采樣率多為 44.1 KHz,這意味著什麼呢?假設我們有 2 段正弦波訊號,分別為 20 Hz 20 KHz,長度均為一秒鐘,以對應我們能聽到的最低頻和最高頻,分別對這兩段訊號進行 40 KHz 的采樣,我們可以得到一個什麼樣的結果呢?結果是:20 Hz 的訊號每次振動被采樣了 40 K/20=2000 次,而 20 K 的訊號每次振動只有 2 次采樣。顯然,在相同的采樣率下,記錄低頻的資訊遠比高頻的詳細。這也是為什麼有些音響發燒友指責 CD 有數位聲不夠真實的原因,CD 44.1 KHz 采樣也無法保證高頻訊號被較好記錄。要較好的記錄高頻訊號,看來需要更高的采樣率,於是有些朋友在捕捉 CD 音軌的時候使用48KHz的采樣率,這是不可取的!這其實對音質沒有任何好處,對抓軌軟體來說,保持和 CD 提供的 44.1 KHz 一樣的采樣率才是最佳音質的保證之一,而不是去提高它。較高的采樣率只有相對模擬訊號的時候才有用,如果被采樣的訊號是數字的,請不要去嘗試提高采樣率。

 

 5、流特徵

隨著網路的發展,人們對在線收聽音樂提出了要求,因此也要求音頻檔案能夠一邊讀一邊播放,而不需要把這個檔案全部讀出後然後回放,這樣就可以做到不用下載就可以實現收聽了。也可以做到一邊編碼一邊播放,正是這種特徵,可以實現在線的直播,架設自己的數字廣播電台成為了現實。

 

二、各種主流音頻編碼(或格式)的介紹

 1PCM 編碼

PCM
脈衝編碼調製是 Pulse Code Modulation 的縮寫。前面的文字我們提到了 PCM 大致的工作流程,我們不需要關心 PCM 最終編碼採用的是什麼計算方式,我們只需要知道 PCM 編碼的音頻流的優點和缺點就可以了。PCM 編碼的最大的優點就是音質好,最大的缺點就是體積大。我們常見的 Audio CD 就採用了 PCM 編碼,一張光碟的容量只能容納 72 分鐘的音樂資訊

 

2WAVE

  這是一種古老的音頻檔案格式,由微軟開發。WAV 是一種檔案格式,符合 PIFF Resource Interchange File Format 規範。所有的WAV 都有一個檔案頭,這個檔案頭音頻流的編碼參數。WAV 對音頻流的編碼沒有硬性規定,除了 PCM 之外,還有幾乎所有支援 ACM 規範的編碼都可以為 WAV 的音頻流進行編碼。很多朋友沒有這個概念,我們拿 AVI 做個示範,因為 AVI WAV 在檔案結構上是非常相似的,不過 AVI 多了一個視訊流而已。我們接觸到的 AVI 有很多種,因此我們經常需要安裝一些 Decode 才能觀看一些 AVI,我們接觸到比較多的 DivX 就是一種視訊編碼,AVI 可以採用 DivX 編碼來壓縮視訊流,當然也可以使用其他的編碼壓縮。同樣,WAV 也可以使用多種音頻編碼來壓縮其音頻流,不過我們常見的都是音頻流被 PCM 編碼處理的 WAV,但這不表示 WAV 只能使用 PCM 編碼,MP3 編碼同樣也可以運用在 WAV 中,和 AVI 一樣,只要安裝好了相應的 Decode,就可以欣賞這些 WAV 了。

   
Windows 平台下,基於 PCM 編碼的 WAV 是被支援得最好的音頻格式,所有音頻軟體都能完美支援,由於本身可以達到較高的音質的要求,因此,WAV 也是音樂編輯創作的首選格式,適合保存音樂素材。因此,基於 PCM 編碼的 WAV 被作為了一種中介的格式,常常使用在其他編碼的相互轉換之中,例如 MP3 轉換成 WMA

 

3OGG編碼

    網路上出現了一種叫 Ogg Vorbis 的音頻編碼,號稱 MP3 殺手!Ogg Vorbis 究竟什麼來頭呢?OGG 是一個龐大的多媒體開發計劃的項目名稱,將涉及視訊音頻等方面的編碼開發。整個 OGG 項目計劃的目的就是向任何人提供完全免費多媒體編碼方案!OGG的信念就是:OPENFREEVorbis 這個詞彙是特裡·普拉特柴特的幻想小說《Small Gods》中的一個"花花公子"人物名。這個詞彙成為了 OGG 項目中音頻編碼的正式命名。目前 Vorbis 已經開發成功,並且開發出了編碼器。

    Ogg Vorbis
是高質量的音頻編碼方案,官方數據顯示:Ogg Vorbis 可以在相對較低的數據速率下實現比 MP3 更好的音質!Ogg Vorbis 這種編碼也遠比 90 年代開發成功的 MP3 先進,她可以支援多聲道,這意味著什麼?這意味著 Ogg Vorbis SACDDTSCDDVD AUDIO 抓軌軟體(目前這種軟體還沒有)的支援下,可以對所有的聲道進行編碼,而不是 MP3 只能編碼 2 個聲道。多聲道音樂的興起,給音樂欣賞帶來了革命性的變化,尤其在欣賞交響時,會帶來更多臨場感。這場革命性的變化是 MP3無法適應的。
MP3 一樣,Ogg Vorbis 是一種靈活開放的音頻編碼,能夠在編碼方案已經固定下來後還能對音質進行明顯的調節和新算法的改良。因此,它的聲音質量將會越來越好,和 MP3 相似,Ogg Vorbis 更像一個音頻編碼框架,可以不斷導入新技術逐步完善。和 MP3 一樣,OGG 也支援 VBR

 

4MPC 編碼

    MPC
是又是另外一個令人刮目相看的實力派選手,它的普及過程非常低調,也沒有什麼複雜的背景故事,她的出現目的就只有一個,更小的體積更好的音質!MPC 以前被稱作 MP+,很顯然,可以看出她針對的競爭對手是誰。但是,只要用過這種編碼的人都會有個深刻的印像,就是她出眾的音質。

 

5mp3PRO 編碼


2001614,美國湯姆森多媒體公司(Thomson Multimedia SA)
與佛朗赫弗協會(Fraunhofer Institute) 6 14 日發佈了一種新的音樂格式版本,名稱為 mp3PRO,這是一種基於 mp3 編碼技術的改良方案,從官方公佈的特徵看來確實相當吸引人。從各方面的資料顯示,mp3PRO 並不是一種全新的格式,完全是基於傳統 mp3 編碼技術的一種改良,本身最大的技術亮點就在於 SBRSpectral Band Replication 頻段複製),這是一種新的音頻編碼增強算法。它提供了改善低位率情況下音頻和語音編碼的性能的可能。這種方法可在指定的位率下增加音頻的頻寬或改善編碼效率。SBR 最大的優勢就是在低數據速率下實現非常高效的編碼,與傳統的編碼技術不同的是,SBR 更像是一種後處理技術,因此解碼器的算法的優劣直接影響到音質的好壞。高頻實際上是由解碼器(播放器)產生的,SBR 編碼的數據更像是一種產生高頻的命令集,或者稱為指導性的訊號源,這有點  idi 的工作方式。我們可以看到,mp3PRO 其實是一種 mp3 訊號流和 SBR 訊號流的混合數據流編碼。有關資料顯示,SBR 技術可以改善低數據流量下的高頻音質,改善程度約為 30%,我們不管這個 30% 是如何得來的,但可以事先預知這種改善可以讓 64 kbps mp3 達到 128 kbps mp3 的音質水平(註:在相同的編碼條件下,數據速率的提升和音質的提升不是成正比的,至少人耳聽覺上是這樣的),這和官方聲稱的 64 kbps mp3PRO 可以媲美 128 kbps mp3 的宣傳基本是吻合的。

 

6WMA

WMA
就是 Windows Media Audio 編碼後的檔案格式,由微軟開發,WMA 針對的不是單機市場,是網路!競爭對手就是網路媒體市場中著名的 Real Networks。微軟聲稱,在只有 64 kbps 的碼率情況下,WMA 可以達到接近 CD 的音質。和以往的編碼不同,WMA 支援防複製功能,她支援通過 Windows Media Rights Manager 加入保護,可以限制播放時間和播放次數甚至於播放的機器等等。WMA 支援流技術,即一邊讀一邊播放,因此 WMA 可以很輕鬆的實現在線廣播,由於是微軟的傑作,因此,微軟在Windows 中加入了對 WMA 的支援,WMA 有著優秀的技術特徵,在微軟的大力推廣下,這種格式被越來越多的人所接受。

 

7RA

RA
就是 RealAudio 格式,這是各位網蟲接觸得非常多的一種格式,大部分音樂網站的在線試聽都是採用了 RealAudio,這種格式完全針對的就是網路上的媒體市場,支援非常豐富的功能。最大的閃爍點就是這種格式可以根據聽眾的頻寬來控制自己的碼率,在保證流暢的前提下盡可能提高音質。RA 可以支援多種音頻編碼,包括 ATRAC3。和 WMA 一樣,RA 不但都支援邊讀邊放,也同樣支援使用特殊協議來隱匿檔案的真實網路地址,從而實現只在線播放而不提供下載的欣賞方式。這對唱片公司和唱片銷售公司很重要,在各方的大力推廣下,RA WMA 是目前互聯網上,用於在線試聽最多的音頻媒體格式。

 

 8APE

APE
Monkey's Audio 提供的一種無損壓縮格式。Monkey's Audio 提供了 Winamp 的插件支援,因此這就意味著壓縮後的檔案不再是單純的壓縮格式,而是和 MP3 一樣可以播放的音頻檔案格式。這種格式的壓縮比遠低於其他格式,但能夠做到真正無損,因此獲得了不少發燒用戶的青睞。在現有不少無損壓縮方案種,APE 是一種有著突出性能的格式,令人滿意的壓縮比以及飛快的壓縮速度,成為了不少朋友私下交流發燒音樂的唯一選擇。

9、FLAC

FLAC 即是 Free Lossless Audio Codec 的縮寫,中文可解為無損音效壓縮編碼。
FLAC
是一套著名的自由音效壓縮編碼,其特點是無損壓縮,不同於其他有損壓縮編碼如 MP3 AAC ,它不會破壞任何原有的音效資訊,所以可以還原音樂光碟音質。

簡而言之, FLAC APE 相仿,也就是說音效以 FLAC 方式壓縮不會遺失任何信息。這種壓縮與 Zip 的方式類似,但是 FLAC 將給你更大的壓縮比率,因為 FLAC 是專門針對音效的特點設計的壓縮,並且你可以使用播放器播放 FLAC 壓縮的檔案,就像通常播放你的 MP3 檔案一樣(現在已經有許多汽車播放器和家用音響設備支援 FLAC ,在 FLAC 的網站上你可以找到這些設備廠家的連結)

flac1.JPG 

 

原作: marcosy
改編:昱荏

Yujen 發表在 痞客邦 留言(1) 人氣()