多媒體產(chǎn)品(Multimedia)是指能夠同時(shí)表現(xiàn)2種以上文字、圖表、影像、聲音與動畫等訊息的產(chǎn)品,不過訊息雖多,但是結(jié)合影像與聲音的影音多媒體,則一直占主流地位,因此能傳達(dá)此類訊息的表現(xiàn)方式,如電視、電影,都被稱為強(qiáng)勢媒體。
過去能播放影音多媒體的設(shè)備,體積都相當(dāng)龐大。拜IT產(chǎn)業(yè)進(jìn)步,IT與CE設(shè)備中,多媒體產(chǎn)品如雨后春筍,種類與數(shù)量愈來愈多,體積也有縮小化趨勢,例如多媒體個(gè)人計(jì)算機(jī)、筆記型計(jì)算機(jī)、手機(jī)、游戲機(jī)、專業(yè)機(jī)(如電子字典、電子書閱讀機(jī))、MP3音樂播放機(jī)、可攜式多媒體播放機(jī)(PMP)、個(gè)人數(shù)字導(dǎo)航設(shè)備(PND)等。
由上述分類可知,IT/CE產(chǎn)品以影音應(yīng)用產(chǎn)品為市場大宗,就算原非多媒體用途(如PC/NB,手機(jī)),也跨足影音領(lǐng)域。很明顯,IT/CE產(chǎn)品從單純的「計(jì)算器」走進(jìn)消費(fèi)性電子產(chǎn)品市場,進(jìn)而創(chuàng)造廣大商機(jī),影像播放與聲音聆聽的多媒體需求,絕對是最重要的殺手級應(yīng)用。
當(dāng)然,影音多媒體并不完全局限于娛樂用途,舉凡商品或服務(wù)展示、簡報(bào)、意見咨詢、科學(xué)研究、教學(xué)訓(xùn)練、雙向互動等各種用途,都可用多媒體實(shí)現(xiàn)。
![](http://www.itfind.com.cn/hard/UploadFiles_9734/200802/20080220163833260.jpg)
圖說:原本以傳輸語音為主的手機(jī),目前卻被賦予豐富的娛樂用途,播放音樂亦是重點(diǎn)應(yīng)用。圖中的Nokia 6233甚至配備雙揚(yáng)聲器,強(qiáng)化聆聽音質(zhì)。
多媒體產(chǎn)品影音失衡 音效功能長期被忽略
影音多媒體設(shè)計(jì)上,長久以來多半是由影像功能掛帥,無論是機(jī)構(gòu)設(shè)計(jì)或是市場宣傳,影像的訴求遠(yuǎn)遠(yuǎn)大于聲音。例如IT設(shè)備中的筆記型計(jì)算機(jī),強(qiáng)調(diào)多媒體用途者,多半以大屏幕與強(qiáng)力顯卡為訴求,音效功能則多輕描淡寫。
反觀CE產(chǎn)品類,也是如此,以多媒體手機(jī)為例,雖手機(jī)以傳送語音起家,但是搖身變成多媒體手機(jī)后,幾乎都以強(qiáng)調(diào)顯示功能為主,甚至將多媒體手機(jī)分為單色、CSTN、STN、TFT、AM OLED等,完全以影像為分類主導(dǎo),對聲音則鮮少著墨,幾乎沒有研究將多媒體手機(jī)音效的進(jìn)步,列為分類重點(diǎn)。
這樣的發(fā)展趨勢,原因之一在于人類的感官中,80%是倚賴視覺,因此在多媒體中,視覺所占的重要性也相對提高。其次根據(jù)人類聽覺特性,也不是所有的聲音都能感受、分辨,許多音效壓縮格式多將一般人耳無法查覺變化的音頻舍棄,減少音訊編碼的數(shù)據(jù)量,就算解壓縮后的音質(zhì)與來源不盡相同,對還原后的音質(zhì)體驗(yàn)感受差異不大,此稱為感知編碼 (Perceptual Coding),因?yàn)橛嵦栐匆呀?jīng)處理略微劣化,多媒體播放出來的聲音自然無法追求質(zhì)量。
再者,電子環(huán)境對于音效的質(zhì)量,也是相對不友善的環(huán)境,充滿噪聲與干擾。傳統(tǒng)的模擬音效環(huán)境,例如音響,無論訊源、前級、后級部分,雖有電子設(shè)備與電源,但是擁有良好的屏避與阻隔,設(shè)計(jì)者較能掌握、排除其對音質(zhì)的干擾。
但音效設(shè)計(jì)場景換到IT/CE設(shè)備,因電路版空間有限,不可能針對單一訊號進(jìn)行太多遮蔽、改善,且受限成本考慮,通常也很難利用較好的電容或電感,來減輕或阻絕交換式電源供應(yīng)器天生的噪聲,加上其它設(shè)備的電磁波干擾,聲音表現(xiàn)自然大打折扣。
在如此發(fā)展趨勢下,影音受重視的程度逐漸失衡,此點(diǎn)由多媒體中數(shù)字影像規(guī)格,由高度破壞性壓縮的Mpeg格式進(jìn)展到Mpeg2,甚至目前的各種HD規(guī)格,畫質(zhì)表現(xiàn)愈來愈清晰、分辨率不斷飆升,追求質(zhì)量的趨勢相當(dāng)明顯。但數(shù)字音效卻反其道發(fā)展,破壞性壓縮的mp3格式甚至AC3等盤據(jù)主流市場,音質(zhì)較佳的無失真壓縮反而成了小小眾。消費(fèi)者長期受到此趨勢影響,對于多媒體中聲音質(zhì)量的要求,多半也以「有聲音」就好的態(tài)度面對。
![](http://www.itfind.com.cn/hard/UploadFiles_9734/200802/20080220163836382.jpg)
圖說:MP3就是音樂播放產(chǎn)品,音樂的播放效果即音質(zhì)優(yōu)劣,便成為評斷MP3的最終條件。不過目前許多廠商卻在外型、功能上大做文章,似乎本末倒置。
影像發(fā)展紅海競爭 強(qiáng)化音質(zhì)成多媒體產(chǎn)品差異化活路
如前述,因影像功能獲得的重視遠(yuǎn)大于聲音,因此多媒體產(chǎn)品在影像部分的競爭相當(dāng)激烈,但由于零組件多半由特定供貨商提供,設(shè)計(jì)人員雖然可在布線、調(diào)整上,做出修正,取得更好的影像質(zhì)量,但是實(shí)質(zhì)差異通常不會太大,最后產(chǎn)品上市后,由于與競爭產(chǎn)品沒什么差異,往往陷入白熱化的價(jià)格戰(zhàn)。這樣的紅海市場,相信是許多廠商的痛,卻又不得不奮力肉搏,不過音效卻可能成為多媒體產(chǎn)品拉開差異化的救贖。
例如宏碁2007年,隨著Santa Rosa平臺,推出的一系列筆記型計(jì)算機(jī),舍棄傳統(tǒng)強(qiáng)調(diào)性能的宣傳模式,而將訴求重點(diǎn)放在提高聲音質(zhì)量,以「有杜比,最動聽」的口號,成功的打動消費(fèi)者,因此在筆電市場創(chuàng)造亮眼銷售佳績。由此例可見,高音質(zhì)的數(shù)字裝置,并不是沒有市場,只是過去沒有選擇,一旦有音質(zhì)較佳的產(chǎn)品出現(xiàn),就能夠迅速拉開產(chǎn)品差異性。
不過要設(shè)計(jì)好的數(shù)字音效裝置,并不是那么容易,設(shè)計(jì)者首先要能掌握數(shù)字音效原理,了解數(shù)字音效原理、編碼模式、音質(zhì)好壞標(biāo)準(zhǔn),接著認(rèn)知目前影響數(shù)字音效質(zhì)量的關(guān)鍵零組件。
![](http://www.itfind.com.cn/hard/UploadFiles_9734/200802/20080220163836804.jpg)
圖說:宏碁筆記型計(jì)算機(jī)在2007成功以較佳的音效,拉出與對手產(chǎn)品的競爭差距,創(chuàng)造銷售佳績,就是以音效為產(chǎn)品創(chuàng)造差異化、提升競爭力的實(shí)例。
音效原理與壓縮格式掌握 設(shè)計(jì)高質(zhì)量音效裝置的第一步
聲音是一個(gè)籠統(tǒng)的名詞,以物理性分析,聲音由4種特性組成:
1、音高:震動頻率(Frequency),指單獨(dú)一個(gè)音在整個(gè)音域中的位置。音根據(jù)音波振動的頻率在音高上有高或低等分別。
2、響度:震動幅度(Amplitude),聲音的強(qiáng)弱稱為「響度」,通常以「分貝」(dB)來表示響度大小。
3、音色:震動波形(Wave Form),又稱音品,聲音在真實(shí)世界由震動產(chǎn)生,而不同的物體振動的原理和情況都不同,震動波形相異,就會形成各種不同的音色,如纖細(xì)、渾厚等。
4、方位:音源(Source)與聽者的相對位置,但人的雙耳除了判斷聲音的方位之外,也可感受聲音的空間感,空間感由聲音的直接音(direct sound)、早期反射(early reflection)、回響(reverberation)等3部分重現(xiàn)。
重現(xiàn)聲音,對于數(shù)字音效來說,卻具有天生上的難度,因?yàn)閿?shù)字音效常常都是壓縮、編碼、重制后的產(chǎn)物,主要原因是為了滿足儲存容量的需求,因此利用音訊編碼(Digital Audio Coding)可實(shí)現(xiàn)聲音數(shù)字化后檔案體積小、復(fù)制不失真、容易保存及保密等優(yōu)點(diǎn)。
音訊編碼其中一種方式是以無失真 (Lossless) 為原則,意指當(dāng)經(jīng)過壓縮過的訊號,再解壓縮之后,可以還原成幾乎與未經(jīng)壓縮的訊號質(zhì)量一致,這種方法對音樂質(zhì)量有較好的保障,然而所付出的代價(jià)是壓縮率偏低,像DVD Audio規(guī)格采用的MLP (Meridian Lossless Packing) 就是無失真壓縮的一例,壓縮率只有50%左右。
目前主流編碼格式則反其道而行,為得到較高的壓縮效率,根據(jù)人類聽覺特性,將一般人耳無法查覺其變化的高低頻數(shù)據(jù)舍棄,減少音訊編碼的數(shù)據(jù)量,與解壓縮后的數(shù)據(jù)不盡相同也無妨,這一種壓縮方式泛稱為感知編碼 (Perceptual Coding) 或是感觀式編碼。
音訊編碼有許多種,針對聲音的編碼有PCM、ADPCM、DM、PWM、WMA、OGG、ACC、MP3Pro以及MP3等等;針對人類語音有LPC、CELP與ACELP等。
![](http://www.itfind.com.cn/hard/UploadFiles_9734/200802/20080220163836195.jpg)
圖說:數(shù)字音效在編碼時(shí)如果采用更高的取樣率、或是數(shù)據(jù)分辨率,還原后的音質(zhì)就越能夠接近原音。
音效評估標(biāo)準(zhǔn)掌握 設(shè)計(jì)高質(zhì)量播放裝置基準(zhǔn)
音樂好不好聽,見仁見智,但是音質(zhì)好不好,卻可以精確評估。一般所謂音質(zhì)好,就是發(fā)聲裝置能夠真實(shí)重現(xiàn)上述4種聲音的物理特性。換句話說,無論以模擬或數(shù)字方式重現(xiàn),都以音頻信號范圍越準(zhǔn)確、失真度與干擾(例如噪訊)越少,聲音越能接近來源越好。
以數(shù)字音效來說,又可分為語音類與音樂類重現(xiàn)。語音類相對較單純,通常以5個(gè)等級評估,一般只要與音頻率達(dá)到7Hz以上,并且使用者不察覺失真,即可評估為優(yōu)良。
但是IT/CE多媒體設(shè)備所播放的數(shù)字音樂,原音重現(xiàn)就相當(dāng)困難,由于數(shù)字音樂本身通常就并非由來源100%轉(zhuǎn)換,因此數(shù)字音樂的取樣率,分辨率,壓縮格式都會影響聲音質(zhì)量甚巨,再者如噪訊比(SNR)、總諧波失真(THD)等因素,也都會影響數(shù)字音樂質(zhì)量。
而且,數(shù)字音樂的質(zhì)量評估,也較語音類困難許多,因?yàn)橐魳分噩F(xiàn)質(zhì)量優(yōu)劣取決于多種因素綜合評量,如聲源(聲壓、頻率、頻譜等)、訊號(失真度、響度、動態(tài)范圍、噪訊比、瞬態(tài)響應(yīng)、聲道分離度等)、音場與方位性(直接音、前期反射聲、混響聲、立體感、基準(zhǔn)振動、吸聲率等)、聽覺特性(可聽范圍、各種聽感)等。
![](http://www.itfind.com.cn/hard/UploadFiles_9734/200802/20080220163837434.jpg)
由于評估的要點(diǎn)眾多,甚至連人聲與音樂評估都必須分開處理,因此評估方式也較為復(fù)雜,分主觀與客觀2種方式處理。主觀方式評估參數(shù)為立體感、定位感、空間感、層次感、厚度感等5大方向,由于主觀方式較無標(biāo)準(zhǔn)可言,因此詳細(xì)評估細(xì)節(jié)在此不多贅述。
客觀評估方式多以儀器或是測試軟件評量,通常會有下列幾種標(biāo)準(zhǔn):
1、總諧波失真(THD)
失真是檢驗(yàn)數(shù)字音樂是否接近原音重現(xiàn)的關(guān)鍵,若失真度太大,則其它評估標(biāo)準(zhǔn)表現(xiàn)再優(yōu)異也沒用。總諧波失真(Total Harmonic Distortion,THD)則是檢查的第一關(guān)。主要是評估數(shù)字音效是否有非線性失真(Nonlinear Distortion)產(chǎn)生。
非線性失真是指輸入信號經(jīng)過處理后,輸出時(shí)所產(chǎn)生的錯(cuò)誤部分,而這個(gè)錯(cuò)誤部分則與原本的輸入信號完全無關(guān),例如不是因破壞性壓縮格式所造成,是在輸入信號以外的頻率產(chǎn)生的其它類錯(cuò)誤信號。這些屬于非線性失真的頻率就稱為諧波(harmonics),諧波產(chǎn)生的位置是原始信號頻率的整倍數(shù)的位置,例如,1KHz的諧波就是2kHz、3kHz、4kHz。
2、互調(diào)失真(IMD)
互調(diào)失真(Intermodulation Distortion)是指2個(gè)頻率間,因?yàn)轭l率混合所產(chǎn)生的和、差、乘積的失真頻率,例如輸入頻率為2KHz與6KHz的訊號后,產(chǎn)生8KHz、4KHz、16KHz的訊號,甚至原始輸入訊號2KHz與失真的8KHz,又可能產(chǎn)生10KHz的訊號,這些失真的訊號亦稱為諧波,以數(shù)字播放裝置來說,這些互調(diào)失真的諧波當(dāng)然越少越好。
3、相位失真(Phase Error)
相位失真則是1種線性失真,系指音源信號在傳輸和放大過程中發(fā)生時(shí)間延遲。因?yàn)殡娮右粲嵲O(shè)備,在其輸出信號與輸入信號之間一般是存在相位差,例如電容和電感對交流信號(電壓或電流)具延遲作用。當(dāng)一個(gè)交流信號經(jīng)過電容、電感和電阻時(shí),或多或少造成延遲現(xiàn)象,這會導(dǎo)致這個(gè)交流信號的幅度變化時(shí)間向后推遲一段時(shí)間,造成聲音訊號不一致,對于需要定位性的聲音,如立體聲,影響更大。
4、頻率響應(yīng)(Frequency Response)
頻率響應(yīng)是對DAC/ADC轉(zhuǎn)換器頻率響應(yīng)能力的評價(jià)標(biāo)準(zhǔn)之1。最佳狀態(tài)是在每1個(gè)頻率都能輸出穩(wěn)定,換句話說,輸出質(zhì)量越好的裝置,頻率響應(yīng)曲線就越平直,反之則不但在高或低頻衰減得很快(因?yàn)楦叩皖l訊號重建困難),在一般頻段,即人耳對聲音的可接收范圍20HZ-20KHZ內(nèi),亦可能呈現(xiàn)抖動的現(xiàn)象,無論是曲線突起(功率增益過大)或下滑(功率衰減)都是音質(zhì)失真的表現(xiàn)。
5、噪訊比(Noise Level)
訊噪比是指最大不失真訊號與噪音之間的比例,噪音分為2種,首先在數(shù)字音效的轉(zhuǎn)換過程中,每個(gè)相關(guān)零件都可能產(chǎn)生噪聲,并成為處理中的數(shù)字音效的一部分,這些訊號與輸入信號無關(guān),但卻會隨著訊號源進(jìn)入下一個(gè)處理單元或是輸出成聲音,換言之,就是設(shè)備自己發(fā)出的噪音。此外,當(dāng)有訊號發(fā)出時(shí)所伴隨的調(diào)變噪訊(Modulation Noise),也是噪音的一種。噪訊比以S/N或SNR(dB)表示。于音效播放裝置來說,比值當(dāng)然越大越好,例如Hi-Fi音響的SNR>70dB,CD機(jī)要求SNR>90dB。在實(shí)際設(shè)計(jì)上,因?yàn)槿硕鷮?~8kHz的噪聲最靈敏,所以這個(gè)范圍的噪聲對于實(shí)際聆聽的影響較大。
6、動態(tài)范圍(Dynamic Range)
動態(tài)范圍表示的是最大不失真信號與噪聲值的比例,此處的噪聲指的是沒有信號輸出時(shí)的噪聲值。如音頻信號無失真最強(qiáng)部分與最微弱部分之間的電平差,這個(gè)比值為越大越好。不過動態(tài)范圍跟響度有關(guān),并不是無限制的,即從最小的響度到最大不失真響度間的范圍,以CD為例,其聲音采樣分辨率為16bit,因此動態(tài)范圍就算毫無瑕疵,也只有65,536種響度變化,不可能超過。
7、立體聲分離度(Stereo Channels Crosstalk)
單聲道基本上不可能創(chuàng)造出立體感的聲音,只有2聲道以上才能辦到,就是所謂的立體聲。所謂聲道分離度,就是指不同聲道間立體聲之間的隔離程度,通常用1個(gè)聲道的信號電平與串入另1聲道的信號電平差來表示,換句話說,就是數(shù)字播放器左(右)聲道的聲音,傳到相對應(yīng)另一聲道的情況。這個(gè)數(shù)值越大越好。一般要求Hi-Fi音響分離度>50dB。。
實(shí)際上,在數(shù)字信號中,要做到100%的左右聲道獨(dú)立是非常簡單的事情,然而實(shí)際能夠聽的聲音,卻是模擬信號,而能發(fā)出模擬信號的設(shè)備,本身就無法達(dá)到這一理想值,就是串音(Crosstalk)了,為一種訊號干擾,模擬在線相鄰訊號間的耦合干擾,會影響到彼此的訊號接收。例如在左聲道的信號,也能在右聲道取得一點(diǎn)點(diǎn)細(xì)微的相同信號,就會造成立體聲無法達(dá)到聽覺上的良好分離狀態(tài)。
此外,還有聲道平衡度,是指2個(gè)聲道的增益、頻響等特性的一致性。否則,將造成聲道或聲相偏移。
![](http://www.itfind.com.cn/hard/UploadFiles_9734/200802/20080220163837726.jpg)
![](http://www.itfind.com.cn/hard/UploadFiles_9734/200802/20080220163838306.jpg)
圖說:透過軟硬件設(shè)備與各種客觀標(biāo)準(zhǔn),音效可以評估優(yōu)劣以及加以調(diào)整。
先天不足可后天加料 音效合成亦是研發(fā)重點(diǎn)
雖原汁原味是許多人追求音質(zhì)表現(xiàn)極致的至高標(biāo)準(zhǔn),但是因上述各種原因,通常無法達(dá)到,所以音樂播放過程中,數(shù)字?jǐn)?shù)據(jù)的呈現(xiàn)結(jié)果最重要是要防止在模擬儲存、和運(yùn)作時(shí)所造成的音質(zhì)損耗。但是如果無法避免錯(cuò)誤時(shí),則也可以利用后天的方式彌補(bǔ)、修正。
例如以均衡器(Equalizer)能將不同頻率范圍的訊號分別濾出,然后再各別放大或縮小處理,最后再合成,藉此補(bǔ)償訊號的頻率衰減,使音質(zhì)回復(fù)至接近原音,或者也能補(bǔ)償輸入的不足,即針對一個(gè)音程里的倍頻點(diǎn),可以去補(bǔ)償與衰減,在聆聽上,馬上可以得到實(shí)時(shí)的修正,使音質(zhì)達(dá)到接近理想狀態(tài)。由于人類的聽覺系統(tǒng)在低頻及高頻的接收上感受度較差,透過均衡器強(qiáng)化或補(bǔ)足聲音的功能,能彌補(bǔ)人們在聽覺上的盲點(diǎn)。
如將頻率為100Hz的組成泛音放大,就會讓聲音中100Hz左右的低頻部分聽起來更震撼一些,若覺得聲音的低頻部分不夠明顯,也可以用均衡器加以補(bǔ)足。像目前MP3播放器幾乎都有Equalizer的功能,使用者可選定或自定不同的播放音場(抒情、爵士、搖滾、流行音樂等),充份表現(xiàn)出音樂的個(gè)性化。
![](http://www.itfind.com.cn/hard/UploadFiles_9734/200802/20080220163838365.jpg)
圖說:均衡器目前已經(jīng)以數(shù)字方式,內(nèi)建在大部分的播放裝置中,彌補(bǔ)聲音表現(xiàn)的不足或展現(xiàn)個(gè)性化音樂風(fēng)格。
IT/CE類的音效播放設(shè)備提升音質(zhì)的方式很多,不過從關(guān)鍵零組件下手,通常能展現(xiàn)立竿見影的效果,對于開發(fā)上的難度來說,也相對較低,當(dāng)然聲音表現(xiàn)在「一分錢,一分貨」的情況下雖然提高了,但是也讓開發(fā)案的成本,可能因此居高不下,但參考前篇的例證,提高音質(zhì)能夠拉開與競爭產(chǎn)品的差距,應(yīng)值得開發(fā)者投資。
音質(zhì)提高的關(guān)鍵零組件在于DSP、Codec、DAC、與放大IC,一個(gè)個(gè)都成為今日數(shù)字音樂播放裝置音質(zhì)展現(xiàn)的瓶頸,以下將分別探討。除零組件外,實(shí)際電路設(shè)計(jì)、EMI與差動信號,連電源供應(yīng)都會影響音質(zhì),如果采用高質(zhì)量零組件,卻敗在這幾個(gè)可能被研發(fā)人員忽略的細(xì)節(jié),相信也會令開發(fā)者遺憾。
數(shù)字音效音訊處理關(guān)鍵 DSP勝過純軟件譯碼模式
數(shù)字音效如前所述,幾乎都是壓縮格式,處理第一步,就是將壓縮格式經(jīng)譯碼還原,在PC類的音效裝置上,這個(gè)步驟由于有強(qiáng)力CPU代勞,所以幾乎可以將此必經(jīng)過程忽略不計(jì),但是其它CE等級的音效播放裝置,特別是最熱門的手持類裝置,由于功耗與散熱限制較多,無法使用效能較高的CPU,故譯碼就成為音質(zhì)提升的第一個(gè)關(guān)鍵。
許多兼具影音功能的多媒體裝置,多半采用多媒體處理器進(jìn)行譯碼,此種處理器包括TI的OMAP、Freesale的i.MX系列、ST的Nomadik、Renesas的SH-Mobile、NXP的Nexperia、ADI的Blackfin,以及Marvell的Xscale等。
不過采用處理器譯碼的方式,基本上可歸類為沒有硬件加速的純軟件譯碼,譯碼效率并不高,許多研發(fā)人員認(rèn)為這部分對于音質(zhì)沒有影響,實(shí)際上的譯碼速度、精確度以及噪訊比等性能,通常較硬件譯碼表現(xiàn)略微遜色,因此終端輸出音質(zhì)也不用抱太多期待。此外,由于軟件譯碼,也不容易加入音效的后制處理,因此無法表現(xiàn)出音場,或者是不同音樂頻譜的動態(tài)調(diào)整等進(jìn)階音樂表現(xiàn)能力。
因此,提升音質(zhì)的第一步,音訊譯碼應(yīng)該用硬件處理為佳,在設(shè)計(jì)中加入采用純?yōu)橐粜ёg碼設(shè)計(jì)的DSP,讓譯碼精確度以及噪訊比等關(guān)鍵性能都有所提升,音質(zhì)自然會更好。甚至有的DSP還通過高音質(zhì)認(rèn)證,如德州儀器(Texas Instruments,TI)推出的DA7xx系列,可同時(shí)執(zhí)行DTS-HD Master Audio串流解碼、8聲道192kHz原聲音訊及所有后段處理。
![](http://www.itfind.com.cn/hard/UploadFiles_9734/200802/20080220163918219.jpg)
圖說:專業(yè)DSP需要為其開發(fā)最佳化軟件,音效DSP亦然,其算法考驗(yàn)設(shè)計(jì)者功力。
Codec位居音效裝置數(shù)字模擬轉(zhuǎn)換要津 亦是音質(zhì)掌握關(guān)鍵
音效裝置輸入或輸出的是模擬訊號,人耳才能聽到,但是中間所處理的全是數(shù)字訊號,兩者間的轉(zhuǎn)換,也是影響音質(zhì)的重點(diǎn),把數(shù)字音效數(shù)據(jù)轉(zhuǎn)換為可輸出的模擬訊號階段,因成本與布線等因素考慮,大多由音效Codec芯片所負(fù)責(zé)。
大部分的Codec芯片,同時(shí)具有D/A(數(shù)字訊號轉(zhuǎn)換成模擬訊號)和A/D(模擬訊號轉(zhuǎn)換成數(shù)字訊號)轉(zhuǎn)換功能。音效輸出時(shí)利用的是D/A轉(zhuǎn)換功能。以接收到來源數(shù)字訊號相同情況下,D/A性能好壞直接決定音效裝置的輸出音質(zhì),所以包著D/A的Codec芯片,其處理能力和訊噪比,對最終的聲音輸出質(zhì)量有很大的影響。
Codec的性能好壞,可由性能規(guī)格進(jìn)行分析,例如支持可處理的數(shù)據(jù)位、取樣頻率、噪訊比、動態(tài)范圍與各項(xiàng)失真值等,有些codec已支持HD格式,在數(shù)據(jù)呈現(xiàn)上比較漂亮,但真實(shí)音質(zhì)未必比較好。決定Codec音質(zhì)關(guān)鍵簡述如下:
1、DAC訊噪比:DAC是Codec中真正負(fù)責(zé)轉(zhuǎn)換工作的單元,其訊噪比高低,將直接關(guān)系到最終音效聲波輸出的訊噪比,因此其性能為Codec的核心參數(shù)。大部分Codec芯片此項(xiàng)數(shù)值約在95db,但實(shí)際上,最后是否是能夠達(dá)到供貨商標(biāo)示的數(shù)值,還是會受到很多其它因素影響。
2、Mixer訊噪比:Codec中有Mixer,也就是混音器,負(fù)責(zé)對聲音的迭加與混合處理,即可將2個(gè)或多個(gè)輸入音效流結(jié)合為1個(gè)輸出流,并可選擇各個(gè)輸入流的增益,所以Mixer噪訊比也是Codec影響音質(zhì)的因素,一般此項(xiàng)性能參數(shù)與DAC噪訊比約略相同或相近,差距在-1db左右。
3、DAC通道數(shù)目:許多音效裝置已開始支持多聲道,Codec芯片支持多信道能力,也是靠多信道DAC,其性能也會影響多聲道時(shí)音質(zhì)的表現(xiàn)。目前較新的Codec芯片大多已可以支持8通道的DAC轉(zhuǎn)換。
4、PCM格式轉(zhuǎn)換時(shí)所支持的最高取樣分辨率、和取樣頻率:以音質(zhì)的角度分析,取樣分辨率越高,對聲音數(shù)據(jù)的處理能力就越強(qiáng);取樣頻率值越大聲音訊號的分辨率就越高,聲音轉(zhuǎn)換中的失真就越小。Codec芯片一般可以最高支持192KHz取樣頻率以及24Bit立體聲A/D轉(zhuǎn)換和24Bit立體聲D/A轉(zhuǎn)換。
5、A/D和D/A的頻率響應(yīng)范圍:頻響范圍也是音質(zhì)中重要的指標(biāo),不過由于人耳的限制,只能聽到20Hz~20KHz的頻響范圍,因此超過此頻率的聲音就算處理得再好,使用者也聽不到,因此目前絕大多數(shù)的DAC頻響范圍,都在20Hz~20KHz之內(nèi)。
![](http://www.itfind.com.cn/hard/UploadFiles_9734/200802/20080220163920227.jpg)
嫌包山包海Codec音質(zhì)不好 采用直接DAC音質(zhì)更上層樓
如前所述,DAC目前大多已經(jīng)包在Codec內(nèi),不過以音質(zhì)的角度觀察,Codec號稱樣樣通,可能就表示每樣表現(xiàn)都很平庸,例如在音頻信號處理上,Codec的精準(zhǔn)度就不如獨(dú)立的DAC。
再者,Codec的Jitter控制力也不如獨(dú)立的DAC,Jitter指時(shí)基誤差,會造成音質(zhì)劣化,成因并非震動幅度等數(shù)據(jù)本身的錯(cuò)誤,而是時(shí)間部分出錯(cuò)了,造成聲音的波形扭曲,很明顯的,這對音質(zhì)高規(guī)格要求來說,絕對是一大殺手。
除了處理能力比較差外,目前主流多通道Codec在設(shè)計(jì)上很難避免多通道間的干擾,音質(zhì)表現(xiàn)會比2聲道Codec差一些,因此講求多聲道支持,又兼顧音質(zhì)的設(shè)計(jì),會改用多顆雙通道DAC的方式解決需求。
雖然采用DAC的方式比Codec成本高,但是音質(zhì)比較好,目前講求音質(zhì)的裝置,越來越多采用專業(yè)DAC,如iPod、iRiver、Zune等。
專業(yè)的高音質(zhì)DAC廠商不多,較著名的有歐勝微電子(Wolfson)、德州儀器、恩智浦半導(dǎo)體(NXP Semiconductors)、Cirrus Logic等。
DAC音質(zhì)判斷的標(biāo)準(zhǔn)與要點(diǎn),與前述的Codec差別不大,不過以規(guī)格來說,DAC的效能都略勝一籌,因此通常判斷的標(biāo)準(zhǔn)會更為嚴(yán)格,除了原本就被考慮的分辨率、取樣率,噪訊比、總諧波失真這幾項(xiàng)因素外,通常還會把有效位數(shù)(Estimated Number Of Bits,ENOB)、噪訊加失真比(SIgnal-to-Noise And Distortion,SINAD)、無雜散動態(tài)范疇(Spurious Free Dynamic Range,SFDR)、
差分性失真(Differential Non-Linearity,DNL)、積分性失真(Integral Non-Linearity,INL)等參數(shù)列入評比。
DAC的硬件規(guī)格通常也比較好。以Wolfson的WM8978為例,噪訊比達(dá)98db,具有改良的HI-FI級數(shù)位信號處理核心,支持增強(qiáng)型3D硬件環(huán)繞音效,以及5頻段的硬件均衡器,以改善音質(zhì);并有一個(gè)可程序化的陷波濾波器,用以去除音效裝置因?yàn)轱@示屏幕開關(guān)或切換時(shí)產(chǎn)生的干擾噪音。
除了DAC,許多播放音效的裝置,如果擁有錄音功能,那ADC的質(zhì)量也相當(dāng)重要,判斷標(biāo)準(zhǔn)與DAC相同。
![](http://www.itfind.com.cn/hard/UploadFiles_9734/200802/20080220163920763.jpg)
放大IC攸關(guān)音質(zhì)與功耗 D類放大成首選
前述探討的幾個(gè)零件,都在于訊號轉(zhuǎn)換的部分,不過當(dāng)數(shù)字音訊數(shù)據(jù)處理完畢,成為模擬的聲音訊號后,必須加以放大輸出,因此放大IC也是攸關(guān)音質(zhì)高低的重要環(huán)節(jié)。
不過放大技術(shù)與音質(zhì)的關(guān)連性,卻不能完全以音質(zhì)的角度出發(fā),以傳統(tǒng)的Class A/AB放大技術(shù)來看,A類放大的音質(zhì)最好,其原理是純粹的以模擬訊號進(jìn)行線性放大,音質(zhì)沒有失真。
不過,A類放大雖具有最佳的信號傳真性,但卻相當(dāng)耗電,一般來說,電能利用率只有20%~30%,例如供應(yīng)100W電力給A類放大裝置,最后真正輸出到喇叭發(fā)聲功率的只有25W左右,其余的75W通通損耗掉,除了電力效率不佳,高耗能也代表會產(chǎn)生高廢熱,常需要在放大晶體管上配裝大型的散熱片輔助散熱。對手持式裝置來說,高功耗與高熱都是設(shè)計(jì)上的原罪,開發(fā)者避之唯恐不及。
另一種B類放大設(shè)計(jì),雖省電性較佳,但信號失真影響音質(zhì)甚巨,因此衍生兼具兩者優(yōu)點(diǎn)的AB類放大,在音質(zhì)與省電性取得較能接受的均衡點(diǎn),過去成為消費(fèi)性音響領(lǐng)域最受歡迎的放大方式。
但目前在數(shù)字播放裝置,越來越講求整體電路配置空間縮小、并且降低功耗讓產(chǎn)品更省電,以維持電池續(xù)航力等種種發(fā)展趨勢下,于1958年就提出的D類放大(Class D Audio Power Amplifier),目前成為當(dāng)紅炸子雞。
D類放大利用的原理為PWM(Pulse Width Modulation),作用方式類似于主機(jī)板上交換式電源概念,即利用數(shù)字頻率波型的疏密來輸出模擬振幅的高低大小,頻率密則振幅高,反之頻率疏時(shí)則振幅降低。也因此運(yùn)作模式,D類放大亦被稱為為數(shù)字式功率放大或數(shù)字功放。
D類放大省略了傳統(tǒng)AB類晶體放大,在作成大功率機(jī)型時(shí)所需的大型變壓器、超大濾波電容,可改以小電容與類似交換式電源供應(yīng)模式(Switching Power)的小型變壓器取代,使得電能可以快速直接地驅(qū)動喇叭單體。此運(yùn)作模式提供了極高的電能利用率,純理論上是100%運(yùn)用,實(shí)務(wù)上電能利用率也經(jīng)常在80%、90%水平。
由上述驅(qū)動模式即可發(fā)現(xiàn),D類放大電路當(dāng)然在工作時(shí)不易產(chǎn)生高熱,所以可以免掉占空間的散熱片,此外,由于采用PWM模式,D類放大電路所需的體積,會比傳統(tǒng)的功率放大電路小了許多,成本也較低,加上低耗熱優(yōu)點(diǎn),D類放大電路非常適合塞在小小空間里。
不過以音質(zhì)的角度檢視,D類放大的缺點(diǎn)是以調(diào)變程序所形成的放大,其結(jié)果必然與原始信號有些出入,但在一般消費(fèi)性產(chǎn)品的音樂播放上,其質(zhì)量可被接受,甚至在目前的技術(shù)下,D類放大的音質(zhì)越來越好,特別是在低瓦數(shù)的狀況下。
例如,以采用D類放大器IRS2092S D的IRAUDAMP5設(shè)計(jì)方案,與同等級AB類放大輸入比較,在1kHZ、接4Ω負(fù)載時(shí),80W以下區(qū)域,D類放大的THD+N實(shí)際上是低于AB類放大器,而在60W附近,D類放大的THD+N更是進(jìn)步到了0.005%的水平。
只有在80W到140W區(qū)域,AB類放大的性能才稍高過D類放大,不過即使到了120W,D類放大的THD仍不超過1%。對于大部分?jǐn)?shù)字音效裝置來說,很少用到高功率,低功率的情況比較常見,此時(shí)D類放大的反而占有音質(zhì)優(yōu)勢。
D類放大的優(yōu)劣評估,在于供電抑制率(Power Supply Rejection Rate;PSRR)以dB為單位,PSRR必須盡可能高。對于音質(zhì)方面,則為總諧波失真加噪訊比(TDH+N)要求,此點(diǎn)以百分比(%)為單位,,THD+N則是盡量低,一般不超過10%,高標(biāo)要求上還要低于0.1%、0.01%。不過THD+N建議與負(fù)載阻抗Rl、輸出功率(Output Power)、PWM的調(diào)變頻率(f)等做比較,才能準(zhǔn)確判斷。
此外,D類放大有獨(dú)特的電子特性,因此在音質(zhì)評估時(shí),必須注意EMI電磁干擾問題。因D類放大IC會持續(xù)、頻繁地進(jìn)行晶體管的導(dǎo)通、關(guān)閉作業(yè),所以很容易產(chǎn)生電磁干擾,對于音質(zhì)當(dāng)然有不利影響。因此越能降低降低電磁干擾的發(fā)散度的產(chǎn)品當(dāng)然越好,不過此點(diǎn)在空間與成本許可的情況下,可用金屬外覆來屏蔽。
此外,許多D類放大IC在省電性、控制性、體積縮小、彈性、保護(hù)能力上都有所著墨,形成各家的特色,大部分與音質(zhì)沒有太大關(guān)系,不過有些設(shè)計(jì)如果太過頭,對于音質(zhì)就會有影響。
例如一些D類放大IC減少后段的LC低通濾波電路質(zhì)量,如使用更小的電容,或根本省去電容(Cap-Free),甚至有些設(shè)計(jì)連外接電感都一并省去(LC-Free、Filter-Free),直接將揚(yáng)聲器的音圈之漏電感來充當(dāng)LC用,當(dāng)然,此種D類放大IC能夠達(dá)到相當(dāng)小的體積,因其輸出接腳可與喇叭、耳機(jī)直接相連。
雖此種設(shè)計(jì)方式可將體積縮至極小,但高頻部分未經(jīng)過濾就直接輸出,喇叭不易將20kHz以上的頻率發(fā)聲,即便發(fā)出人耳也聽不到20kHz以上的頻率,但如果省過頭,也可能對可聽范圍內(nèi)的音質(zhì)產(chǎn)生負(fù)面影響。D類放大IC的提供商有ADI、Cirrus Logic、MAXIM、Motorola、NS、Philips、Sanyo、ST、TI、TriPath等。
![](http://www.itfind.com.cn/hard/UploadFiles_9734/200802/20080220163921899.jpg)
圖說:D類放大原理與AB類放大比較。
零件優(yōu)秀一時(shí)之選 整合電路也需配合才能發(fā)揮最高音質(zhì)
由于目前的數(shù)字音效播放裝置,大多在內(nèi)部整合各種電路,以及相關(guān)的數(shù)字IC,為達(dá)產(chǎn)品體積的集縮需求,各項(xiàng)組件間靠的非常緊密,組件間將無法保持足夠的距離隔開對音效處理組件的干擾,因此音樂透過模擬電路輸出時(shí),幾乎都可以聽到程度不等的電子噪音夾雜其中。
針對此問題,在產(chǎn)品設(shè)計(jì)時(shí)就應(yīng)該在印刷電路板規(guī)劃中,盡量將模擬電路和數(shù)字電路隔離,并確保模擬訊號布線遠(yuǎn)離數(shù)字或功率開關(guān)布線。
此外,EMI干擾也是音質(zhì)殺手,開發(fā)者當(dāng)然有許多傳統(tǒng)方式針對EMI做減低或隔離,但是最有效的方式為差動信號,即利用2個(gè)完全相同,但具有不同極性的訊號,取代單端電路。
例如在一個(gè)對稱布局中,2個(gè)路徑相鄰運(yùn)作,一旦發(fā)生EMI干擾,則相同的EMI突波會被導(dǎo)入這2個(gè)信號中,但是,因?yàn)?個(gè)信號的接收側(cè)不同,所以EMI會被抵銷,換言之,共模抑制比(common-mode rejection ratio,CMRR)越高,則抑制EMI的效果就越好。此外,兩個(gè)鏡像也能夠增大訊號,使任何殘余的噪聲都會較不明顯。
再者,電源供應(yīng)是數(shù)字裝置一定具備的組件,但也提供了噪聲干擾音質(zhì)的管道。對于線性電源供應(yīng)產(chǎn)生的低頻電源線漣波,以及交換式電源供應(yīng)器產(chǎn)生的高頻交換式噪聲,因此在設(shè)計(jì)上應(yīng)該避免共享電源回路,此外,也可以藉由適當(dāng)?shù)姆(wěn)壓器與高質(zhì)量電容器,加以過濾、抑制、消除,例如將低ESR電容放在音效IC的電源接腳附近,這可減輕交流噪聲影響,并且可以降低電源突波發(fā)生,
音質(zhì)提高,除了本篇提到的關(guān)鍵零組件(主動組件)外,被動組件(電阻、電容)的用料也相當(dāng)重要,除影響前述的電源濾波質(zhì)量,在音效處理路徑中的交連電容、回授電容以及電組,都會因?yàn)槠渥陨淼碾娮犹匦,影響輸出的模擬訊號質(zhì)量,這部分的設(shè)計(jì)調(diào)整,對于最后音質(zhì)的細(xì)節(jié)影響也頗大,不過這是在主動組件已經(jīng)相差無幾的情況下,才能比較出差異。 |