一、聲音的基本概念
聲音是通過一定介質(zhì)傳播的連續(xù)的波。
圖1 聲波
重要指標(biāo):
- 振幅:音量的大小
- 周期:重復(fù)出現(xiàn)的時間間隔
- 頻率:指信號每秒鐘變化的次數(shù)
聲音按頻率分類:
圖2 聲音的頻率(語音信號頻率范圍:300Hz-3kHz)
聲音的傳播攜帶了信息,它是人類傳播信息的一種主要媒體。 聲音的三種類型:
- 波形聲音:包含了所有聲音形式
- 語音:不僅是波形聲音,而且還有豐富的語言內(nèi)涵(抽象→提取特征→意義理解)
- 音樂:與語音相比,形式更規(guī)范。音樂是符號化的聲音。
二、聲音的數(shù)字化
1.聲音信號的類型
2.聲音數(shù)字化過程
圖3 聲音數(shù)字化過程
3.聲音數(shù)字化過程示意圖
圖4 聲音數(shù)字化過程示意圖
4.聲音數(shù)字化三要素
采樣頻率
|
量化位數(shù)
|
聲道數(shù)
|
每秒鐘抽取聲波幅度樣本的次數(shù)
|
每個采樣點(diǎn)用多少二進(jìn)制位表示數(shù)據(jù)范圍
|
使用聲音通道的個數(shù)
|
采樣頻率越高
聲音質(zhì)量越好
數(shù)據(jù)量也越大
|
量化位數(shù)越多
音質(zhì)越好
數(shù)據(jù)量也越大
|
立體聲比單聲道的表現(xiàn)力豐富,但數(shù)據(jù)量翻倍
|
11.025kHz
22.05 kHz
44.1 kHz
|
8位=256
16位=65536
|
單聲道
立體聲
|
5.聲音數(shù)字化的數(shù)據(jù)量
音頻數(shù)據(jù)量=采樣頻率×量化位數(shù)×聲道數(shù)/8(字節(jié)/秒)
采樣頻率
(kHz)
|
量化位數(shù)
(bit)
|
數(shù)據(jù)量(KB/s)
|
單聲道
|
立體聲
|
11.025
|
8
|
10.77
|
21.35
|
16
|
21.53
|
43.07
|
22.05
|
8
|
21.53
|
43.07
|
16
|
43.07
|
86.13
|
44.1
|
8
|
43.07
|
86.13
|
16
|
86.13
|
172.27
|
三、音頻的文件格式
1.WAV文件
WAV是Microsoft/IBM共同開發(fā)的PC波形文件。因未經(jīng)壓縮,文件數(shù)據(jù)量很大。
特點(diǎn):聲音層次豐富,還原音質(zhì)好
2.MP3文件
MP3(MPEG Audio layer3)是一種按MPEG標(biāo)準(zhǔn)的音頻壓縮技術(shù)制作的音頻文件。
特點(diǎn):高壓縮比(11:1),優(yōu)美音質(zhì)
3.WMA文件
WMA(Windows Media Audio)是Windows Media格式中的一個子集(音頻格式)。
特點(diǎn):壓縮到MP3一半
4.MIDI文件
MIDI(樂器數(shù)字接口)是由一組聲音或樂器符號的集合。
特點(diǎn):數(shù)據(jù)量很小,缺乏重現(xiàn)自然音
四、數(shù)字音頻壓縮標(biāo)準(zhǔn)
1.音頻壓縮方法概述
圖5
壓縮編碼技術(shù)是指用某種方法使數(shù)字化信息的編碼率降低的技術(shù)
音頻信號能壓縮的基本依據(jù):
①聲音信號中存在大量的冗余度;
②人的聽覺具有強(qiáng)音能抑制同時存在的弱音現(xiàn)象。
音頻信號壓縮編碼的分類:
①無損壓縮(熵編碼)
霍夫曼編碼、算術(shù)編碼、行程編碼
②有損壓縮
波形編碼--PCM、DPCM、ADPCM 、子帶編碼、矢量量化
參數(shù)編碼--LPC
混合編碼--MPLPC、CELP
2.音頻壓縮技術(shù)標(biāo)準(zhǔn)
分類
|
標(biāo)準(zhǔn)
|
說明
|
電話語
音質(zhì)量
|
G.711
|
采樣8kHz,量化8bit,碼率64kbps
|
G.721
|
采用ADPCM編碼,碼率32kbps
|
G.723
|
采用ADPCM有損壓縮,碼率24kbps
|
G.728
|
采用LD-CELP壓縮技術(shù),碼率16kbps
|
調(diào)幅廣
播質(zhì)量
|
G.722
|
采樣16kHz,量化14bit,碼率224(64)kbps
|
高保真
立體聲
|
MPEG
音頻
|
采樣44.1kHz,量化16bit,碼率705kbps (MPEG三個壓縮層次,384-64kbps)
|
五、聲卡
1.聲卡的主要功能
聲卡是負(fù)責(zé)錄音、播音和聲音合成的一種多媒體板卡。其功能包括:
①錄制、編輯和回放數(shù)字音頻文件
②控制和混合各聲源的音量
③記錄和回放時進(jìn)行壓縮和解壓縮
④語音合成技術(shù)(朗讀文本)
⑤具有MIDI接口(樂器數(shù)字接口)
2.芯片類型
|