視音頻技術(shù)是信息與通信學科的前沿和熱點研究方向。

什么是視音頻

視音頻信息的標引主要包括兩個方面的內(nèi)容,一個方面是關(guān)于磁帶、錄像帶等載體的形式特征信息或者是數(shù)字化視音頻信息的數(shù)據(jù)格式信息(如,磁帶或錄像帶類型、視音頻碼率、文件格式等),另一個方面就是視音頻本身反映的內(nèi)容信息(如,題名信息、主題詞信息、分類信息等等)。

音頻是什么

正常人耳能聽到的,相應(yīng)于正弦聲波的任何頻率。正常人耳的音頻范圍一般約為16Hz~16kHz。通信科技(一級學科);通信原理與基本技術(shù)(二級學科)要在計算機內(nèi)播放或是處理音頻文件,也就是要對聲音文件進行數(shù)、模轉(zhuǎn)換,這個過程同樣由采樣和量化構(gòu)成,人耳所能聽到的聲音,最低的頻率是從20Hz起一直到最高頻率20KHZ,20KHz以上人耳是聽不到的,因此音頻的最大帶寬是20KHZ,故而采樣速率需要介于40~50KHZ之間,而且對每個樣本需要更多的量化比特數(shù)。音頻數(shù)字化的標準是每個樣本16位(16bit,即96dB)的信噪比,采用線性脈沖編碼調(diào)制PCM,每一量化步長都具有相等的長度。在音頻文件的制作中,正是采用這一標準。