
3.1.1 音频基础知识
1.声音与音频
声音是指由物体引起空气的振动而产生的,是一种机械振动波,声源实际上是一个振动源,它使周围的媒介如空气、液体、固体等产生振动,并以波的形式从声源向四周传播,如图3-1所示。而音频专指人耳可以听到的频率在20Hz~20kHz之间的声音。

图3-1 声音波形
①频率。频率是指波形信号每秒变化的次数,称为频率,单位是Hz。一般来说,频率范围越宽,声音质量越高。
②周期。周期是指相邻声波的波峰之间的时间间隔。
③幅度。幅度是指波形振幅的大小,用来表示声音信号强弱的程度。
④单音和复音。单音是指做简谐振动的发声体发出的声音,也称纯音,一般只能由专用的设备产生。自然界的声音、各种乐器所发出的声音,一般都是由多个不同频率和振幅的单音所组成的,称为复音。
⑤基音和谐音。在复音中,最低频率的单音称为基音,其他频率的单音称为谐音。基音和谐音组合起来,才决定了声音的音色。
2.声音的三要素
①音量。音量又称音强或者响度,用来描述声音的强弱,与声波的振幅成正比,振幅越大,音量越大,单位为分贝(dB)。
②音调。音调又称音高,用来描述声音的高低,与声波的频率有关,频率越高,音调越高,反之亦然,单位为赫兹(Hz)。
③音色。音色又称音品,用来描述声音的特色,表示音频的品质,由音频波形的谐波频谱和包络决定。
3.声音的数字化
由于原始的声音信号是模拟信号,而计算机内的所有信息均以二进制数0和1的数字形式存在,把声音信号保存在计算机中时也必须做数字化的处理,变成数字信号,即模数转换。声音信息的模数转换需要经过采样、量化和编码3个步骤来完成,如图3-2所示。

图3-2 音频信号的数字化
①采样。采样是将时间上、幅值上连续的模拟声音信号,在采样脉冲的作用下,转换成时间上离散(固定的时间间隔),但幅值上仍然连续的离散模拟声音信号,如图3-3所示。
②量化。采样后的信号,在时间上虽然是离散的,但其幅值仍是连续的模拟信号,量化就是将采样所得到的信号幅度的样本值从模拟量转换成数字量,如图3-4所示。表示采样信号幅值的二进制的位数称为量化位数,在相同的采样频率下,量化位数越高,采样值就越精确,音频的质量就越好,所占用的存储空间也越大。
③编码。编码是把量化后的声音信息按一定的数据格式表示。编码以后会丢失某些信息,但量化的精度越高,丢失的信息就越少,如图3-5所示。

图3-3 采样

图3-4 量化

图3-5 编码