版本比较

标识

  • 该行被添加。
  • 该行被删除。
  • 格式已经改变。

音频的产生

物体振动产生声音,声音是一种波,可以在介质中传播,并被人或动物感知。(小知识:声波在水和空气中传播时是纵波,也就是介质是顺着声波的传播方向压缩和膨胀的,但声波在金属等固体中传播则是横波和纵波都有,并且两种波的传播速度不一样,参考地震波。)

音频三要素

音调:音频的快速,也就是振动频率,单体赫兹(Hz)。

音量:振动的幅度,单位分贝(dB)。

音色:声音的谐波成份,比如用不同的乐器演奏同一份乐谱,每种乐器发出的声音都不一样,这就是由谐波成份不一致导致的。

Image AddedImage AddedImage Added

提示

对音量的量化实际是对声压级(sound pressure level)的量化,声压级的单位是帕斯卡(Pa),和压强是一样的。人耳可听的声压幅值波动范围为0.00002Pa~20Pa。

虽然声音的量化对应压强,但音量的单位分贝却不是直接对应压强,而是通过声压幅度和和听阈声压幅度(0.00002Pa)的比值取再以10为底取对数后得到的。这种量化的原理是人类耳朵对声音强度的感知是成对数的形式的,也就是声压幅度按倍数增长时,人耳对声音的察觉近似线性。dB的计算公式如下:

Image Added

按这种计算方式,0dB对应声压幅度为0.00002Pa,而人耳可听的最大声压幅度20Pa则对应120dB(20Pa/0.00002Pa = 1000000,20*log101000000 = 120 )。

常用的音频参数

人耳听觉范围20Hz~20kHz。小于20Hz的是次声波,大于20kHz的超声波。

人声的频率范围在100Hz(男低音)到10000Hz(女高音)范围内,正常语音频率范围是300Hz~3400Hz(这也解释了为什么电话的采样率到8k就够用了,参考奈奎斯特采样定理)。

人耳可听的声压幅值波动范围为0.00002Pa~20Pa,对应分贝值是0dB~120dB。

常见环境下的声音分贝数与声压对应:

Image Added

音频量化