干货分享--响度感知
响度是一个主观量,所以无法直接测量。这里大家都有一个疑问,我们通常所说的闹市街道上的噪音是85dB(A), 两个人面对面说话是70dB, 难道不是表征的响度?通常来说,这些所谓的dB值越高,响度越大,但也不全是,请看下面详细解释。
首先,我们对不同频率声音的感知是不一样的。下图是等响曲线,是Suzuki和Takeshima在2002年根据ISO226绘制的,测试环境是自由场,测试的声音来之测试者的前方。当然,不同测试方法得到的等响曲线也不相同,混响场中测得的等响曲线就和自由场中的等响曲线不同。
等响曲线的意思是,同一条曲线上,不同频率的纯音听起来的主观响度是相等的,举例来说,1000Hz处的80dB纯音和100Hz处的92dB纯音听起来一样响,这条曲线的响度级就用1000Hz的声压级来表示,这两个声音的响度级都是80方(phon)。
图1. 等响曲线,包含MAF(自由场双耳可听阈)
这样就导致一个问题,现场录制的音乐,重放时除非重现原始现场的声压级,不然音调就有稍许变化。很直观的一个例子,当音量调小时,最先感知不到的是低频的声音。比如1000Hz和100Hz的纯音都从80dB下降到60dB,1000Hz的响度级从80方降到60方,下降20方,而100Hz的响度级则从60方下降到34方,下降了26方,所以小的便携音箱往往将低频稍微加重,听起来声音才会均衡一点。很多功放里面也集成响度控制,随着音量提高低音,当然,这样的响度控制还是有其局限性,没有考虑听音者的距离和房间的影响。
为了更准确的评估复杂声音的强度,声级计里面都加入了计权网络,对各频段声音加权后求和。使用等响曲线近似形状,比如“A”计权就是使用40方等响曲线的近似形状,低频声对总体响度贡献度小,计权系数较低。“B”计权则是使用70方的等响曲线,“C”计权则是使用100方的等响曲线来来加权计算。目前B计权几乎不用,使用最多的是A计权方式的测量,单位为dBA或dB(A)。下图是A,C计权曲线。
图2. 计权网络
本来A计算用于低声强测量的,40dB(A)附近的测量值最为符合人耳的主观感受,面对一个85dB(A)的值,我们需要有一个概念,这个测量值背后的低频能量是被低估的。同时,这些测量值的对稳态声音是有效的,对时间很短的瞬态声,测量值和主观之间不相符。当声音分布在一个很宽的频带内的时候,还无法提供一个令人满意的响度叠加方法。最后,不能认为一个读数80dB(A)的声音就比一个读数为40dB(A)的声音响一倍,实际上是16倍。
根据大量的试验,声强增加10倍(声压级上约升10dB),响度加倍。Stevens提出用宋(Sone)作为响度的单位,在自由场中,正面双耳接受,1000Hz纯音信号的声压级为40dB时,人感觉到的响度定义为1宋。而声压级为50dB时的响度是40dB时的两倍并定义为2宋。
图3. 响度级(方)和响度(宋)之间的关系
从这个关系图中可以看出,40方以上的响度级,基本遵循每上升10方,响度增加1倍的关系,40方以下的声音,呈现一种非线性关系。这样,在设置功放音量调节步长时,需要在低音量时需要减小步进长度。
同时,如果只给一只耳朵提供声音的话,感知的响度仅是双耳的一半。
其次,声音持续时间也对响度有影响。
声音持续的时间对听觉的绝对阈是有影响的。对于持续时间100~200ms的恒定强度的声音,持续时间越长,感知的响度就越响。持续时间大于500ms的声音,其声音的响度大致可以恒定。可以理解为,响度是对声强在时间上在一个时间窗内的积分,是这个时间窗里面的能量总和,而不仅仅是声功率,当持续时间超过这个时间窗时,能量总和不再持续增长。
“老司机”都知道,短促的鸣笛,喇叭发出的声音就没有那么响。声音越短促,音量越小,也是这个道理。
最后,带宽对响度的影响
假设一个固定能量噪音带宽为W,W小于响度临界带宽的特定带宽CBL,这时这声音的响度不依赖于带宽W,声音的听起来和位于W的中心频率处的具有相等强度的纯音信号或窄带噪声一样响。然而,如果提高带宽W超过CBL,这时噪音的响度将也会开始提升,这种结果在有一定带宽的噪声和由不同的纯音信号组成的复音中得到了验证。图4给出的是有一定带宽的噪声的例子,由于CBL的准确值比较难于确定,图中的CBL带宽为250~300Hz中心频率为1420Hz。这样,对于一个能量给定的复音,在它的带宽大于1CBL时听起来要比带宽小于1CBL时更响。
图4. 两噪声响度匹配时,带宽恒为210Hz的噪声的声压级相对于可变带宽噪声的带宽的函数图,噪声信号的中心频率均为1420Hz。每个曲线的标号为用dB表示的可变带宽噪声的总体声压级。
图5是一个正弦信号的刺激模式和比响度模式,并用了声压级为60dB的、带宽不同的的噪声,采用了Moore的模型进行计算的。随着带宽的上升至CBL,“比响度”模式的尖端变低,但是变宽,顶端的减少可以用两边的增加来弥补,而整个形状的总面积保持着几乎是一个恒值。当带宽上升到超过CBL,两边的增加要比顶端的减少的大的多了,这时总面积增加了,所以表示的响度也提升了。既然响度的提升有赖于不同特征频率下的“比响度”的叠加,所以通常用“响度叠加”来描述响度的增加。
图5. 上半部分图显示的声压级60dB时1kHz的正弦信号的刺激图,同时给出了不同带宽噪声,所有的中心频率都是1kHz声压级为60dB。带宽为20,60,140,300,620和1260Hz。随着带宽的增加,图的高度变低了但是变宽了。下半部分图是根据上半部分图的刺激图算出的“比响度”图,在带宽升至140Hz时,“比响度”图的面积是不变的,带宽变高时,总体面积上升。
以上,人对声音响度的主观感知,跟频率,持续时间,带宽和客观量的强度有一个相当复杂的关系,某些方面的研究还存在一定的争议。不过已知的这些信息,已经能够指导我们在音频工作上做一些改进。
内容来源:精拓丽音