什么是临界频带?

如果你熟悉倍频程,一定程度上,对于理解临界频带是有帮助的。二者既有相同之处,也有明显的差异之处。相同在于二者都有中心频率和上、下限频率;差异之处在于带宽的划分原理是完全不同的。倍频程频带的划分有确定的理论公式,而临界频带的划分则是由人耳耳蜗上的基底膜的不同部位的频率选择性决定的。因此,在讲解临界频带之前,我们必须了解基底膜的频率选择特性。

01

基底膜的频率选择性
基底膜是耳蜗的中阶与鼓阶的分隔层,它是一个长的线状结构,靠近卵圆窗(Oval Window)的一端宽度最窄、刚度最大,称为“ ”部(Base),靠近蜗孔(Helicotrema)的一端宽度最宽、刚度最小,称为“ ”部(Apex)。从很窄的底部,沿着顶部方向逐渐变宽,变厚,顶部宽度大约是底部的三倍。整个基底膜长度约为32mm,如图1所示。
什么是临界频带?的图1

图1 基底膜长约为32mm

中耳镫骨踏板在卵圆窗产生活塞式振动,活塞式振动将带动耳蜗内的淋巴液流动,这些液体的运动会在前庭阶产生行波,并转移到基底膜上,引起基底膜的振动。基底膜沿着长度方向具有不同的属性:宽度、刚度、质量、阻尼和管道尺寸。在长度方向给定位置的这些参数决定了它的 特征频率(Characteristic Frequency),也就是它对这个频率的声音振动最敏感。换句话说,这些不同参数也就决定了基底膜的不同位置响应频率不同:宽度窄、刚度大的部位(底部)对高频响应好;宽度宽、刚度小的部位(顶部)对低频响应好。因此,高频声音会使基底膜底部附近产生振动,低频声音会使基底膜顶部附近产生振动,这就说明基底膜特定部位对应于特定的声音频率。将基底膜沿着底部向顶部方向展开,输入的不同频率的声波将在基底膜的不同部位产生响应,如图2所示。这种基底膜不同部位对应不同频率的响应特性,称为基底膜部位的频率选择性。换句话说,不同频率的声音沿基底膜传输并集中在不同的部位,频率在基底膜上按部位分离称为 部位原理(place principle)。
什么是临界频带?的图2

图2 基底膜的频率选择特性

将基底膜从卵圆窗处的底部向蜗孔处的顶部展开,如图1一致,得到基底膜各个部位与相应频率的对应关系如图3所示。图中频率以kHz为单位,从图中可以看出,在距基底膜底部5mm处,其响应频率约为8kHz,随着距离的增加到27mm处,响应频率降低约为300Hz。另外,注意到随着距离的增加,除了响应频率在降低之外,相应的幅值也在降低。这说明基底膜不同位置对不同频率的声音信号,灵敏度不同,因此,人耳对声音传递特性具有非线性。
什么是临界频带?的图3

图3 基底膜部位与频率响应的对应关系

需要注意的是,并不是某个特定的频率只在基底膜上一特定位置处产生响应,实际上是在一个特定区域产生响应,只不过是响应的最大位移出现在这个特定位置而已,其位移响应曲线像个不对称的小山丘,小山丘的峰值出现在这个特定位置处,从这个特定位置处向左右两侧延伸,左侧(底部端)斜坡更缓,延伸更多,而右侧(顶部端)斜坡更陡,延伸更少。这样一来,基底膜对不同频率的声音的响应位移包络曲线不对称,图4是对5个不同频率的纯音的响应,位移响应包络最大峰值的左侧(高频区域)延展比右侧(低频区域)更多,这是因为基底膜对高频信号的恢复比低频信号慢。
什么是临界频带?的图4

图4 基底膜对5个不同纯音的响应位移包络

传递到内耳基底膜的声音信号的每个频率成分都会使基底膜特定部位产生响应(振动产生位移),由于频率分量产生的位移响应在峰值两侧有一定程度的延展,也就是说,某个频率成分的声音会使基底膜沿长度方向一定的区域(约1.3mm)产生响应,而不同频率对应基膜不同部位。这样一来,基底膜特定区域部位的频率响应特性将声音的频率成分划分成了一系列的频率范围,每个部位区域对应一定范围内的频率成分,我们将基底膜划分的这一系列的声音频率范围称为临界频带(critical band),每个临界频带所对应的频率宽度称为临界带宽(critical bandwidth)。在听力学和心理声学中,临界频带的概念,由哈维·弗莱彻(Harvey Fletcher)于1933年提出并于1940年进行了改进。

虽然人耳的可听频率范围为20~20kHz,但是,随着年龄的增大,可听频率范围在逐渐变化,年龄越大,对高频声的听觉感知能力越差,主要体现在可听频率上限的降低。健康儿童的可听频率上限可达20kHz,但是,到20岁以后上限频率可能下降到16kHz,20岁以后随着年龄的增加,上限频率会继续降低。对于成年人而言,其可听频率上限只有16kHz,基于这一点,临界频带对应的频率范围为0~16kHz,下限为0,而非可听频率的下限20Hz。

02

确定临界频带的方法

每个临界频带都有上下限,对应一定的临界带宽,与倍频程一样,那么怎么确定每个临界频带的上下限频率呢?

确定方法之一是基于双耳听觉,两个幅值相近,频率有差值的两个纯音信号是否能被听觉系统分辨出来,取决于每个分量在基底膜上产生的位移包络是否可清晰地分离。当同时播放两个幅值相近的纯音时,如果二者频差低于15Hz,会出现明显的拍现象。出现拍的声音信号幅值忽高忽低(幅值波动),此时人耳是分辨不出来这种频差的。当频差进一步提高,大于15Hz时,听感逐渐从拍音变成一个音高不明确的不稳定的声音,此时实际上表现出粗糙特性。当频差继续增大到某一值时,两个频率从混合在一起变成可被人耳分离,但仍然有不平稳的听感。当频差继续增大,听感转变为平稳。频差增至某一值时,基底膜上的最大位移开始变为两个峰值位移时,听觉系统就可以分辨出两个频率的纯音信号,而不是两个信号的混合,如图5所示。听觉系统觉察两个纯音从不平稳可分离转变为平稳可分离的频率差,对应的带宽为临界带宽,对应的频带称为临界频带。临界带宽是人的主观听感突然发生明显变化的频率宽度。
什么是临界频带?的图5

图5 不同的频差表现出不同的特性

临界频带也与听觉的掩蔽效应密切相关:当在同一临界频带内存在第二个强度更高的信号时,声音信号的可听性明显降低。大致来说,临界频带是音频频率的频带,在这个频带内,第二个纯音会通过听觉掩蔽干扰第一个纯音的感知。临界频带的提出者弗莱彻就是利用掩蔽效应来确定临界带宽的。他假设噪声中有效掩蔽测试音的部分是其频谱中靠近这个测试音的那部分。为了获得相对值和绝对值,还做了以下假设:当这个测试音的功率和位于这个测试音附近产生掩蔽效应的那部分噪声频谱的功率相同时,掩蔽就实现了;这个测试音附近频谱之外的噪声对掩蔽没有贡献。以这种方式定义的特征频带具有一定带宽(临界带宽),当该测试音刚好被掩蔽时,在这个带宽内的测试音功率与噪声频谱的声功率相同。

也可以利用阈值测量法来确定临界频带和临界带宽。当带宽小于临界带宽时,总声压级在静音阈值(或掩蔽阈值)处保持恒定。带宽高于临界带宽时,总声压增加,表明临界带宽以外的成分既对静音阈值无贡献,也对掩蔽阈值无贡献。落在一个临界带宽内的声音强度既对静音阈值有贡献,也对掩蔽阈值有贡献。

03

临界频带的定义

根据以上方法,将可听频率范围0~16kHz划分为24个临界频带,对应于32mm长的基底膜24等分,每份长约1.3mm。频率在500Hz以下,临界带宽约为固定值100Hz,在500Hz以上,临界带宽的增加速度比频率增加速度慢一些,而在3kHz以上,临界带宽的增加速度比频率增加速度快一些。在中心频率500Hz以下,假设临界带宽恒定为100Hz,在中心频率500Hz以上时,假设临界带宽约为临界频带中心频率的20%,如图6所近似,这个假设是有用的。表1给出了各个临界频带更准确的数值,给出了中心频率fc、临界频带的下限值fl和上限值fu和临界带宽ΔfG。由于一个临界频带的上限频率与下一个临界频带的下限频率相同,因此,它们是连续的,可以累加的。由于有24个临界频带,每个对应相应的临界带宽,因此,也用数字0~24表示相应的临界频带,称为临界频率率z。

表1 临界频带率z,临界带宽 ΔfG的下限( fl)和上限( fu), fc为中心频率

什么是临界频带?的图6

什么是临界频带?的图7

图6 临界带宽是频率的函数

在许多情况下,一个解析表达式用于描述整个听觉频率范围内的临界频带率(和临界带宽)对频率的依赖关系。下面两个表达式已经被证明是有用的:
什么是临界频带?的图8

04

Bark域
临界频带的概念对于描述听觉感知很重要。许多模型都使用它,假设定义单位临界带宽为所谓的临界频带率z。这个度量是基于这样的事实,即我们的听力系统将宽带频谱分析成与多个临界频带相关的部分。将一个临界频带与下一个临界频带相加,采用这种方式:一个临界频带的上限与下一个更高临界频带的下限相等,形成 临界频带率标尺(critical band ratio scale)。如果以这种方式将临界频带相加,则每个交点都对应一个确定的频率(见表1,为每个临界频带的下限频率)。这个过程如图7所示。第一个临界频带的范围是0~100Hz,第二个是100~200Hz,第三个是200~300Hz,以此类推直到第24个是12000~15500H,当然,每个临界频带的频率范围都在增加。绘制每个临界频带对应的临界频带率z序数为纵坐标,与图7中作为频率的函数产生一系列的点相对应。可以看出,在16kHz的可听频率范围内,可以细分为24个相邻的临界频带。这一系列的点并不意味着临界频带只存在于相邻的两个点之间;相反,它们应该被认为是能够沿着通过这些点的曲线产生的标尺连续移动。按这种方法产生的标尺称为 临界频带率。它从0增加到24,单位为Bark,是为了纪念科学家巴克豪森,他引入了描述响度量级的单位“方”,这对临界频带起着非常重要的作用。临界频带率z和频率f之间的关系对于理解人耳的许多特征是很重要的。
什么是临界频带?的图9

图7 临界频带率被绘制成频率的函数

一个重要的事实变得清晰起来:频率尺度是一个物理标尺度,在描述内耳产生的效应时不是很有用;在整个基底膜的长度上,线性和对数尺度都不适用。与频率相比,临界频带率可以沿着基底膜长度用线性尺度绘制出来,临界频带率与频率的对应关系见表1。因此,在讨论听力系统的特征或制作描述这些特征的详细模型时,尽可能早地使用频率到临界频带率尺度的变换似乎是合理的。因此,以横轴为0~24Bark(临界频带率)表示的域,称为 Bark域,对应可听的频率范围划分的24个临界频带。由于临界带宽是主观听觉感受发生明显变化的频带宽度。因此,Bark域与人的主观感受更相关,在心理声学领域被广泛使用,如图8所示用Bark域表示的某个声音信号的特征响度。
什么是临界频带?的图10
图8 Bark域表示的特征响度曲线
参考:
[1]谭祥军 从这里学NVH——噪声、振动、模态分析的入门与进阶(第2版),机械工业出版社,2021
[2]Hugo Fastl,Eberhard Zwicker,Psychoacoustics:Facts and Models,Springer,2006 

[3]David M. Howard,Jamie A. S. Angus. Acoustics and Psychoacoustics (Fifth Edition), Routledge Press, 2017


文章来源:模态空间

默认 最新
当前暂无评论,小编等你评论哦!
点赞 评论 收藏
关注