道听“Tu”说 | 什么是时域包络和精细结构?(上)
导读:我们都知道声音中的时域包络和精细结构对于日常交流来说至关重要,而听力损失会对这些重要的声音信息造成影响。比起视觉,听觉的概念似乎更为抽象,对于这些心理声学的现象,我们常常会觉得一头雾水。今天就让我们跟着唯听美国临床放大和听力研究中心主任Kuk博士的文章一起来学习一下什么是时域包络和精细结构。
复合音
大家都很熟悉纯音,它是一组简单的正弦波,当具有不同振幅、频率和相位的纯音叠加在一起时就产生了更为复杂的声音,即复合音。实际上,我们的语音就是复合音。通过声学分析,我们可以把一段语音信号拆解成一系列特定频率的纯音,这些纯音频率分量被称为谐波。我们将较低频率的谐波称为基频,它反映了复合音的重复频率。时域包络和精细结构作为复合音波形中两个方面的线索,传达了语音的重要信息。
时域包络和精细结构的区别
除了大家熟悉的强度、频率这两个维度,时间是声音的另一个重要维度。下图中显示了一段持续2秒的语句波形:上半幅图中的红色轮廓线代表了声音的时域包络,从中我们可以看到声波的整个振幅随着时间的推移持续发生变化,这其中包含了两个变化信息——变化得多快(调制速率),变化了多少(调制深度);下半幅图中显示了时域精细结构,即声音包络中的振荡,通常也被称为频谱。
(摘自“Preserving the temporal envelope in hearing aid processed sounds”)
时域包络和精细结构传递的信息
时域包络、周期性和精细结构传递了语音的音段信息(发音的方式、清浊、部位、音质等)和韵律信息(节奏、音节构成、重音、语调等)。这几种时域线索相互补充,传递了语音的完整信息,其中精细结构对噪声下的言语识别尤为重要。
现在我们已经了解了时域包络和精细结构的概念,下一期我们将带大家来进一步了解影响这些声音线索的因素有哪些,而助听器又是如何来保留或提升这些线索的。