前沿资讯 | 震惊，聆听时的大脑长这样？

导读：每次参加美国声学协会(ASA)的会议时，大家都聚在会场的一个大厅里进行社交活动。有些人喜欢和老朋友叙旧；另一些人则继续深入讨论所有关于声学知识。

大多数没有听力损失的听众可以在拥挤的环境中“收听”感兴趣的声音，而“忽略”其他声音；

60多年前，这种行为挑战首次出现在“美国声学学会杂志”(Cherry，1953)中，被称为“鸡尾酒会难题”。许多听众，特别是年轻的受试者，可以毫不费力地完成这一任务。

然而，从可听到的混合声中挑选出单一的声源并不是件容易的事，即使是较先进的机器学习算法也无法可靠地实现这一目标。幸运的是，有些听觉特征可以提供线索，告诉我们如何在混合声中区分声音，并找到它们的实际来源。

这个问题通常被称为听觉场景分析。

我们可以通过下列图片作个视觉上的类比：

图a）:到达耳朵的不同声源的波谱时间信息相互重叠，使得很难分别理解每个声源；

图b）:每个声源相关的声学特征(如音高、响度和位置线索)可以帮助区分不同声源;

图c）:如果由于听力损失，或者声学特性下降(如在高混响的音乐厅)，那么听觉场景分析就将变得更加困难;

图d）:正常大脑可充分发挥主动聆听性能，将注意力保持在特定听觉对象上，并灵活切换
那么大脑是如何完成这种主动聆听任务的呢?

我们能够通过神经成像技术（fMRI、MEG/EEG、ECoG）来探究：
大脑如何分析听觉场景并形成听觉对象的理解，以及当我们有选择地关注一种混合声音时，大脑中的神经活动是如何进行的。

大脑如何分析听觉场景

时间相干模型理论认为：大脑通过整理并编码环境中全部声音的特征信息(如音调和空间位置)来对环境进行分析，而这些特征在时间上具有一定联系。

声源的成分往往是一致的。假设一个婴儿在哭泣，他/她父亲的声音在安抚他/她，那么父亲声音及和声将被一起连贯处理。与这些声音相关的空间线索也将被同步分析处理，因为它们都来自同一位置。然而，父亲声音信息与哭泣的婴儿无关，因为频谱能量来自两个不同的独立来源。

脑电图实验结果表明大脑在听觉处理的早期就开始对声音进行分组。此外，这种处理可以在没有明确注意的情况下存在。

当受试者积极地聆听这些听觉刺激时，这种时间刺激会增强神经反应。这表明，主动聆听和选择性注意可以进一步增强大脑对信息的加工。

通过分析这些时间联系所带来的改变，研究人员发现：神经源在被动和主动条件下都起源于双侧颞区，而fMRI研究显示，在不同的时间干预机制下，顶叶区域会出现双边激活。

大脑如何转换注意力

许多研究都提出这样的问题:在多人交流环境下，与听觉相关的大脑区域是否能转换到感兴趣的声音。

早在20世纪70年代Hillyard对聆听者注意力状态的调查就显示：听觉反应甚至可能在大脑皮层声音处理的初始阶段之前就被其他感觉系统（如视觉）所处理。

之后的fMRI研究显示了听觉感觉区域的注意力调节机制，而且这种注意调节是针对特定频率的。就像收音机一样，人类的听觉皮层似乎可以根据需要选择优先处理频率。

近年来，更先进的信号处理和神经建模技术使得实验者能够研究类似于“鸡尾酒会问题”的聆听情况。

当我们在一个嘈杂的环境进行社交谈话，我们需要将注意力进行转移。研究表明主要声源的神经活动比次要声源更强。也就是说，在存在多个声源的情况下，大脑更多地锁定在主要声源的信息包络上，大脑对主要声源的反应更强烈。

在多人交流环境中聚焦于一个声源时, 听觉感觉区域也会忠实地跟随这个语音信号。

较近的一项M/EEG研究表明，基于不同声学特征的转换可能会激发不同的处理策略，导致大脑不同的皮层区域被激活。如注意力集中在男女说话者之间和不同耳别间所引起的大脑反应是不一样的。

年龄与听力损失

年龄是另一个影响中枢系统帮助人类理解复杂环境中的语言的重要因素。

老年人与具有听力损失的人在复杂环境中的大脑相关系统活动量显著增加，这反映了与年龄相关的感官知觉和认知能力下降的代偿机制。这种情况对听者来说是非常耗费精力的，甚至他们宁愿放弃，也不愿尝试在这些具有挑战性的环境下听懂言语。

而他们现在所需要的，是真正意义上能够帮助大脑：
1.全面并积极地分析听觉环境
2.平衡各声源并提取重要语音信息
从而降低大脑聆听负担的听力解决方案，避免他们放弃聆听，逃避社交。