新的人工智能降噪耳机技术让佩戴者可以选择他们听到的声音
大多数使用过降噪耳机的人都知道,在正确的时间听到正确的噪音至关重要。有人可能想在室内工作时消除汽车喇叭,但在繁忙的街道上行走时则不想这样做。然而人们无法选择耳机消除哪些声音。
现在,由华盛顿大学研究人员领导的团队开发了深度学习算法,让用户可以实时选择通过耳机过滤的声音。该团队将该系统称为“语义听觉”。耳机将捕获的音频传输到连接的智能手机,从而消除所有环境声音。通过语音命令或智能手机应用程序,耳机佩戴者可以从 20 个类别中选择他们想要包含的声音,例如笛声、婴儿哭声、讲话声、吸尘器声和鸟鸣声。只有选定的声音才会通过耳机播放。
该团队于 11 月 1 日在旧金山UIST '23上公布了其研究结果。未来,研究人员计划发布该系统的商业版本。
“了解鸟儿的声音并从环境中的所有其他声音中提取它需要实时智能,而当今的降噪耳机尚未实现这一点,”资深作者、华盛顿大学保罗·G·艾伦学院教授 Shyam Gollakota说道。计算机科学与工程。“挑战在于耳机佩戴者听到的声音需要与他们的视觉同步。某人与您交谈后两秒您就无法听到他们的声音。这意味着神经算法必须在百分之一秒内处理声音。”
由于时间紧迫,语义听力系统必须在连接的智能手机等设备上处理声音,而不是在更强大的云服务器上处理声音。此外,由于来自不同方向的声音在不同时间到达人们的耳朵,系统必须保留这些延迟和其他空间线索,以便人们仍然可以有意义地感知环境中的声音。
该系统在办公室、街道和公园等环境中进行了测试,能够提取报声、鸟鸣声、报声和其他目标声音,同时消除所有其他现实世界的噪音。当 22 名参与者对系统的目标声音音频输出进行评级时,他们表示,与原始录音相比,平均质量有所提高。
在某些情况下,系统很难区分具有许多共同属性的声音,例如声乐和人类语音。研究人员指出,根据更多真实数据训练模型可能会改善这些结果。
版权声明:本文由用户上传,如有侵权请联系删除!