信息动态:亚马逊的AI改善了Echo设备上的低音响应 响度和回声消除-环球热议
(资料图片仅供参考)
互联网可以使学生变成老师;互联网可以使名不见经传的人闻名天下;互联网可以结交志同道合的朋友;互联网可以让自己获取最多的知识,改变以往的传统的学习方式。下面分享一篇关于互联网的文章供大家阅读。
曾经听说过“多频段动态处理”(MBDP)吗?这是一种通过频带修改音频信号音量的技术,通常具有改善回声消除的效果。但它并非没有缺点。也就是说,它并不总是将信号干净地分离成它们的分量频率,并且它倾向于使用固定频带,这实际上会影响响度和低音响应并导致令人不快的失真。
幸运的是,亚马逊硬件技术与架构部门的科学家在解决MBDP方案的技术限制方面取得了进展。在今年晚些时候在国际声学,语音和信号处理会议上发表的新发表的论文(“ 可重构多任务音频动态处理方案 ”)中,他们详细介绍了一种新颖,紧凑的模型设计,不仅增强了响度和低音,但显着提高了语音识别任务的性能。
他们说,它在2017年开始在支持Alexa的设备上发货。
正如资深研究科学家Jun Yang所解释的那样,MBDP有两个主要功能:压缩,或保持音频信号在一定范围内的最大和最小音量的比例,以及峰值限制,或切断可能导致失真的音量尖峰(已知现象)作为“掉电”)。亚马逊的系统具有可配置的设计,包括多个滤波器,可以同时或单独应用于输入信号。
首先将所述信号分成两部分。一个传递到两个连续的高通滤波器,滤除低于截止频率的频率,另一个通过一对连续的低通滤波器,滤除高于相同截止频率的频率。来自高通滤波器的信号可能被分割并传递到单独的滤波器任意次数,然后通过同步所有频段的“全通”滤波器。然后,每个频带中的信号传递到压缩器然后传递到限制器,此时频率特定信号被重新组合并传递到全频带限制器。
这些和其他技术减少了削波,当电信号由于放大器输出超过安全范围的电压而变得失真时发生削波,以及总谐波失真,同时保持音频信号的整体响度和低音响应。此外,它确保产生音频的扬声器保持在其“线性动态范围” - 换句话说,声压级不会超过它将开始引起失真的阈值。
在实验中,Jun Yang及其同事发现,人们报告使用可重新配置的MBDP方案过滤的音频要比使用传统MBDP方案处理的样本“更好”和“更响亮”。此外,分析表明系统将低音响应增加了大约5分贝,并且当在Echo扬声器上进行测试时,它在更高的输出音量下显着减少了错误拒绝的数量(Echo未能识别唤醒字的情况)。