|
|
51CTO旗下网站
|
|
移动端

3.5.2 单通道噪声抑制

《实感交互:人工智能下的人机交互技术》第3章用户界面中的声控式交互技术,本书将深入讲解基于触摸、手势、语音和视觉等自然人机交互领域的技术、应用和未来趋势。本节为大家介绍单通道噪声抑制。

作者:温秀颖 译来源:机械工业出版社|2019-02-07 16:13

3.5.2 单通道噪声抑制

单通道噪声抑制技术主要是基于频谱加权法。在这种方法中,信号一开始被分解成叠加的数据模块,每个模块时长约20~30ms。随后每个模块通过使用短时傅里叶变换(STFT)或合适的解析滤波器组转换成为频域或子带域。接着,噪声信号的频谱内容由衰减系数加权,衰减系数根据估计瞬时信噪比(SNR)函数在频带或子频带中进行计算。选择了该函数的结果是有低SNR的频谱内容被衰减,而有高SNR的则没有。这样做的目标是为了得到一个免噪语音信号的频谱系数的最佳估值。由于频谱系数得到改进,一个无噪声的时间域信号就能被合成出来并传输到识别器中。另外,特征抽取可以直接在改进的频谱系数上进行,避免了把频谱系数转回到免噪声的时域中。

目前大量用来计算频谱加权函数的线性和非线性算法已经2018送彩金的娱乐网站。这些算法主要在基本优化标准以及对语音和噪声的统计特征的假设上存在差异。加权函数的最普遍范例是谱减法、威纳滤波器(Wienerfilter)和最小均方误差(MMSE) 估算器。单通道噪声抑制方案如图38所示。图39显示了在应用所描述的频谱加权系数之后,噪声短语“Barbaccohasanopening”的频谱图和增强信号的频谱图。

单通道噪声抑制算法对诸如像空调风扇、电脑风扇、车内行驶噪声等平稳背景噪声非常有效,但它们却不适合诸如说话或音乐等波动干扰源。在单通道系统中,背景噪声大多只能在语音暂停时被追踪到,因为在嘈杂的语音信号中,声音和干扰叠加所产生的频率通常较高,使单通道的减噪方案主要被限制在时间变化慢速的背景噪声,而这样的噪声在话语活动中变化并不大。

目前已经为克服这个局限提出了若干个优化方案,包括利用显化清晰的语音模型或语音和具体干扰项的时空特征,以实现语音和波动噪声的分离。有效的方法能够减少风扇声、敞篷车的风吹声、高速脉冲噪声或模糊不清的声音。

单通道噪声抑制的另一个缺点是频谱加权技术对声音的固有扭曲,这极大地影响了低信噪比。由于该方法依赖于SNR产生衰减,当背景噪声增加时,会有越来越多的目标信号内容被抑制。递增的语音扭曲因此会降低识别器的性能。


喜欢的朋友可以加入官方的读书群

51CTO读书频道二维码


51CTO读书会第9群:808517103

【责任编辑:book TEL:(010)68476606】

回书目   上一节   下一节
点赞 0
分享:
大家都在看
猜你喜欢

订阅专栏+更多

活学活用 Ubuntu Server

活学活用 Ubuntu Server

实战直通车
共35章 | UbuntuServer

216人订阅学习

Java EE速成指南

Java EE速成指南

掌握Java核心
共30章 | 51CTO王波

83人订阅学习

Mysql DBA修炼之路

Mysql DBA修炼之路

MySQL入门到高阶
共24章 | 武凤涛

468人订阅学习

读 书 +更多

非常网管——网络工程案例

本书面向企业网络应用需求,详细介绍了Windows网络互联解决方案、中小企业共享上网解决方案、基于ISA Server 2006的代理服务器与防火墙解决...

订阅51CTO邮刊

点击这里查看样刊

订阅51CTO邮刊

51CTO服务号

51CTO播客

博聚网