|
|
51CTO旗下网站
|
|
移动端

3.6.2 声音生物计量面临的挑战

《实感交互:人工智能下的人机交互技术》第3章用户界面中的声控式交互技术,本书将深入讲解基于触摸、手势、语音和视觉等自然人机交互领域的技术、应用和未来趋势。本节为大家介绍声音生物计量面临的挑战。

作者:温秀颖 译来源:机械工业出版社|2019-02-07 16:31

3.6.2 声音生物计量面临的挑战

其中一个声音生物计量学的主要挑战一直是减少由于错误匹配注册与验证声音而产生的错误率。比如,当人们用手机注册了自己的声音,又在个人电脑上验证网上交易的时候,错误就可能发生。此情况下错误率增加的主要原因是电脑麦克风和用来录制的频道不匹配。这一问题已经得到了研究人员的广泛关注,并能够由NAP、JFA和TFA途径成功的解决。但是新呈现的应用有必要进行进一步的研究。另一项任务是应对“声音老化”。这是指由于注册和验证的间隔时间逐渐拉长而导致的验证准确率下降。模型自适应调整是一个可能的解决方案,即注册后的模型可以随着验证过程中的数据特点变化而改变。当然,这只能在用户经常介入设备的前提下可行。

声音生物计量的另一项挑战是以最小的声音数据维持可接受程度的准确性。这是商业应用的一项基本要求。在“依赖文本” 的说话人识别中———相同的词组必须用来注册和验证———2~3s(或10个音节)通常能够产生足够的准确度。但是如有些在移动设备上使用唤醒词的应用则需要时间更短的话语来验证用户。

虽然把握时间信息和使用定制的背景建模能改进准确度,但这个问题一直是一个挑战。相似的,独立文本的说话人验证———用户能在注册或验证时说出任何短语———通常30~60s就能够产生足够的准确度。但是说话人验证和身份识别性能是经常需要用较短的话语完成的,比如在向移动设备发出声音命令以及与客服中心的代理简短谈话的时候,等等。美国国家标准与技术研究院(NIST) 已经赞助了许多包括验证较短话语的说话人识别评估项目,该问题仍是目前研究关注的领域。


喜欢的朋友可以加入官方的读书群

51CTO读书频道二维码


51CTO读书会第9群:808517103

【责任编辑:book TEL:(010)68476606】

回书目   上一节   下一节
点赞 0
分享:
大家都在看
猜你喜欢

订阅专栏+更多

活学活用 Ubuntu Server

活学活用 Ubuntu Server

实战直通车
共35章 | UbuntuServer

216人订阅学习

Java EE速成指南

Java EE速成指南

掌握Java核心
共30章 | 51CTO王波

83人订阅学习

Mysql DBA修炼之路

Mysql DBA修炼之路

MySQL入门到高阶
共24章 | 武凤涛

468人订阅学习

读 书 +更多

Cisco网络技术教程(第2版)

本书作为思科认证体系中的入门级教材,主要讲述了网络的基本知识和思科设备的基本命令,以及路由、交换等深层次网络知识的入门知识,其体系...

订阅51CTO邮刊

点击这里查看样刊

订阅51CTO邮刊

51CTO服务号

51CTO播客

博聚网