|
|
51CTO旗下网站
|
|
移动端

3.2.9 性能

《实感交互:人工智能下的人机交互技术》第3章用户界面中的声控式交互技术,本书将深入讲解基于触摸、手势、语音和视觉等自然人机交互领域的技术、应用和未来趋势。本节为大家介绍性能。

作者:温秀颖 译来源:机械工业出版社|2019-02-07 16:05

3.2.9 性能

语音识别准确度在近几十年内一直稳步提高。早期的口令系统在20世纪80年代末创立,一些用户欣然接受并成功地使用了它们,而许多其他用户则发觉其错误率很高并深信语音识别的“时机未到”。2010年,语音识别性能的些许进步引起了大家的注意,因为纽约时报的科技专栏记者DavidPogue报道了总体口令的错误率不到1%。虽然大多数对讲系统并未显示接近该水平的性能,但通过改进算法、增加运算和使用更大的训练数据库等联合手段,其性能仍在逐年提高。事实上在一项识别多个说话人同时说话的特殊任务中,语音识别系统能够表现出比真人更高的语音识别能力。

根据作者近十年来的体验,平均单词错误率在大型词汇口令任务中已经每年减少大约18%。这意味着获得合格性能体验的未受训用户人口比例在稳步逐年增加。该进步不仅让我们能够面对诸如语音搜索的技术挑战,还能有机会应付更具挑战性的使用环境,比如车内语音控制。最后,准确度的提高意味着语音识别已经成为了解决复杂自然语言处理的有效前端,从而催生出一批崭新的界面程序。


喜欢的朋友可以加入官方的读书群

51CTO读书频道二维码


51CTO读书会第9群:808517103

【责任编辑:book TEL:(010)68476606】

回书目   上一节   下一节
点赞 0
分享:
大家都在看
猜你喜欢

订阅专栏+更多

活学活用 Ubuntu Server

活学活用 Ubuntu Server

实战直通车
共35章 | UbuntuServer

216人订阅学习

Java EE速成指南

Java EE速成指南

掌握Java核心
共30章 | 51CTO王波

83人订阅学习

Mysql DBA修炼之路

Mysql DBA修炼之路

MySQL入门到高阶
共24章 | 武凤涛

468人订阅学习

读 书 +更多

程序员面试宝典

本书取材于各大IT公司历年面试真题(笔试、口试、电话面试、英语面试,以及逻辑测试和智商测试)。详细分析了应聘程序员(含网络、测试等...

订阅51CTO邮刊

点击这里查看样刊

订阅51CTO邮刊

51CTO服务号

51CTO播客

博聚网