|
|
51CTO旗下网站
|
|
移动端

3.6.1 引言

《实感交互:人工智能下的人机交互技术》第3章用户界面中的声控式交互技术,本书将深入讲解基于触摸、手势、语音和视觉等自然人机交互领域的技术、应用和未来趋势。本节为引言。

作者:温秀颖 译来源:机械工业出版社|2019-02-07 16:30

3.6 声音生物计量

3.6.1 引言

许多移动设备安装的声音驱动型应用需要核实用户身份。这有时是出于安全的需要(比如,用户可以进行金融交易),有时是因为要保证语音命令是由设备的主人发出的。声音生物计量通过人的声音样本辨识身份。主要使用的商业应用是说话人验证。所要求的身份是通过比较在注册和验证环节的声音样本来验证的。把声音样本和一组多个注册用户进行匹配也是声音生物计量学的一种应用。最后,如果录音包含来自多人的声音数据,比如在代理人和顾客之间的对话中,“说话人分类”从每个用户身上抽取声音数据。所有这些技术都在人机交互中发挥着作用,特别是有安全考虑的情形中。

声音生物计量学将会是移动用户界面的核心组件。传统安全方法主要采用了包括个人身份号码、密码、口令牌等乏味的措施,在与移动设备互动时特别笨拙不便。声音生物计量提供了一种更为自然方便的核实用户身份的方法。它有多种应用,包括诸如查收电子邮件和唤醒移动设备等日常活动。想要实现“瞬间唤醒”,不仅需要用词完全正确,而且必须由机主本人启动才行。这有利于省电和防止未授权的设备介入。其他应用包括手机银行交易和购物许可等验证。

致力于2018送彩金的娱乐网站和改进说话人验证、身份识别和分类的技术在过去50年中取得了不小的进展。虽然早期的技术主要聚焦模板式途径,如动态时间规整(DTW)[37],但它们已经朝着诸如GMM (152节已经讨论过) 这样的统计模型发展。最近的说话人识别技术已经采用GMM作为人声模型建构的初始步骤,随后又在冗余属性投影(NAP)[40]、联合因素分析(JFA)[41]和全要素分析(TFA)[42]中应用。TFA途径产生了紧凑的人声表达式,又称为I矢量(或身份矢量)。这些都是声音生物计量学的前沿发展成果。


喜欢的朋友可以加入官方的读书群

51CTO读书频道二维码


51CTO读书会第9群:808517103

【责任编辑:book TEL:(010)68476606】

回书目   上一节   下一节
点赞 0
分享:
大家都在看
猜你喜欢

订阅专栏+更多

活学活用 Ubuntu Server

活学活用 Ubuntu Server

实战直通车
共35章 | UbuntuServer

216人订阅学习

Java EE速成指南

Java EE速成指南

掌握Java核心
共30章 | 51CTO王波

83人订阅学习

Mysql DBA修炼之路

Mysql DBA修炼之路

MySQL入门到高阶
共24章 | 武凤涛

468人订阅学习

读 书 +更多

Java网络编程精解

本书结合大量的典型实例,详细介绍了用Java来编写网络应用程序的技术。本书的范例都基于2018送彩金白菜网大全的JDK 1.5版本,书中内容包括:Java网络编程的...

订阅51CTO邮刊

点击这里查看样刊

订阅51CTO邮刊

51CTO服务号

51CTO播客

博聚网