|
|
51CTO旗下网站
|
|
移动端

3.2.5 探索:以每秒1000个单词完成填字游戏

《实感交互:人工智能下的人机交互技术》第3章用户界面中的声控式交互技术,本书将深入讲解基于触摸、手势、语音和视觉等自然人机交互领域的技术、应用和未来趋势。本节为大家介绍探索:以每秒1000个单词完成填字游戏。

作者:温秀颖 译来源:机械工业出版社|2019-02-07 16:01

3.2.5 探索:以每秒1000个单词完成填字游戏

找出联合优化的单词序列来描述声学观测简直就像是在玩填字游戏,声学得分限制了列数,而LM得分限制了行数。但是,直接考查单词序列有太多的可能性(每10万个单词可以产生1050个十单词的句子)。搜索组件的目标就是找出正确的假设,尽可能少地考查其他假设的可能性。这是通过使用许多试探策略来实现的。其中一个特别重要的策略就是定向搜索,即一个接一个地排查数据帧,使得分接近最佳假设的一组假设“存活”下来。

这需要多少计算呢?在大的词汇处理任务里,就一个典型帧来说,搜索的数据内容可能有约1000个可行的假设。为每个可行假设更新得分需要通过计算声学模型(GMM) 得分来扩展对齐,这样才能符合当前处于HMM状态下的假设,然后进行下一个状态,然后继续升级对齐。如果假设是在词尾(每帧约20个词尾假设),那么系统也需要查阅LM得分来寻找下一个可能的单词(每个词尾约100个新词)。因此,每帧我们需要约2000个GMM、1000个对齐运算和2000次LM查询。在一般100Hz的帧速下,我们要运算约20万个GMM、20万次LM查询和10万次/s的对齐更新。


喜欢的朋友可以加入官方的读书群

51CTO读书频道二维码


51CTO读书会第9群:808517103

【责任编辑:book TEL:(010)68476606】

回书目   上一节   下一节
点赞 0
分享:
大家都在看
猜你喜欢

订阅专栏+更多

活学活用 Ubuntu Server

活学活用 Ubuntu Server

实战直通车
共35章 | UbuntuServer

216人订阅学习

Java EE速成指南

Java EE速成指南

掌握Java核心
共30章 | 51CTO王波

83人订阅学习

Mysql DBA修炼之路

Mysql DBA修炼之路

MySQL入门到高阶
共24章 | 武凤涛

468人订阅学习

读 书 +更多

网络渗透测试——保护网络安全的技术、工具和过程

网络和计算机安全问题已经成为政府、企业必须面对的现实问题。应对安全威胁的途径之一就是采用渗透测试的方法模拟黑客的攻击,找出网络和计...

订阅51CTO邮刊

点击这里查看样刊

订阅51CTO邮刊

51CTO服务号

51CTO播客

博聚网