|
|
51CTO旗下网站
|
|
移动端

3.2.3 使语音对齐隐马尔科夫模型(HMM)的过程

《实感交互:人工智能下的人机交互技术》第3章用户界面中的声控式交互技术,本书将深入讲解基于触摸、手势、语音和视觉等自然人机交互领域的技术、应用和未来趋势。本节为大家介绍使语音对齐隐马尔科夫模型(HMM)的过程。

作者:温秀颖 译来源:机械工业出版社|2019-02-06 18:05

3.2.3 使语音对齐隐马尔科夫模型(HMM)的过程

在语音数据流中,各个音素有长有短,因此需要校准和对齐输入帧和HMM的各状态,即已知输入语音帧O-和一个HMM的状态序列H~,一个对齐A将单语调帧数映射到HMM状态。所以系统需要找到帧数(f)和HMM状态之间的最优(即概率最高)对齐A。

这常用维特比(Viterbi)算法来完成。

对于每个假定的单词序列,系统会从字典中查找每个构成单词的音素的发音,然后用决策树来查找语境中每个音素的三音子。接着,根据三音子的序列,系统会查找HMM的状态序列。该假设的声音概率即为输入语音与这些状态最优对齐后的概率。该对齐的例子如图35所示。


喜欢的朋友可以加入官方的读书群

51CTO读书频道二维码


51CTO读书会第9群:808517103

【责任编辑:book TEL:(010)68476606】

回书目   上一节   下一节
点赞 0
分享:
大家都在看
猜你喜欢

订阅专栏+更多

活学活用 Ubuntu Server

活学活用 Ubuntu Server

实战直通车
共35章 | UbuntuServer

216人订阅学习

Java EE速成指南

Java EE速成指南

掌握Java核心
共30章 | 51CTO王波

83人订阅学习

Mysql DBA修炼之路

Mysql DBA修炼之路

MySQL入门到高阶
共24章 | 武凤涛

468人订阅学习

读 书 +更多

Cisco CCNA 640-802题库

Cisco 640-802 Cisco Certified Network Associate (CCNA) Testinside CCNA 640-802 V14 2018送彩金白菜网大全题库与Testinside CCNA 640-802 Q&A 192 ...

订阅51CTO邮刊

点击这里查看样刊

订阅51CTO邮刊

51CTO服务号

51CTO播客

博聚网