|
|
51CTO旗下网站
|
|
移动端

3.8.1 混合主导对话

《实感交互:人工智能下的人机交互技术》第3章用户界面中的声控式交互技术,本书将深入讲解基于触摸、手势、语音和视觉等自然人机交互领域的技术、应用和未来趋势。本节为大家介绍混合主导对话。

作者:温秀颖 译来源:机械工业出版社|2019-02-07 16:38

3.8.1 混合主导对话

根据参考文献,Walker和Whitaker指出更为自然的交流会显示出混合主导性。在人际对话中,说话人可能会提供所问问题之外的额外信息,或让听话人改变当前执行的任务。因此,能够在混合主导设置下运行的对话系统必须对提供含有限定条件之外的信息话语有所准备。餐厅系统可能会问“你想在哪里吃?”,此时若用户仅关注了时间,他就可能回答“我们想预订7点用餐”。该回答与餐厅预约系统内的其中一个问题相关,但却不是系统所期待的针对该问题的回答。这就要求一个NLU组件能够对更为复杂的输入进行解码和阐释,而不仅仅是简单直接回答的短句。

用户给予设定问题的直接回答方式当然有很多种。例如,用户可以就问题“你想在哪里吃?”给出各种各样的描述餐厅特点的回答,如下第一列所示:

系统需要满足一个能够对应某个特定餐厅的高级预设,但尽管所提供的信息来自低预设-填值集合,这些信息仍可间接缩小可能的选项范围。要注意的是,应答可能按不同的顺序给出,分别对应不同的预设,表现出语言的自然变体。最后一个表达就是一个满足了多个预设的应答,且应用了相当复杂的自然语言描述。目标预设往往根据特定的领域进行设定;它们通常在后端数据库内对应列名。依照一组预设-填值,应用逻辑可以从后端数据库中检索结果。

NLU模块的任务是把第一列的话语映射到第二列的预设推论中。如果要高度准确地确定含义,NLU模块就必须处理语言表达和顺序的变化。NLU的一个简单策略是按照填值满足预设的模板样式配对话语:

在此简易方法中,每个短语都要求有自己的模板。更为复杂的格式配对会使用常用词组、去情景化语法,或以更清晰的语言形式体系来编写规则,使少数的规则能处理大多数的变体。但不管怎样,这些方法都需要解决配对中的语言模糊性问题。

模板或规则为可能出现的实体或关键词组提供了语境。命名实体识别(NER) 任务经常是一个单独的处理步骤,它能挑选出可识别的意向实体(如例子中的餐厅名字和菜式)的子串。像参考文献那样的机器学习途径通常用来进行命名实体检测。这些技术已经用于处理配对中的表达变化和语义歧义,但是它们需要大量的话语范例与正确的预设-填值对组合。组合好的话语随后被转化成IOB符号,其中每个单词都分到了以下其中一种标签:

I和B标签有与其相关的预设名。一个经过IOB标注的话语范例如下:

该IOB标注的话语包括了为训练机器学习算法的训练数据。此时的任务可以看作是一个序列分类的问题。序列分类的一个一般方法是单独预测序列中的各个标签。对每个单词来说,分类器需要把基于周边单词和之前标签的特征结合起来,以最佳估算出当前标签的概率。一个在概率框架内合并数据的可行方法是条件最大熵模型,如参考文献所示:

式中,ai和bi分别是i位置单词的标签和有效语境。fj(ai,bi)标明了从有效语境中抽取的解码信息的特征,它们通常包含一些以前的标签、当前的单词和一些周边单词。αi是模型的参数,它们有效地衡量了估计概率过程中各个特征的重要性。随后某个搜索程序(如Viterbi)会被用来寻找最大概率的标签序列。

针对每个可能满足预设的回答训练数据并不理想。而且,含有明显单词的特征并不会直接概括全部相同的单词。正因如此,机器学习方法常常使用外部字典。若一个单词或词组在字典中是已知值,模型就可以把该值作为一个特征。参考文献和之前的参考文献一起共同使用最大熵模型来合并语境特征以及来自外部资源的特征,如字典。总的来说,根据同现关系统计(如参考文献所示),单词能被自动分级,且基于这些分级单词的特征能够改进产生的模型的概括能力,如参考文献所示。

最近的神经网络方法如参考文献尝试利用自动生成的单词与连续向量空间的配对,假定相似的单词应该会“相近”。该方法内的特征就可以直接使用这些向量表达式的特定坐标了。

如参考文献所述的条件随机场(CRF) 是另一个序列分类模型,它能为整个标签序列生成一个单一概率,而不是每次一个标签。参考文献[64] 是CRF应用于命名实体检测的一个例子。


喜欢的朋友可以加入官方的读书群

51CTO读书频道二维码


51CTO读书会第9群:808517103

【责任编辑:book TEL:(010)68476606】

回书目   上一节   下一节
点赞 0
分享:
大家都在看
猜你喜欢

订阅专栏+更多

活学活用 Ubuntu Server

活学活用 Ubuntu Server

实战直通车
共35章 | UbuntuServer

216人订阅学习

Java EE速成指南

Java EE速成指南

掌握Java核心
共30章 | 51CTO王波

83人订阅学习

Mysql DBA修炼之路

Mysql DBA修炼之路

MySQL入门到高阶
共24章 | 武凤涛

468人订阅学习

读 书 +更多

Cisco CCNA 640-802题库

Cisco 640-802 Cisco Certified Network Associate (CCNA) Testinside CCNA 640-802 V14 2018送彩金白菜网大全题库与Testinside CCNA 640-802 Q&A 192 ...

订阅51CTO邮刊

点击这里查看样刊

订阅51CTO邮刊

51CTO服务号

51CTO播客

博聚网