|
|
51CTO旗下网站
|
|
移动端

3.4.2 特定运算的硬件优化

《实感交互:人工智能下的人机交互技术》第3章用户界面中的声控式交互技术,本书将深入讲解基于触摸、手势、语音和视觉等自然人机交互领域的技术、应用和未来趋势。本节为大家介绍特定运算的硬件优化。

作者:温秀颖 译来源:机械工业出版社|2019-02-07 16:10

3.4.2 特定运算的硬件优化

这些传感器都会耗电,特别是在它们运行的时候,主CPU运行的程序会耗用大量电能。在开启音频系统的全部功能时,包括多个麦克风、回声消除和波束形成等都会大量耗电。制造商因此需要研制特殊的硬件以减少这些传感器的电力负荷,或依赖通常比主CPU的运行速度慢的DSP,其速度约为10MHz而不是1~2GHz。

与单一N维度高斯模型有关联的概率密度函数(PDF)如式(34)所示。一个高斯混合模型(GaussianMixtureModel)总的PDF是各个PDF的加权总数,有些系统可能有10万个或更多的PDF,可能需要被每秒估算100次。优化运算(仅计算“可能的”PDF)和模型估计(如假定协方差矩阵呈对角线形)均应用于减少计算负载。单指令多数据(SIMD)计算机硬件的出现曾是一个重大突破,因为它使这些线性代数算法能够每次处理四个或八个特征。

最近在图形处理单元(GPU)的使用上又取得了进展。一开始GPU主要用来加速3D电脑图像(特别是游戏),这会大量使用线性代数。GPU在上述那些方面帮助了PDF,但有证据表明它运算DNN的效果特别显著。

如前面所述,DNN有许多节点层,每个节点层都是几乎线性处理的结果,该线性结果被应用于每层节点层下方的节点层。有1000个节点的层是正常的,通常层数为5~10个,因此有效的应用DNN需要计算5~10个矩阵向量乘法,每个矩阵是1000×1000阶,且该计算每秒进行多次。训练DNN要耗费更大的运算资源。近期研究表明,训练非常少量的数据可花费三个月的时间,但是使用GPU可以将时间缩短至三天,时间上减少了30倍之多。


喜欢的朋友可以加入官方的读书群

51CTO读书频道二维码


51CTO读书会第9群:808517103

【责任编辑:book TEL:(010)68476606】

回书目   上一节   下一节
点赞 0
分享:
大家都在看
猜你喜欢

订阅专栏+更多

活学活用 Ubuntu Server

活学活用 Ubuntu Server

实战直通车
共35章 | UbuntuServer

216人订阅学习

Java EE速成指南

Java EE速成指南

掌握Java核心
共30章 | 51CTO王波

83人订阅学习

Mysql DBA修炼之路

Mysql DBA修炼之路

MySQL入门到高阶
共24章 | 武凤涛

468人订阅学习

读 书 +更多

Groovy入门经典

本书详细介绍脚本语言Groovy,首先介绍Groovy语言的基本特性,包括讨论Groovy方法、程序闭包、列表、映射以及对类和继承的支持,然后介绍如...

订阅51CTO邮刊

点击这里查看样刊

订阅51CTO邮刊

51CTO服务号

51CTO播客

博聚网