智能机器人语音识别技术详细解析

最新推荐文章于 2023-11-16 09:47:47 发布

编程大乐趣

最新推荐文章于 2023-11-16 09:47:47 发布

阅读量2.9k

点赞数 2

语音控制的基础就是语音识别技术，可以是特定人或者非特定人的。非特定人的应用更为广泛，对于用户而言不用训练，因此也更加方便。语音识别可以分为孤立词识别，连接词识别，以及大词汇量的连续词识别。对于智能机器人这类嵌入式应用而言，语音可以提供直接可靠的交互方式，语音识别技术的应用价值也就不言而喻。

如今智能语音设备或者机器人很多，如智能手机（例如Cortana，Siri，Ok Google，。。。），个人助理（例如Google Home，Amazon Echo，。。。），交互式语音应答（银行，应答机，。。。。。。），语音机器人（电话机器人、客服机器人、电销机器人，……），在生活中很常见，表现都让人惊喜。同时他们工作原理也大致相同。

1 语音识别概述

语音识别技术最早可以追溯到20世纪50年代，是试图使机器能“听懂”人类语音的技术。按照目前主流的研究方法，连续语音识别和孤立词语音识别采用的声学模型一般不同。孤立词语音识别一般采用DTW动态时间规整算法。连续语音识别一般采用HMM模型或者HMM与人工神经网络ANN相结合。语音的能量来源于正常呼气时肺部呼出的稳定气流，喉部的声带既是阀门，又是振动部件。语音信号可以看作是一个时间序列，可以由隐马尔可夫模型（HMM）进行表征。语音信号经过数字化及滤噪处理之后，进行端点检测得到语音段。对语音段数据进行特征提取，语音信号就被转换成为了一个向量序列，作为观察值。在训练过程中，观察值用于估计HMM的参数。这些参数包括观察值的概率密度函数，及其对应的状态，状态转移概率等。当参数估计完成后，估计出的参数即用于识别。此时经过特征提取后的观察值作为测试数据进行识别，由此进行识别准确率的结果统计。训练及识别的结构框图如图1所示。

1620

图1 语音识别系统结构框图

1. 1 端点检测

找到语音信号的起止点，从而减小语音信号处理过程中的计算量，是语音识别过程中一个基本而且重要的问题。端点作为语音分割的重要特征，其准确性在很大程度上影响系统识别的性能。

能零积定义：一帧时间范围内的信号能量与该段时间内信号过零率的乘积。

能零积门限检测算法可以

最低0.47元/天解锁文章

编程大乐趣

关注

2
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
智能机器人语音识别技术详细解析

语音控制的基础就是语音识别技术，可以是特定人或者非特定人的。非特定人的应用更为广泛，对于用户而言不用训练，因此也更加方便。语音识别可以分为孤立词识别，连接词识别，以及大词汇量的连续词识别。对于智能机器人这类嵌入式应用而言，语音可以提供直接可靠的交互方式，语音识别技术的应用价值也就不言而喻。如今智能语音设备或者机器人很多，如智能手机（例如Cortana，Siri，Ok Google，。。。），个人助...
复制链接

扫一扫

智能机器人语音识别技术详细解析

“相关推荐”对你有帮助么？