智能家居中语音识别算法研究_语音识别之DTW算法

最新推荐文章于 2022-11-18 23:01:02 发布

thongzzz

最新推荐文章于 2022-11-18 23:01:02 发布

阅读量1.2k

点赞数

文章标签：智能家居中语音识别算法研究

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42709044/article/details/112774694

版权

本文探讨了语音识别技术，特别是在孤立词识别中广泛应用的动态时间规整（DTW）算法。介绍了语音识别的基本步骤，包括预处理、静音切除、声音分帧等，并概述了DTW算法在计算声音帧之间的距离时所采用的线性缩放和动态规划方法。

摘要由CSDN通过智能技术生成

语音识别是一种以语音为研究对象，通过语音信号处理和模式识别使得机器自动识别人类语言的高级技术，被认为是2000年至2010年间信息技术领域十大重要的科技发展技术之一。通常情况下，可以根据识别对象的不同分为三类，即孤立词识别、关键词识别和连续语音识别。其中在孤立词识别中，最常用的方法就是动态时间规整(Dynamic Time Warping，简称DTW)算法。

一、语音识别

在介绍DTW算法之前，首先简单了解一下语音识别的操作步骤。主要有5个步骤，具体流程如图1所示。

图1 语音识别流程图

1 预处理

提取真正需要分析的音频信号，主要包括静音切除和声音分帧两部分操作。其中静音切除部分主要采用的是语音活动检测(Voice Activity Detection，简称VAD)算法。声音分帧主要是通过使用移动窗函数来实现的。分帧之后各帧之间一般具有一定的交叠，如图2所示。

图2 音频分帧示意图 2

最低0.47元/天解锁文章

关注

0
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。