基于80251的嵌入式语音识别

本文介绍了基于80251内核的嵌入式语音识别技术,包括预处理、特征提取、训练和识别四个步骤。在80251平台上,语音识别面临识别率和速度的挑战,需要考虑硬件限制,如数据存储和处理能力。文中详细讨论了80251平台的硬件条件和可用资源,并提供了算法设计和移植的策略,包括浮点算法定点化和速度优化。实验证明,80251平台的语音识别识别率可达93%以上。
摘要由CSDN通过智能技术生成

一、文档介绍

嵌入式语音识别技术在251内核的实现。

缩写、术语

解 释

Specific Person Isolated Word Speech Recognition

特定人孤立词语音识别

Endpoint detection

端点检测

Feature parameter extraction

特征参数提取

DTW

(Dynamic Time Warping) 动态时间规整

LPCC

线性预测倒谱参数

 

二、语音识别技术介绍

1.应用分类

(1)特定人与非特定人识别,特定人识别相对简单,训练者的识别率高,但非训练者的识别率很低。而非特定人不受此影响,但实现复杂,识别率也相对低一些。

(2)语音识别与身份识别,前者提取各个命令者发出的语音的共性特征,而后者提取差异性特征。基于语音的身份识别主要应用于门禁等安全领域。语音识别广泛应用于词语识别,工业控制等领域。

(3)连续与非连续(孤立词)语音识别,很明显,连续语音识别难度较大。嵌入式产品集中在孤立词语音识别方面。

(4)小词汇量和大词汇量语音识别。两者选择的方法是不一样的,会在识别率和识别速度上折中考虑。

(5)关键词识别,如在一段语音中抽取带有某个关键词的句子,或者根据哼的曲子旋律去搜索对应的歌曲等等。

本系统受限80251的计算和存储性能,主要实现基于特定人的孤立词语音识别。

 

2. 实现原理

 

语音识别主要包括:预处理、特征提取、训练和识别四个部分。

预处理主要包括去噪、预加重(去除口鼻辐射)、端点检测(检测有效语音段)等过程。

特征提取是对经过预处理后的语音信号进行特征参数分析。该过程就是从原始语音信号中抽取出能够反映语音本质的特征参数,形成特征矢量序列。主要的特征参数包括:线性预测编码参数(LPC)、线性预测倒谱参数(LPCC)、MEL倒谱参数(MFCC)等。

语音模式库:即声学参数模板,它是用聚类分析等方法,从一个讲话者或多个讲话者多次重复的语音参数中经过长时间训练得到的。

语音模式匹配:将输入语音的特征参数同训练得到的语音模式库进行比较分析,从而得到识别结果。常用的方法包括:动态时间规整(DTW)、神经网络(ANN)、隐马尔科夫(HMM)等。DTW比较简单实用,适用于孤立词语音识别。HMM比较复杂,适用于大词汇量连续语音识别。

 

三、嵌入式语音识别难点

语音识别的关键是识别率的高低。PC语音识别的识别率主

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值