语音识别方法_笔记

语音识别方法

基于参数模型的隐马尔科夫模型(HMM)的方法和基于非参数模型的矢量量化(VQ)的方法。

基于人工神经网络(ANN)的语音识别方法。

传统的会与动态时间规划的算法(DTW),在连续语音识别中仍然是主流方法。同时,在小词汇量、孤立字识别系统中,也已有许多改进的DTW算法被提出。提高系统的识别性能,利用概率尺寸的DTW算法进行孤立字识别的方法,取得较好的识别效果。

在语音识别中,一般采用K平均最临近(K-NN)准则来进行决策。因此选择适当的各种距离测度是问题的关系。往往需要通过实验多次调整这些门限值才能得到满意的识别结果。

 

HMM模型的不足,特征矢量的输出概率计算以及输入语音和语音模型的匹配搜索将占用很大的时间。

 

语音识别系统的基本数据库

语音识别系统中包含了大量的控制参数信息,这些参数以数据库的形式存储在计算机中,构成了语音识别系统的基本数据库。包括词汇表、语音声学模型、语音模型参数等。它们是通过“训练”的方法,从单讲话者或多讲话者的多次重复发音的语音参数以及大量的语法规则中,经过长时间的训练而聚类得到的。在汉语语音识别尤其是汉语连续语音识别中,必须零这些文本等信息才能提高识别精度。

  1. 单词词典和语法
  2. 词典编辑、文本开发和工具
  3. API

 

语音识别原理和识别系统的组成

  1. 预处理和参数分析
  2. 抗噪声
  3. 语音区间的端点检测

目的:从包含语音的一段信号中确定语音的起点和终点。有效的端点检测不仅能使处理时间减到最小,而且能排除无声段的噪声干扰,从而使识别系统 具有良好的识别性能。

  1. 语音参数分析

目的:抽取语音特征,以使在语音识别时类内距离尽量减小,类间距离尽量大。特征参数选择的好坏直接影响语音识别的精度。

 

动态时间规整

不能简单地将输入参数序列和相应参数模板直接做比较,因为语音信号具有相当大的随机性。在进行模板匹配时,这些时间长度的变化会影响测度的估计,从而使识别率降低,因此时间规整处理是必不可少的。

一种简单的方法是采用对未知语音信号线性地伸长或缩短直至它与参数模板的长度相一致。然而这种仅仅利用亚扩时间轴的方法不足以实现精确的对正。研究表明,这种简单方法在大部分识别系统中不能有效地提高识别率。

DTW不断计算两矢量之间的距离以寻找最优的匹配路径,所以得到的两矢量匹配时累计距离最小的规整函数,保证了他们之间存在最大的声学相似特性。

 

孤立字识别系统

顾名思义是识别孤立发音的字或词。由于在孤立字(词)识别中,单词之间有停顿,可使识别问题简化;单词之间的端点检测比较容易。

识别方法:

  1. 采用判别函数或准则的方法。贝叶斯准则,概率统计的方法。
  2. 采用DTW的方法,字音的起始点相应于路径的起始点。最优路径起点至终点的距离即为待识别语音与模板语音之间的距离。运算量大,但技术上简单,识别正确率也较高。
  3. 再用矢量量化的方法。矢量量化技术在语音识别的应用方面,尤其是在孤立字语音识别系统中得到了很好的应用。
  4. 采用HMM技术的方法。HMM的各状态输出概率密度函数即可能用离散概率分布函数表示,也可以用连续概率函数。一般连续隐马尔科夫模型要比离散隐马尔科夫模型 计算量大,但识别正确率高。
  5. 人工神经网络
  6. 采用混合技术的方法。为了弥补单一方法的局限性,采用把几种方法组合起来的办法。

在语音识别中,孤立单词识别时基础。词汇量的扩大、识别精度的提高和计算发咋的的降低是孤立字识别的3个主要目标。关键问题是特征的选择和提取、失真测度的选择以及匹配算法的有效性。矢量量化技术则为特征参数提取和匹配算法提供了一个很好的降低运算复杂度的方法。

 

连接语音识别系统系统的性能评测

1.连续语音识别系统的评测方法以及系统发展性和识别能力的测度

评测比较重使用的标准系统的一般配置是:使用LPCMCC(LPC美尔倒谱系数)或者MFCC特征参数、Bi-Gram语音模型以及2段DP匹配法(由基元模型联结得到最佳单词序列)等。

系统识别性能的评价测度主要由系统识别率、信息损失度、使系统的识别率和人的听取率相当而应附加给系统的噪声级别大小。

粗略地评估某个系统,可以从两个方面去考虑:

  1. 系统识别任务的难易程度及复杂化性
  2. 采用该系统该系统的识别方法对该难度的识别任务的识别效果即识别精确性。

一、评价连续语音识别系统性能的系统识别率等测度

二、评价系统识别任务复杂性的测度

表示在语言模型规定下的系统识别任务复杂性的测度主要由系统静态分支度和平均输出度、系统识别任务的熵和识别单位的分支度。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值