![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
语音识别
文章平均质量分 73
rmx4046
这个作者很懒,什么都没留下…
展开
-
MFCC:Mel频率倒谱系数
概述: MFCC:Mel频率倒谱系数的缩写。Mel频率是基于人耳听觉特性提出来的,它与Hz频率成非线性对应关系。Mel频率倒谱系数(MFCC)则是利用它们之间的这种关系,计算得到的Hz频谱特征。应用: MFCC已经广泛地应用在语音识别领域。由于Mel频率与Hz频率之间非线性的对应关系,使得MFCC随着频率的提高,其计算精度随之下降。因此,在应用中常常只使用低频MFCC,而丢弃中高频MFCC。提取流程 : MFCC参数的提取包括以下几个步骤: 1. 预滤波:CODEC前端带宽为300-3400Hz的抗混叠滤转载 2011-01-10 09:36:00 · 1796 阅读 · 1 评论 -
马尔可夫工具箱
<br /> <br />此文讲述的内容在Matlab 7.0、7.5(R2007b)中均有——马尔可夫工具箱,主要内容如下。<br /> <br />简介:马尔可夫处理是随机处理的一个典型例子——此种处理根据特定的概率产生随机输出或状态序列。马尔可夫处理的特别之处在于它的无记忆性——他的下一个状态仅依赖他的当前状态,不考虑导致他们的历史。马尔可夫处理的模型在实际应用中使用非常广泛,从每日股票价格到染色体中的基因位置都有应用。<br /> <br />马尔可夫链<br /> <br />马尔可夫模型用状态图转载 2011-04-07 20:49:00 · 999 阅读 · 0 评论 -
端点检测编程思想
算法思路:输入为归一化的语音段x和采样率Fs(1)求原始信号从每点开始的长度为Len内的短时过零率,得到crslt为每点对应的短时过零率;(2)然后进行过零率波形的平滑,其方法是对crslt做fft,去掉过零率波形中的高频,即fft谱中间置零;用ifft恢复平滑后的过零率波形为C2;(3)根据设置的过零率门限zero_threshold,将平滑后的过零率C2中不超过门限的置1;(4)计算原始信号中每点开始的FrameLength短时帧能量,得到E;(5)平滑短时能量谱得到E3,且进行归一化E3=E3./ma原创 2011-04-07 16:23:00 · 794 阅读 · 0 评论