语音识别
gxiaoyaya
吭哧吭哧的北漂
展开
-
语音识别之----什么是语音识别中的mfcc(包括代码)
最近研究语音识别,我说的语音识别不包括语意的识别,是针对说话人的识别,即利用语音进行身份认证,说话人识别力求将语音信号中语意信息平均化,突出个性。但不论是何种第一步所需要做的工作是获得语音中包含的特征。比较常用的特征包括mfcc。所以这一节讲一下什么是mfcc特征,如何提取mfcc特征。mfcc特征全称为Mel频率倒谱系数(Mel-Frequency Ceptral原创 2017-06-21 20:01:31 · 14299 阅读 · 2 评论 -
语音识别之——mfcc什么是汉明窗,为什么加汉明窗
为什么要加汉明窗?什么叫加窗? 在信号处理中,可以说加窗处理是一个必经的过程,因为我们的计算机只能处理有限长度的信号,因此原始信号X(t)要以T(采样时间)截断,即有限化,成为XT(t)后再进一步处理,这个过程序就是加窗处理,但什么时候用什么窗呢?这时我们就要对所需用到的函数窗做一定的了解。在平时,我们用得最多的是矩形窗,这个也很容易理解,好像我们屋子里的窗口一样,透过窗口我们可以看到外面原创 2017-06-21 21:08:58 · 16194 阅读 · 4 评论 -
python处理语音,批量加噪声。
#coding=gbkimport osimport waveimport librosaimport numpy as np def add_noise(data): wn = np.random.normal(0,1,len(data)) data_noise = np.where(data != 0.0, data.astype('float64...转载 2018-12-22 19:33:58 · 6055 阅读 · 4 评论 -
python 语音加窗分帧
from__future__importdivisionfromscikits.talkboximportsegment_axisimportnumpy as npimportsoundfile as sfdefreadwav(fn):signal, sampleRate=sf.read(fn)signal-=np.mean(...原创 2019-04-28 20:22:44 · 2387 阅读 · 0 评论