- 博客(3)
- 资源 (2)
- 收藏
- 关注
原创 Mel倒谱的缺陷。Defeat of Mel Frequency Cepstrum Coefficients
首先Mel Spectrum是对FFT后的频谱的采样,而且使用了三角函数采样。这样在采样中心的频率会被分配到两个不同的Mel频谱点。使得特征不能很好的反映声音信号。其次,MFCC所有特征针对固定频率。因此需要训练。即使同一个声源在不同的频率(音高)发声,其特征也不同。...
2010-12-29 15:44:26 337
原创 Speech Recognition Terms
Hamming Window by J.O. Smith 也就是Raised Cosine Window。以一个2PI周期的Cosine函数加权一个信号序列。Mel Freqeuncy Cepstrum Coeffients(MFCC)
2010-12-22 09:39:45 82
原创 Sphinx值得改进的地方。
1、识别模型 Sphinx为代表的Speech Recognition(SR)系统中,主要应用的模型都是HMM。也就是一个元素的识别主要依据之前的若干元素,而与其后的元素无关。这是一个比较重大的缺陷。其他模型可以更好的处理这个问题,如Bayesian或CRF。2、复杂的数据结构影响性能 Sphinx4的数据结构较为复杂,而且应用了很多Java中的泛型、List、重载、接口等技术...
2010-12-21 12:00:06 133
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人