自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 资源 (2)
  • 收藏
  • 关注

原创 Mel倒谱的缺陷。Defeat of Mel Frequency Cepstrum Coefficients

首先Mel Spectrum是对FFT后的频谱的采样,而且使用了三角函数采样。这样在采样中心的频率会被分配到两个不同的Mel频谱点。使得特征不能很好的反映声音信号。其次,MFCC所有特征针对固定频率。因此需要训练。即使同一个声源在不同的频率(音高)发声,其特征也不同。...

2010-12-29 15:44:26 337

原创 Speech Recognition Terms

Hamming Window by J.O. Smith 也就是Raised Cosine Window。以一个2PI周期的Cosine函数加权一个信号序列。Mel Freqeuncy Cepstrum Coeffients(MFCC) 

2010-12-22 09:39:45 82

原创 Sphinx值得改进的地方。

1、识别模型 Sphinx为代表的Speech Recognition(SR)系统中,主要应用的模型都是HMM。也就是一个元素的识别主要依据之前的若干元素,而与其后的元素无关。这是一个比较重大的缺陷。其他模型可以更好的处理这个问题,如Bayesian或CRF。2、复杂的数据结构影响性能 Sphinx4的数据结构较为复杂,而且应用了很多Java中的泛型、List、重载、接口等技术...

2010-12-21 12:00:06 133

c# DAWG构造与搜索算法

DAWG (Directed Acyclic Word Graph)被用于字典等数据检索应用。 欢迎评测。如有改进需求,可以提出。

2013-05-21

Internet Explorer缓存浏览器

可以浏览Internet Explorer的缓存文件

2012-04-16

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除