- 博客(4)
- 资源 (5)
- 收藏
- 关注
原创 语音识别(三)——声学模型, 解码器技术
声源定位(续)波束形成声源定位的方法包括波束形成,超分辨谱估计和TDOA,分别将声源和阵列之间的关系转变为空间波束,空间谱和到达时间差,并通过相应的信息进行定位。波束形成是通用的信号处理方法,这里是指将一定几何结构排列的麦克风阵列的各麦克风输出信号经过处理(例如加权、时延、求和等)形成空间指向性的方法。波束形成主要是抑制主瓣以外的声音干扰,这里也包括人声,比如几个人围绕Echo谈话...
2018-08-27 10:09:00 10563 1
原创 语音识别(二)——基本框架, Microphone Array, 声源定位
基本框架语音识别系统主要有四部分组成:信号处理和特征提取、声学模型、语言模型(Language Model, LM)和解码器(Decoder)。信号处理和特征提取部分以音频信号为输入,通过消除噪音、信道失真等对语音进行增强,将语音信号从时域转化到频域,并为后面的声学模型提取合适的特征。声学模型将声学和发音学的知识进行整合,以特征提取模块提取的特征为输入,生成声学模型得分。语言模...
2018-08-20 09:38:19 17366 2
原创 语音识别(一)——概述
概述虽然现在的语音识别中,DL已经应用的非常广泛了,但是语音识别终究还是有一些领域知识的,将之归类为DL或者ML,似乎都不妥当。特形成本系列文章,用以描述automatic speech recognition的领域知识和传统方法。说起来还是要感谢DL,不然按照传统的行业划分,几乎不会有人同时研究CV和ASR。DL的出现,实际上大大降低了算法的领域迁移成本,领域知识的重要性相对下降了。...
2018-08-13 09:33:57 14194 1
原创 图像处理理论(八)——Meanshift, Camshift, Optical flow
MeanshiftMeanshift聚类Meanshift(均值漂移)首先是个聚类算法,然后才应用到目标跟踪领域。它是Keinosuke Fukunaga和Larry D. Hostetler于1975年发明的。 Keinosuke Fukunaga,日本裔美国科学家,普渡大学教授。著有《Introduction to Statistical Pattern Recogniti...
2018-08-06 10:25:50 2784
Box2D v2.3.0 用户手册中文版
2015-04-07
计算日出日落时间的源码
2009-08-26
Notes On Writing Portable Programs In C(用C语言编写可移植程序的注意事项)
2009-05-27
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人