自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 资源 (5)
  • 收藏
  • 关注

原创 语音识别(三)——声学模型, 解码器技术

声源定位(续)波束形成声源定位的方法包括波束形成,超分辨谱估计和TDOA,分别将声源和阵列之间的关系转变为空间波束,空间谱和到达时间差,并通过相应的信息进行定位。波束形成是通用的信号处理方法,这里是指将一定几何结构排列的麦克风阵列的各麦克风输出信号经过处理(例如加权、时延、求和等)形成空间指向性的方法。波束形成主要是抑制主瓣以外的声音干扰,这里也包括人声,比如几个人围绕Echo谈话...

2018-08-27 10:09:00 10563 1

原创 语音识别(二)——基本框架, Microphone Array, 声源定位

基本框架语音识别系统主要有四部分组成:信号处理和特征提取、声学模型、语言模型(Language Model, LM)和解码器(Decoder)。信号处理和特征提取部分以音频信号为输入,通过消除噪音、信道失真等对语音进行增强,将语音信号从时域转化到频域,并为后面的声学模型提取合适的特征。声学模型将声学和发音学的知识进行整合,以特征提取模块提取的特征为输入,生成声学模型得分。语言模...

2018-08-20 09:38:19 17366 2

原创 语音识别(一)——概述

概述虽然现在的语音识别中,DL已经应用的非常广泛了,但是语音识别终究还是有一些领域知识的,将之归类为DL或者ML,似乎都不妥当。特形成本系列文章,用以描述automatic speech recognition的领域知识和传统方法。说起来还是要感谢DL,不然按照传统的行业划分,几乎不会有人同时研究CV和ASR。DL的出现,实际上大大降低了算法的领域迁移成本,领域知识的重要性相对下降了。...

2018-08-13 09:33:57 14194 1

原创 图像处理理论(八)——Meanshift, Camshift, Optical flow

MeanshiftMeanshift聚类Meanshift(均值漂移)首先是个聚类算法,然后才应用到目标跟踪领域。它是Keinosuke Fukunaga和Larry D. Hostetler于1975年发明的。 Keinosuke Fukunaga,日本裔美国科学家,普渡大学教授。著有《Introduction to Statistical Pattern Recogniti...

2018-08-06 10:25:50 2784

Box2D v2.3.0 用户手册中文版

Box2D v2.3.0 用户手册中文版 推介一下本人的GitHub下的Box2D镜像,相关翻译工作由该镜像维护,欢迎参与 https://github.com/antkillerfarm/box2d

2015-04-07

计算日出日落时间的源码

计算日出日落时间的源码,http://www.supercss.com源码的基础上做了修改,并改正了原算法的计算错误。(原算法计算的白天黑夜的时间长度正确,但时刻不对。)

2009-08-26

Notes On Writing Portable Programs In C(用C语言编写可移植程序的注意事项)

Notes On Writing Portable Programs In C中文翻译版

2009-05-27

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除