自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

icoolmedia的博客

音频、视频行业观察与技术思考

  • 博客(8)
  • 收藏
  • 关注

原创 语音增强原理之增益因子

上次关于语音增强的原理讲说了噪声估计问题,这次打算说下增益因子如何确定,也就是当噪声已知后,如何进行去噪的问题(把增益因子与带噪语音相乘即可)。这里主要说下MMSE滤波,顺带说下谱减法、维纳滤波。当然也有其它方式来实现语音增强的,比如基于矩阵分解原理的子空间法、基于自适应滤波器的降噪,有的方法icoolmedia比较清楚,有的也还在学习之中,同时也欢迎各位朋友就不足之处批评指正。  先说下经典

2016-07-04 12:47:27 3170 2

原创 语音增强原理之噪声估计

语音增强的整个过程,通常假设噪声为加性随机平稳噪声,且语音短时平稳,下面的原理描述中,都是在这两个假设前提之下来做的。整个语音增强的流程大致可以分为两大部分  一、噪声估计  二、衰减因子(有的地方也叫做增益因子)的计算   最后,把衰减因子应用于带噪语音,就可以得到我们期望的“纯净语音”。语音增强最难的部分,应该是噪声估计,而不是衰减因子的确定。因些这里重点说下噪声估计部分,要进

2016-06-08 12:38:48 9467 1

原创 线性预测与Levinson-Durbin算法实现

在学习信号处理的时候,线性预测是一个比较难理解的知识点,为了加快很多朋友的理解,这里给出Levinson-Durbin算法的线性预测实现和一个测试Demo,Demo中很明确的把输入信号、预测信号、预测误差打印了出来,这样就能以最直观的方式,把线性预测的实现与作用展示出来。话不多说,直接上代码!typedef float OsFlt32;typedef int  OsInt32;OsFlt

2016-06-10 18:02:35 10579

原创 LMS、NLMS最优步长理论分析与Speex回声消除可能的改进想法

一、回声消除算法模型  先来分析下自适应回声消除的主要组成部分,大体上可以把回声消除模型分为两个部分横向滤波器结构滤波器系数自适应与步长控制  横向滤波器用脉冲响应w(n)【有的地方也称为回声路径】与远端说话者信号u(n)卷积得到回声估计,并用y(n)表示该估计。麦克风输出信号做为期望响应d(n),从期望响应d(n)中减去滤波器的”合成回声”,得到误差信号e(n)。通过不断的调整滤

2016-06-10 17:59:39 2870

原创 傅里叶分析笔记

由于工作中经常会用到傅里叶分析方法、不得不对它基本思想做一些深入的思考。这里记录下我对傅立叶分析的学习过程中真正加深自己印象的一些推导过程,希望对其它朋友能有所帮助、初学时,能看些浅显易懂的图文分析对理解的帮助是非常大的,至少能让你很快的理解主要思路而不至于陷入大量的公式推导之中,但初步理解了之后,要深入下去,是应该好好理解下推导过程的。  傅里叶分析法建立在一个基本的认知基础之上:周期信号可

2016-06-06 13:14:50 1153

原创 音频处理中的尺度--Bark尺度与Mel尺度

由于人耳对声音的感知(如:频率、音调)是非线性的,为了对声音的感知进行度量,产生了一系列的尺度(如:十二平均律),这里重点说下Bark尺度与Mel尺度。刚开始的时候,我自己也没弄明白这两个尺度的区别。后来才逐渐的明白他们的思考出发点,这里简单分享出来。   Bark(巴克)频率尺度是以Hz为单位,把频率映射到心理声学的24个临界频带上,第25个临界频带占据约:16K~20kHz的频率,1个

2016-06-06 13:08:37 6584 1

原创 房间声学原理与Schroeder混响算法实现

一、混响时间的计算与预测所谓混响就是声音的直达声与反射声很紧凑的重合在一起时人耳所听到的声音,这个效果在语音的后期处理时特别有用。能产生混响最常见的场景就是房间内,尤其是空旷的房间中。混响有直达声,早期反射和后期反射声组成。其中直达声是声源信号不经过任何障碍物直接到达人耳的那部分、早期反射声由一次或者几次反射的声音信号组成、后期反射声由随后更多次的反射声音信号组成。混响效果的空间感主要由早

2016-05-06 11:50:10 9795 3

原创 Speex回声消除代码分析

先说明下,这里的代码流程是修改过的Speex流程,但与Speex代码差异不大,应该不影响阅读。 (1)用RemoveDCoffset函数进行去直流(2)远端信号预加重后放入x[i+frame_size],近端信号预加重后放入input缓冲区(3)前M-1帧的远端频域信号移位,为当前帧频域信号腾出空间(4)用spx_fft函数进行FFT变换,变换后的系数存在X中(5)计算当前

2016-05-04 12:45:58 3642 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除