音频处理
文章平均质量分 69
icoolmedia
这个作者很懒,什么都没留下…
展开
-
Speex回声消除代码分析
先说明下,这里的代码流程是修改过的Speex流程,但与Speex代码差异不大,应该不影响阅读。 (1)用RemoveDCoffset函数进行去直流(2)远端信号预加重后放入x[i+frame_size],近端信号预加重后放入input缓冲区(3)前M-1帧的远端频域信号移位,为当前帧频域信号腾出空间(4)用spx_fft函数进行FFT变换,变换后的系数存在X中(5)计算当前原创 2016-05-04 12:45:58 · 3656 阅读 · 1 评论 -
房间声学原理与Schroeder混响算法实现
一、混响时间的计算与预测所谓混响就是声音的直达声与反射声很紧凑的重合在一起时人耳所听到的声音,这个效果在语音的后期处理时特别有用。能产生混响最常见的场景就是房间内,尤其是空旷的房间中。混响有直达声,早期反射和后期反射声组成。其中直达声是声源信号不经过任何障碍物直接到达人耳的那部分、早期反射声由一次或者几次反射的声音信号组成、后期反射声由随后更多次的反射声音信号组成。混响效果的空间感主要由早原创 2016-05-06 11:50:10 · 9922 阅读 · 3 评论 -
语音增强原理之噪声估计
语音增强的整个过程,通常假设噪声为加性随机平稳噪声,且语音短时平稳,下面的原理描述中,都是在这两个假设前提之下来做的。整个语音增强的流程大致可以分为两大部分 一、噪声估计 二、衰减因子(有的地方也叫做增益因子)的计算 最后,把衰减因子应用于带噪语音,就可以得到我们期望的“纯净语音”。语音增强最难的部分,应该是噪声估计,而不是衰减因子的确定。因些这里重点说下噪声估计部分,要进原创 2016-06-08 12:38:48 · 9506 阅读 · 1 评论 -
音频处理中的尺度--Bark尺度与Mel尺度
由于人耳对声音的感知(如:频率、音调)是非线性的,为了对声音的感知进行度量,产生了一系列的尺度(如:十二平均律),这里重点说下Bark尺度与Mel尺度。刚开始的时候,我自己也没弄明白这两个尺度的区别。后来才逐渐的明白他们的思考出发点,这里简单分享出来。 Bark(巴克)频率尺度是以Hz为单位,把频率映射到心理声学的24个临界频带上,第25个临界频带占据约:16K~20kHz的频率,1个原创 2016-06-06 13:08:37 · 6874 阅读 · 1 评论 -
语音增强原理之增益因子
上次关于语音增强的原理讲说了噪声估计问题,这次打算说下增益因子如何确定,也就是当噪声已知后,如何进行去噪的问题(把增益因子与带噪语音相乘即可)。这里主要说下MMSE滤波,顺带说下谱减法、维纳滤波。当然也有其它方式来实现语音增强的,比如基于矩阵分解原理的子空间法、基于自适应滤波器的降噪,有的方法icoolmedia比较清楚,有的也还在学习之中,同时也欢迎各位朋友就不足之处批评指正。 先说下经典原创 2016-07-04 12:47:27 · 3186 阅读 · 2 评论 -
LMS、NLMS最优步长理论分析与Speex回声消除可能的改进想法
一、回声消除算法模型 先来分析下自适应回声消除的主要组成部分,大体上可以把回声消除模型分为两个部分横向滤波器结构滤波器系数自适应与步长控制 横向滤波器用脉冲响应w(n)【有的地方也称为回声路径】与远端说话者信号u(n)卷积得到回声估计,并用y(n)表示该估计。麦克风输出信号做为期望响应d(n),从期望响应d(n)中减去滤波器的”合成回声”,得到误差信号e(n)。通过不断的调整滤原创 2016-06-10 17:59:39 · 2887 阅读 · 0 评论