自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

audio_algorithm的博客

专注于音频数字信号处理领域,欢迎志同道合的朋友一起探讨!

  • 博客(24)
  • 资源 (5)
  • 收藏
  • 关注

转载 C++ STL学习

STL官网地址(具有很好的参考意义,可当使用手册):http://www.cplusplus.com/reference/stl/一、STL简介STL(Standard Template Library,标准模板库)是惠普实验室开发的一系列软件的统称。它是由Alexander Stepanov、Meng Lee和David R Musser在惠普实验室工作时所开发出来的

2017-12-25 14:58:22 691

原创 一种改进的回声消除

一种改进的回声消除图1、近端语音,图2、远端语音,图3、webrtc回声消除,图4、改进回声消除    从上图输出结果分析:webrtc回声消除在单讲模式下,回声消除较好,但在双讲模式下,近端语音吃音较严重。改进算法中的残留回声虽然比前者多,但从听觉效果来看,残留的回声非常小,对听者的收听影响较小。而在双讲模式下,近端语音保留较好,保证了在双讲模式下,能够正常收听。

2017-12-23 14:31:54 1680 8

转载 常用语音编解码介绍

常用语音编解码介绍主要的speech codec 有: G.711, G.723, G.726 , G.729, ILBC,QCELP, EVRC, AMR, SMV主要的audiocodec 有: real audio, AAC,AC3, MP3, WMA, SBC等,各种编解码都有其应用的重点领域。G.711G.711

2017-12-19 11:14:58 13959

转载 AAC编解码简介

AAC代表Advanced AudioCoding(高级音频编码),是一种由MPEG-4标准定义的有损音频压缩格式,由Fraunhofer发展,Dolby, Sony和AT&T是主要的贡献者。在使用MP4作为各种内容的容器格式的新多媒体MPEG-4标准中,它是MPEG Layer III / MP3的天然后继者。AAC能够在一条音轨中包括48条全带宽(直到96khz)音频声道,加上15条低频增强(

2017-12-19 10:20:14 9349 3

转载 Speex回声消除原理解析

这里假设读者具有自适应滤波器的基础知识。Speex的AEC是以NLMS为基础,用MDF频域实现,最终推导出最优步长估计:残余回声与误差之比。最优步长等于残余回声方差与误差信号方差之比,这个结论可以记下,下面会用到的。  对于长度为N的NLMS滤波器,误差信号定义为期望信号与估计信号之差,表示如下:则,滤波器的系数更新方程为:

2017-12-15 14:36:19 2771 1

原创 飞利浦公司音频指纹识别算法解析

飞利浦公司音频指纹识别算法解析    一个音频指纹系统通常包括两个部分:即一个计算听觉重要特征的指纹提取算法和一个在指纹数据库中进行有效搜索的比对算法.当要识别一段未知音频时,首先按照指纹提取算法计算其音频特征,然后和数据库中存储的大量音频指纹相比对从而进行识别.一个有效的指纹提取算法和指纹比对算法能够在数据库中正确识别出可能经受各种信号处理失真的未知音频的原始版本.若识别到对应的原始指纹

2017-12-13 15:11:02 5460 6

原创 一种时域扩频音频水印技术的实现

典型的数字音频水印系统如下图所示: 常见水印算法:1、  利用音频掩蔽现象的水印技术2、  最低比特位水印算法3、  回声隐藏技术4、  相位编码水印技术5、  基于扩频技术的时域水印算法——比较流行的算法,保密性好,对音频压缩、低通滤波、噪声干扰抵抗性好,但嵌入数据较少,对同步攻击抵抗差。基于扩频技术的算法是稳健性水印的奠基性算法。6、  基于量化索引调制的时域水

2017-12-13 11:46:07 4940 1

原创 回声消除总结

回声消除系统简介一个完整的回声消除系统如上图所示,一般包括对讲检测,线性自适应滤波器,残余回声消除器(一般用NLP滤波)。当然根据具体的应用场景,可能还需要延时对齐模块,舒适噪声模块。其中延时对齐模块对整个系统的性能影响非常大,它主要用于补偿数据播放与数据采集之间的时延差。当然对于一些实时性较好的系统,如DSP平台,这种时延差较少,对性能影响不大。Speex

2017-12-11 15:48:14 13130 9

原创 预加重/去加重/直流滤波

预加重(Pre-emphasis):输入信号高频分量的提升。去加重(De-emphasis) :解调后对高频分量的压低。一般预加重与去加重需配合使用。speex中处理:设第n时刻的语音采样值为x(n),经过预加重处理后的结果是y(n)=x(n)-ax(n-1)去加重处理与预加重处理相反:y(n) = x(n) + ax(n-1)其中a为加重系数,一般是0.9~1.0

2017-12-07 11:46:49 6912 1

转载 频域自适应滤波器的理解

2017-12-05 19:34:45 4675 3

转载 自适应滤波(回声消除)

时域:----------------------------------------------------------------------------------------------------------------------LMS滤波器参数更新公式: 权重更新收到输入信号的能量影响较大,输入信号能量越大,步长取值应该较小,保证不容易

2017-12-05 17:11:46 7868

转载 自适应滤波:LMS/NLMS

转自:http://www.cnblogs.com/xingshansi/p/6658203.html 前言西蒙.赫金的《自适应滤波器原理》第四版第五、六章:最小均方自适应滤波器(LMS,Least Mean Square)以及归一化最小均方自适应滤波器(NLMS,Normalized Least Mean Square)。全文包括:  1)LMS与维纳滤波器(Wiener F

2017-12-05 13:47:47 9974 2

转载 自适应陷波器

转自:http://blog.csdn.net/HJ199404182515/article/details/71527011#comments    陷波器顾名思义就是对特定频率的信号有着很强的衰减的滤波器,也即阻带带宽极窄的带阻滤波器。在传统的数字陷波器设计中,为了能使某一频率信号得到足够大的衰减,通常的做法就是把阶数选的足够高来达到很大的衰减;但同时计算量也变得更大了。而且设计的过程

2017-12-05 11:42:33 12019 1

转载 源码网站收藏

1.51源码:http://www.51aspx.com/2.源码之家:http://www.codejia.com/3.源码网:http://www.codepub.com/4.虾客源码:http://www.xkxz.com/5.源码开发网:http://www.codedn.com/6.洪越源代码:http://www.softhy.net/7.锋网源码:http:/

2017-12-05 10:56:46 737

原创 一种主瓣宽度可调的固定波束形成器

一种主瓣宽度可调的固定波束形成器延时求和波束形成首先需要知道时延量,时延估计的精准度对波束形成最终的效果有较大的影响。在实际的一些应用场景中,声源信息是可以预先确定在某一范围的。如室内会议场景,当演讲者正对阵列话筒时,此时的声源入射角可以确定为90度,当说话人小范围的移动时,声源入射角度并不能精确确定,只能大概知道入射角范围。针对这种场景,设计出一种波束主瓣宽度可随声源入射范围调整的固定波束形

2017-12-05 10:09:45 3190 15

原创 固定波束形成技术

固定波束形成技术所谓固定波束形成是指波束形成过程中,滤波器权值固定不变。一旦阵列的几何形状、目标方向确定,其波束模式特性也将确定。该方法简单,运算量低,一般用在电话会议场景,对非相干噪声效果较好,如空间白噪声。然而,如果噪声源是相干的,降噪的程度依赖于噪声的方向,在室内混响场景下,并不能获得很好的效果。 上图是固定波束形成的基本框架,包括两个基本步骤: 1、估计每个传感器与参考

2017-12-04 17:47:02 8495 5

转载 数字阵列麦克风处理技术概述

转载自地平线机器人大讲堂,主讲人徐荣强。2011年11月毕业于英国爱丁堡大学通信与信号处理专业,曾任诺基亚,联想,微软高级音频工程师。现在Horizon-Robotics负责语音相关硬件系统设计,涉及远场高灵敏度麦克风阵列设计,高精度音频硬件编解码器评估验证,远场语音前处理算法的评估验证,涉及声源定位,波束形成,盲信号分离,回声抑制及平稳降噪等相关技术算法。前言随着

2017-12-04 15:44:48 5460

原创 介绍一种音频信号分类方法

能用来区分语音和音乐信号的音频特征有很多种,如感觉特性、能量、功率谱和Mel频标倒谱(MFCC)系数,能量、平均过零率、基频和功率谱峰值等。以下介绍一种基于子带音调个数比与频谱倾斜度相结合的区分方法。一、基本原理    不同类型的音频,其音调分量在各个子带的分布有所不同。语音的音调分量绝大部分分布在低频处,而音乐的音调分量在各个子带的分布则相对较均匀。利用该特性可区分音乐与语音信号。由

2017-12-04 14:32:33 8378 1

原创 speex降噪算法流程介绍与算法原理

一、speex降噪流程介绍本文对speex去噪算法步骤做一些简要整理和介绍,以提供给对该算法感兴趣的读者。

2017-12-01 15:48:52 12587 2

转载 WebRtc/Speex AEC matlab代码分析

自适应回声消除算法欢迎留言交流AEC算法早期用在Voip,电话这些场景中,自从智能设备诞生后,智能语音设备也要消除自身的音源,这些音源包括音乐或者TTS机器合成声音。本文基于开源算法阐述AEC的原理和实现,基于WebRTC和speex两种算法,文末会附上两种算法的matlab实现。回声消除原理回声消除的基本原理是使用一个自适应滤波器对未知的回声信道:

2017-12-01 11:57:51 9202 7

转载 回声消除方案对比

从应用平台来看,可以把回声消除分为两大类:    (1). 基于DSP等实时平台的回声消除技术    (2). 基于Windows等非实时平台的回声消除技术两者的技术难度和重点是不一样的。 三、基于DSP平台的回声消除技术回声消除技术传统的应用领域是各种嵌入式设备,包括各种电信网络设备和终端设备。比如交换机,网关等网络设备; 移动电话,视频会议等终端

2017-12-01 11:01:45 9669 2

转载 回声消除概述

来源 http://av.imaschina.com一、 回音消除技术的基础概念     回音消除已经替代了早期的回音抑制,回音抑制最早始于20世纪50年代,在卫星通讯环境中用来控制由于比较长的信号延时而听到的回音。最早的回音消除理论在20世纪60年代在AT&T贝尔实验室中发展起来,但是直到20世纪70年代末,由于受到电子行业的技术能力限制,商用回音消除产品一直没有取得太大的发展。

2017-12-01 10:58:48 3197

转载 Speex 回声消除流程分析

先说明下,这里的代码流程是修改过的Speex流程,但与Speex代码差异不大,应该不影响阅读。 (1)用RemoveDCoffset函数进行去直流(2)远端信号预加重后放入x[i+frame_size],近端信号预加重后放入input缓冲区(3)前M-1帧的远端频域信号移位,为当前帧频域信号腾出空间(4)用spx_fft函数进行FFT变换,变换后的系数存在X中(5)计算当前

2017-12-01 10:54:32 1587

转载 webrtc 的回声抵消(aec、aecm)算法简介

webrtc 的回声抵消(aec、aecm)算法主要包括以下几个重要模块:1.回声时延估计 2.NLMS(归一化最小均方自适应算法) 3.NLP(非线性滤波) 4.CNG(舒适噪声产生),一般经典aec算法还应包括双端检测(DT)。考虑到webrtc使用的NLMS、NLP和CNG都属于经典算法范畴,故只做简略介绍,本文重点介绍webrtc的回声时延估计算法,这也是webrtc回声抵消算法区别一般算

2017-12-01 10:37:59 1165 1

Download.zip

一些可以参考的行业文档知识,供学习用EVRC--ns

2019-11-29

Design of circular differential microphone array (1).pdf

Design of circular differential microphone array,

2019-06-12

识别引擎解码1 pass VS 2 pass

识别引擎搜索策略对比,传统2 pass 方法 与 1 pass 方法(WFST)对比

2019-03-27

语音识别基本法

HMM-GMM,HMM-DNN语音识别原理介绍,比较基础,易懂。适合入门者

2019-03-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除