自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

音频算法研究与学习

欢迎大家交流音视频算法

  • 博客(20)
  • 资源 (1)
  • 收藏
  • 关注

原创 Subband AF 和Block transforms AF的比较

Subband AF 和Block transforms AF的比较标签(空格分隔): 自适应滤波器实际上,一种block变换,例如DFT或者是DCT,可以看成是一种临界的降采样滤波器组。这种滤波器组看错是0阶多项式组合矩阵,例如E[z]=AH\mathbf{E}[z] = \mathbf{A}^{H},其中A就是单位正交矩阵,任何的单位矩阵都是仿酉矩阵。变化矩阵的基函数就是带通滤波器,例如DFT的

2017-11-10 12:42:13 1329 1

原创 音频算法学习和应用谱图

音频算法学习和应用谱图做音频算法也7年了,非常庆幸在读研期间就确定了方向,尽早切入了这个行业。这些年主要工作集中在前处理方面,不少比较年轻的同志,或者是刚刚开始研究生生涯的同学,会问到我:“如何学习音频算法?”,“要看些什么书。”,“需要具备学习的知识?”。对这些基础问题的思考往往可以扩展对知识的理解,我就在这简单聊聊对音频算法学习的看法。 首先,说到学习,一定是辛苦的,只有下了苦功夫才能把事情做

2017-07-20 20:16:06 16646 13

原创 Vim 必备插件

Vim 必备插件1、介绍这篇文章介绍vim在linux命令行下的基本轻量级必备插件,运行环境是c/C++语言,也可以用于java,php等语言。这些必要插件包括ctag,taglist,NERDTree,和ag这四个。 有朋友问4个插件会不会少了一点,自动补全怎么办?跳转引用文件怎么办?语法检查怎么办?我一直坚信,“Less is more.”因此尽量用这几个插件的扩展以及vim本身的衍生功能解决

2017-04-29 16:14:38 3017

原创 《在近端对回传音频的检测和抑制》笔记

标签(空格分隔): 未分类综述这个专利是Polycom的一份国际专利,主要是目的是使用信号匹配的方法在远端/扬声器链路(farend)在做一次回声消除。 下面图2是其结构图。 图2的结构图比现有的方案图1多了一个远端回声检测和消音模块。我们知道,扬声器20放出来的声音,经过声学回路11会产生回声,并且该回声会被麦克风40采集到。如果经过了回声消除器30,该回声没有被消除干净,出于对端16的通

2017-03-28 10:26:23 2473 2

原创 Webrtc AGC 算法原理介绍(六)

Webrtc AGC 算法原理介绍(六)零、前言本系列介绍Webrtc的agc算法。webrtc的agc算法对各种情况作了较为详尽的考虑,而且使用了的定点数的方法来实现,因此内容比较多。尽量在这几篇文章中描述清楚。

2017-02-06 10:05:41 11766 17

原创 #Webrtc AGC 算法原理介绍(五)

Webrtc AGC 算法原理介绍(五)零、前言本系列介绍Webrtc的agc算法。webrtc的agc算法对各种情况作了较为详尽的考虑,而且使用了的定点数的方法来实现,因此内容比较多。尽量在这几篇文章中描述清楚。一、WebRtcAgc_AddFarend该函数调用了WebRtcAgc_AddFarToDigital函数,其中仅仅是对远端使用WebRtcAgc_ProcessVad函数。该函数的目的

2017-02-03 11:00:47 7264 5

原创 读《身边的逻辑学有感》

逻辑学是研究人思维规律的学科。是一门非常有意思的基础学科。逻辑学追求的是确定性,一致性,也即是是否能确定的从给定的假设获得确定无疑的结论。 我认为《身边的逻辑学》这本书主要探讨的不是推理的过程,而是描述给定假设的真伪,以及书中讲述的统一场理论,其根本的想法就是要求给出结论的人给出“充分”的证据。只有充分的证据才是推导结论的基础。 文中认为充分的证据的定义是有意思的,首先给出的不是“充分的证据”的

2017-01-23 10:34:11 3610

原创 Webrtc AGC 算法原理介绍(四)

Webrtc AGC 算法原理介绍(四)零、前言本系列介绍Webrtc的agc算法。webrtc的agc算法对各种情况作了较为详尽的考虑,而且使用了的定点数的方法来实现,因此内容比较多。尽量在这几篇文章中描述清楚。一、WebRtcAgc_ProcessAnalogWebRtcAgc_ProcessAnalog函数的作用是把输入的信号根据能量的大小,饱和标志(WebRtcAgc_Staturation

2017-01-23 09:45:22 9382

原创 Webrtc AGC 算法原理介绍(三)

零、前言本系列介绍Webrtc的agc算法。webrtc的agc算法对各种情况作了较为详尽的考虑,而且使用了的定点数的方法来实现,因此内容比较多。尽量在这几篇文章中描述清楚。一、WebRtcAgc_AddMicWebRtcAgc_AddMic用在自适应模拟模式下(kAdaptiveAnalog),其流程如下: WebRtcAgc_AddMic 流程图 这个流程第一步是根据帧长和采样率继续分帧

2016-10-18 13:33:37 21474 10

原创 Webrtc AGC 算法原理介绍(二)

音频算法零、前言本系列介绍Webrtc的agc算法。webrtc的agc算法对各种情况作了较为详尽的考虑,而且使用了的定点数的方法来实现,因此内容比较多。尽量在这几篇文章中描述清楚。

2016-09-20 14:37:36 16401

原创 Webrtc AGC 算法原理介绍(一)

Webrtc AGC 算法原理介绍(一)标签(空格分隔): 音频算法零、前言本系列介绍Webrtc的agc算法。webrtc的agc算法对各种情况作了较为详尽的考虑,而且使用了的定点数的方法来实现,因此内容比较多。尽量再这几篇文章中描述清楚。一、AGC模块的结构与简介较新的webrtc已经把原来的agc模块移动到了一个叫做legacy的文件夹。这个回头再写文章详细介绍。我还是从旧的agc算法开始讲起

2016-09-19 19:03:52 28876

原创 C/C++ 实现htonf和ntof的两种方法

数字在计算机中两种储存数据的方式:1. Little endian:将低序字节存储在起始地址;2. Big endian:将高序字节存储在起始地址。一般来说主机序是小端的,网络序是大端的。htonl、htons和ntohl、ntohs是常见的函数,htonl、htons用于32位何16位数据小端字节序到大端字节序的转换,ntohl、ntohs用于32位何16位数据大端字节序到小端字节序的转换。

2016-08-30 11:33:31 3474 1

原创 读《程序员的职业素养》有感

今天读完了《程序员的职业素养》作者是Robert C. Martin。感触很深,下面按顺序记录印象深刻的内容。1、不要破坏程序的功能是对的,但是一个经常修改的程序却更加便于移植,因为它迭代次数多,进化的完善,因此代码要在保持功能的情况下经常修改。在书中介绍,保持功能的一个好方法就是实行TDD。2、作为用会了C语言还应该用用其他的语音,不应该有语言障碍。下一步学习JAVA和LISP。3、

2016-03-02 19:37:05 1234

原创 音频界的瑞士军刀 --- SoX - Sound eXchange 国外开源音频处理软件介绍(一)

今天我给大家介绍一款自称是音频处理界的瑞士军刀的一款开源软件,SoX - Sound eXchange。引用主页上介绍的原话:        Welcome to the home of SoX, the Swiss Army knife of sound processing programs.该软件的主页是http://sox.sourceforge.net/,文章介绍不详细的地方大家

2015-10-14 14:23:47 11406 1

原创 A Review of Algorithms for Audio Fingerprinting笔记

前段时间研究回声消除中的延时估计方法,了解了A

2014-10-28 16:35:17 2686 1

原创 Fitting the Mel Scale笔记

S. Umesh, L. Cohen, and D. Nelson [1999]: ``Fitting the Mel-Scale,'' Proc. IEEE International Conference on Acoust. Speech, Signal Processing, (ICASSP Phoenix, Arizona, USA), Vol. 1, pp. 217-220, Ma

2014-10-23 10:15:06 2060

原创 Bark域介绍和线性频率域转换到Bark域

摘要:本文介绍Bark域相关知识以及线性频率域转换到Ba

2014-10-22 11:11:35 18949

原创 更多的视角观察声音——音频工程师的iZotope RX 4使用介绍

摘要:iZotope RX是一款简单友好的音频编辑工具,本文站在信号处理的角度观察 获得

2014-10-11 15:51:39 5110

原创 WebRTC音频处理流程概述

摘要:本文主要介绍WebRTC的APM。Web

2014-09-26 10:35:13 9146 3

原创 回声消除的原理和应用场景

摘要:如今,随着芯片技术和高带宽通讯的发展,开发人员能够在更加优越的语音通话体验上做文章,同时市场上对免提通话的需求也越来越高。然而免提通话系统往往需要能够应对各种干扰的考验。其中不可忽视的一种的干扰是扬声器回声麦克风场(Loudspeaker EchoMicphone System)中的声学回声。本文探讨通话过程中声学回声(Acoustic Echo)的产生原因,以及其基本声学回声消除(Acou

2014-09-26 10:11:46 10432 3

流程图16091901

流程图16091901

2016-09-19

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除