![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
音频处理
幻雪神界
专业: 电子科学与技术(微电子,集成电路设计),工业工程
工作背景: 国企,法企,美企,德企,私企,创业公司
擅长领域: 芯片设计,MCU/ARM/FPGA, Linux, Android, WebRTC, WSN, iOT等领域
产品领域: 手机基带芯片,手机,智能电视,智能投影,新能源汽车,智能家居等产品
展开
-
ALSA Audio API 使用指南(中英版)
本文通过对A Tutorial on Using the ALSA Audio API 这篇文章的翻译,代码注释,API整理,使读者能够对ALSA Audio API的使用有一个基本的了解,在以下的阶段里我将对ALSA编程做一个更加深入的研究。博客中的代码部分显示不怎么整齐,大家可以去我的百度文库下载,地址如下所示:http://wenku.baidu.com/view/5eff4987bceb1原创 2011-02-17 09:49:00 · 4598 阅读 · 0 评论 -
解密回声消除技术之一(理论篇)
一、前言因为工作的关系,笔者从2004年开始接触回声消除(Echo Cancellation)技术,而后一直在某大型通讯企业从事与回声消除技术相关的工作,对回声消除这个看似神秘、高端和难以理解的技术领域可谓知之甚详。要了解回声消除技术的来龙去脉,不得不提及作为现代通讯技术的理论基础——数字信号处理理论。首先,数字信号处理理论里面有一门重要的分支,叫做自适应信号处理。而在经典的教材里面,回声转载 2013-05-28 21:01:42 · 945 阅读 · 0 评论 -
常用视频音频编码简介
常用视频音频编码简介这里只对常见的视频音频编码做一个系统的简单介绍,并不进行详细探讨。由于我的知识有限,难免有错误的地方,欢迎来信指正。MPEG 系列:MPEG 即(Moving Pictures Experts Group) 运动图象专家组,属于ISO(International Organization for Standardization) 国际标准组织,他们开转载 2012-09-18 15:11:39 · 859 阅读 · 0 评论 -
有关音频编码的知识与技术参数(转载)
自然界中的声音非常复杂,波形极其复杂,通常我们采用的是脉冲代码调制编码,即PCM编码。PCM通过抽样、量化、编码三个步骤将连续变化的模拟信号转换为数字编码。1、什么是采样率和采样大小(位/bit)? 声音其实是一种能量波,因此也有频率和振幅的特征,频率对应于时间轴线,振幅对应于电平轴线。波是无限光滑的,弦线可以看成由无数点组成,由于存储空间是相对有限的,数字编码过程中,必须对弦线转载 2012-09-18 15:04:24 · 1150 阅读 · 1 评论 -
wav文件的文件头
wav文件的文件头wave文件的格式:00H 4 char "RIFF"标志 04H 4 long int 文件长度 08H 4 char "WAVE"标志 0CH 4 char "fmt"标志 10H 4 过渡字节(不定) 14H 2 int 格式类别(10H为PCM形式的声音数据) 16H 2 int 通道数,单声道为1,双声道为2 18H转载 2012-09-18 14:50:22 · 1109 阅读 · 0 评论 -
AAC 音频
AAC,即高级音频编码(Advanced Audio Coding),它是由MP3专利的拥有者Fraunhofer IIS联合杜比、AT&T、索尼、苹果等产业巨头共同开发出的一种数字音频压缩方式。开发这种音频编码的主要目的就是为了取代MP3现有的地位。其实,AAC的技术早在1997年就成型了,当时被称为MPEG-2 AAC,但是随着2000年MPEG-4音频标准的出台,MPEG-2 AAC被用转载 2012-09-18 15:02:52 · 686 阅读 · 0 评论 -
比特率
一、计算机中的比特率比特率是指每秒传送的比特(bit)数。单位为 bps(Bit Per Second),比特率越高,传送的数据越大。比特率表示经过编码(压缩)后的音、视频数据每秒钟需要用多少个比特来表示,而比特就是二进制里面最小的单位,要么是0,要么是1。比特率与音、视频压缩的关系,简单的说就是比特率越高,音、视频的质量就越好,但编码后的文件就越大;如果比特率越少则情况刚好相反。计算转载 2012-09-18 15:09:12 · 1524 阅读 · 0 评论 -
srilm编译
Srilm的全称是Stanford Research Institute Language Modeling Toolkit 他被用来构建和应用统计语言模型,主要用于语音识别,统计标注和切分,以及机器翻译等工作。ubuntu编译,可以再52nlp中去找。VC编译,可以再下面链接找,http://www.keithv.com/software/srilm/以VS2008为例,可以转载 2012-09-18 15:00:29 · 609 阅读 · 0 评论 -
语音质量评价
语音作为信息传递的重要载体,与其相关构成的通信、编码、存储和处理等语音系统已成为现代社会信息交流的必要手段,且已广泛应用于社会各个领域。这些系统的性能好坏成为信息交流是否畅通的重要因素,而评价这些系统性能优劣的根本标志是在于系统输出语音质量的好坏。因此,研制灵活、方便、可靠的语音质量评价系统自然成为国内外研究者共同努力的目标。 语音质量包括两方面内容:清晰度和自然度。前者是衡量语转载 2012-09-18 14:54:47 · 2464 阅读 · 0 评论 -
常用音频协议介绍
会议电视常用音频协议介绍及对比白皮书 一、数字化音频原理:声音其实是一种能量波,因此也有频率和振幅的特征,频率对应于时间轴线,振幅对应于电平轴线。通常人耳可以听到的频率在20Hz到20KHz的声波称为为可听声,低于20Hz的成为次声,高于20KHz的为超声,多媒体技术中只研究可听声部分。 可听声中,话音信号的频段在80Hz到3400Hz之间,音乐信号的频段在20Hz-20kHz之转载 2012-09-16 23:37:53 · 796 阅读 · 0 评论 -
AAC ADTS LATM 格式分析
一、ADTS格式:ADTS的全称是Audio Data Transport Stream。是AAC音频的传输流格式。AAC音频格式在MPEG-2(ISO-13318-7 2003)中有定义。AAC后来又被采用到MPEG-4标准中。1. adts_sequence(){ while (nextbits() == syncword) { adts_frame(); }转载 2012-05-17 09:51:21 · 436 阅读 · 0 评论 -
Android中音乐文件的信息详解
前段时间处理android音乐文件信息,上网查资料发现Android系统自己提供了MediaScanner,MediaProvider,MediaStore等接口并且提供了一套数据库表格,通过 Content Provider的方式把内容共享给用户。。当手机开机或者有SD卡插拔等事件发生时,系统将会自动扫描SD卡和手机内存上的媒体文件,如 audio,video,图片等,将相应的信息放到定义好转载 2012-04-23 11:36:51 · 545 阅读 · 0 评论 -
Linux Audio ALSA Technical specification(Linux 音频ALSA技术说明)
Linux Audio ALSA Technical specification 备注:整理于2011.01.20, 本篇博客百度文库: http://wenku.baidu.com/view/34ca5351ad02de80d4d84084.htmlEmail:safransx@gmail.com QQ: 1104472716 TABLE O原创 2011-03-24 23:28:00 · 4570 阅读 · 0 评论 -
语音聊天所涉及的技术
当我们使用像Skype、QQ这样的工具和朋友流畅地进行语音视频聊天时,我们可曾想过其背后有哪些强大的技术在支撑?本文将对网络语音通话所使用到的技术做一些简单的介绍,算是管中窥豹吧。一.概念模型网络语音通话通常是双向的,就模型层面来说,这个双向是对称的。为了简单起见,我们讨论一个方向的通道就可以了。一方说话,另一方则听到声音。看似简单而迅捷,但是其背后的流程却是相当复杂的。我们将其经转载 2013-05-28 21:06:59 · 1072 阅读 · 0 评论