WINDOWS下对音频的处理过程

转载 2005年03月01日 14:19:00
WINDOWS下对音频的处理,大致可分为两部分,即音频的输入、输出,和ACM压缩处理。

  一般情况下在WINDOWS下可以调用诸如sndPlaySoundAPI(MCI)来播放一个WAV文件,但那显然不是我们需要做的。必须能够直接对音频数据流进行处理。在WINDOWS下,也为之提供了一系列的API,以waveInwaveOut开头的一组API就是干这个的。

  先说输入吧。常用的相关APIwaveInOpen(打开一个音频输入设备)、waveInPrepareHeader(为一个即将在waveInAddBuffer中调用的输入缓冲区准备头部)、waveInAddBuffer(添加一个输入用的数据缓冲区)、 waveInStart(开始录音)、waveInClose(关闭音频输入设备)等几个,以及需要在waveInOpen中指定的一个回调函数或者线程,其作用是在一个数据缓冲区被录满后被调用,以对这些数据进行处理,和其他一些相关的操作。

  首先你得确定一下需要用什么回调方式,即在某个时间片的音频数据被录完后,Windows将通过这个回调来激活对这些数据的处理过程,一般用到的无非是FUNCTIONTHREADEVENT这几类,而比较方便简单的就是FUNCTIONTHREAD了。FUNCTION方式是指Windows会调用你这个函数,而THREAD则是由 Windows来激活你所指定的线程。这些都在waveInOpen中指定。其函数原型为:

MMRESULT waveInOpen( LPHWAVEIN phwi,
UINT uDeviceID,
LPWAVEFORMATEX pwfx,
DWORD dwCallback,
DWORD dwCallbackInstance,
DWORD fdwOpen
);

  其中:phwi是返回的句柄存放地址,uDeviceID是要打开的音频设备ID号,一般都指定为WAVE_MAPPER dwCallback则为指定的回调函数或线程等的地址,fdwOpen指定回调方式,dwCallbackInstance为需要向回调 函数或线程送入的用户参数。至于那个pwfx,则比较关键,它指定了要以什么音频格式打开音频输入设备, 它是一个结构WAVEFORMATEX
typedef struct { WORD wFormatTag;
WORD nChannels;
DWORD nSamplesPerSec;
DWORD nAvgBytesPerSec;
WORD nBlockAlign;
WORD wBitsPerSample;
WORD cbSize;
} WAVEFORMATEX;
  机器上的WIN9X安装时选择了音频压缩,可以在wFormatTag中指定一些压缩的音频格式,如G723.1TURE DSP,等之类。不过一般都是选用WAVEFORMAT_PCM格式,即未压缩的音频格式,至于压缩,可以在录完后调用下面将要谈到的ACM单独进行。
  nChannels为声道数,1或者2nSamplesPerSec为每秒采样数,8000110252205044100为几个标准值,其他的非标准值我倒没试过行不行。nAvgBytesPerSec为每秒平均的字节数,在PCM方式中就等于nChannels*nSamplesPerSec*wBitsPerSample/8,但对于其它的压缩的音频格式,由于很多压缩方式是按时间片进行的,如G723.1,就是以30ms为一个压缩单位,这样,nAvgBytesPerSec只是一个大概的数字,并不准确,程序中的计算是不应该以这个量为准的。这一点在下面的压缩音频输出和ACM音频压缩中非常重要。nBlockAlign是一个比较特殊的值,表示对音频处理时的最小处理单位,对于PCM非压缩,它就是wBitsPerSample*nChannels/8,而对于非压缩格式,则表示压缩/解压处理的最小单位了,如G723.1,就是30ms的数据大小(20bytes或者24bytes)。wBitsPerSample就是每采样值的位数,8或者16 cbSize则是表示该WAVEFORMATEX的结构在标准的头部之后还有多少字节数,对于很多非PCM的音频格式,有一些自己的定义格式参数,这些就紧跟在标准的WAVEFORMATEX后面,其大小就由cbSize指定。对于PCM格式而言,为0,或者忽略不检查。

  这样,指定了这些参数后,你应该就能够打开音频输入设备了。下面要做的事情就是准备几个用做录音的缓冲区。常准备多个缓冲区,并在回调中循环使用。另外,还得考虑好录得的音频数据放哪儿,比如一个临时文件,就得准备好文件的句柄。对于缓冲区,得使用waveInPerpareHeader准备一下头部,这个API比较简单,如果你是循环使用缓冲区,对每个缓冲区也只需要调用一次waveInPrepareHeader


  一切准备好之后,就可以调用waveInAddBufferwaveInStart开始录音了,只要你一调用这个waveInStart,录音就开始了,即使这个缓冲区录满之后你没有加入新的缓冲区进去,录音也不会停,只是这中间的语音数据全都丢了。当通过 waveInAddBuffer送入的缓冲区被录满后,Windows就会通过你在waveInOpen中指定的方式进行回调,在回调中把录好的语音数据取出来,并且,如果还想继续录音的话,得将下一个缓冲区添加进去。考虑到这个处理是有时间延迟的,而且音频对时间很敏感,一般都要先预加入若干个缓冲区,比如,一共定义了8个缓冲区,而为了保险起见,最好保证任一时刻至少有3个缓冲区可被录音使用,那么在开始录音时,则先加入4个缓冲区,然后在回调中,如果当前录好的缓冲区第n个,则对第(n+4)%8调用waveInAddBuffer,这时,还有第(n+1)%8,(n+2)%8, (n+3)%8这三个缓冲区可用,即基本上就可以保证所录得音频中不会有断开的间隔。

  想结束录音时,最好在waveInClose之前调用一下waveInReset,这样可以清掉尚在等待录音的缓冲区,同时在回调中还必须注意一下送入参数中的消息种类。

  音频输出部分相对简单一点。对应的APIwaveOutOpenwaveOutPrepareHeaderwaveOutWrite以及waveOutClose。如果希望直接输出压缩格式的音频的话,必须注意waveOutOpen中指定的音频格式参数。你必须很清楚这类格式的具体参数及其含义。不过,你可以通过下面说到的ACMAudio Compress Manager)得到你需要的音频格式的具体参数,这个格式参数可以直接用于waveOutOpen。如同音频的输入,waveOutPrepareHeader也是必需的。waveOutWrite 则是填入输出缓冲区,为了避免间断,也应该保证某一时刻缓冲区队列中数目足够。



  如果安装WIN98时在附件中选择了音频压缩,那么机器上的ACM就可用了。ACMAudio Compress Manager WIN98提供了一些常用的音频压缩算法程序包,供用户调用。可以通过ACM获得本机上所有的音频压缩驱动及其所支持的音频格式。不过,似乎不是每种ACM格式都能被调用来进行压缩,不过ACM中的压缩驱动大多都是针对语音频段,如果用来压缩频带较宽的音频,如音乐,则效果很差.

windows 声音编程之waveout

本教程将帮助您了解如何使用Windows waveOut接口播放数字音频。根据经验,这些接口函数掌握起来有些困难。在本教程中,我们将会建立一个Windows命令行程序来原始数字音频。注意:本教程假设您...
  • mxdhqm
  • mxdhqm
  • 2015年01月07日 20:15
  • 921

Keil优化代码大小方法

如图 1,未进行任何优化时,keil编译生成的文件大小为:9668字节。 第一步:project >> Option for Target “**” 打开如图 2界面。选择“target”,...

AAC 文件解析及解码流程

OUTLINE:         * AAC概述         * AAC规格简述         * AAC特点              * AAC音频文件解析            ——ADI...
  • wlsfling
  • wlsfling
  • 2010年09月10日 16:05
  • 25987

EasyDarwin手机直播转发快速显示问题之音频处理过程

前言在我们前面一篇《EasyDarwin手机直播是如何实现的快速显示视频的方法》中,我们描述到了EasyDarwin流媒体服务器端是如何对视频H.264进行缓冲,再以最快的方式将最新的视频关键帧推送给...

webrtc--AudioProcessing-- 音频降噪的处理过程

1.AudioProcessing的实例化和配置: AudioProcessing* apm = AudioProcessing::Create(0); apm->level_estima...

windows系统对鼠标点击事件的处理过程

Windows用这个消息来做什么? “HITTEST”就是“命中测试”的意思,WM_NCHITTEST消息用来获取鼠标当前命中的位置。 WM_NCHITTEST的消息响应函数会根据鼠标当前的坐标来判...

WINDOWS消息处理过程

WINDOWS消息处理过程   一、引言 二、Windows消息机制的概念 1、DOS与Windows驱动机制的区别 2、消息 3、消息的来源 4、Windows的消息系统的组成 5、消息...
  • wlanye
  • wlanye
  • 2015年04月07日 10:42
  • 1556

windows消息处理过程---消息pump

消息泵也就是消息(处理)循环 (Message Loop),每个基于事件驱动编写出来的 Windows 程序都应该有一个。 消息循环(Message Loop)是程序的心脏,保证程序的正常运行,它的形...

使用PowerBuilder 9编绎DLL类型,有点问题.处理过程记录如下."Error opening file 'c:\windows\system32\cgen\en32t.h'"

决下心来学PowerBuilder 工作上一直要用到数据库的知识。PB在这方面的功能实在是太强大了。 将PBL编绎成DLL时,会有错误,不知道PB编绎DLL时的路径设置在哪里弄的。 1.提示找...
  • aasmfox
  • aasmfox
  • 2012年09月23日 11:42
  • 3236

记一笔:Windows下tomcat外网不能访问处理过程

问题与分析: 公司使用tomcat7做应用服务,运行在CentOS 6.5环境上,服务器开始放在公司内网,通过花生壳映射到外网,能正常访问。后来准备迁移到IDC机房,迁移之前派了一个同事扛了一台笔...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:WINDOWS下对音频的处理过程
举报原因:
原因补充:

(最多只允许输入30个字)