Windows下Core Audio APIs的使用简介

Windows Vista 之后的系统中,音频系统相比之前的系统有很大的变化,产生了一套新的底层 API 即 Core Audio APIs 。

该低层 API 为高层 API【如 Media Foundation(将要取代DirectShow 等高层 API)等 】 提供服务。该系统API具有低延迟、高可靠性、安全性等特点。

本文主要从实时音视频场景中,简单介绍该API的使用。

Core Audio APIs 的组成:MMDevice、EndpointVolume、WASAPI等。对于实时音视频系统,主要用到的是MMDevice及EndpointVolume这两套API。其在系统中的位置如下图:
在这里插入图片描述
对实时音视频中音频设备的使用简单的分为:

  1. 设备列表管理
  2. 设备初始化
  3. 设备功能管理
  4. 数据交互
  5. 音量管理
  6. 设备终端监听

1、设备列表管理
音频设备的管理,由MMDevice API来实现。
首先我们要创建一个IMMDeviceEnumerator对象来开始相关功能的调用。

 	IMMDeviceEnumerator* ptrEnumerator = 
    CoCreateInstance(__uuidof(MMDeviceEnumerator), NULL, 
    CLSCTX_ALL, __uuidof(IMMDeviceEnumerator), 
    reinterpret_cast<void**>(&ptrEnumerator));

并通过IMMDeviceEnumerator可以实现:获取系统默认设备GetDefaultAudioEndpoint、获取设备集合IMMDeviceCollection、获取指定设备GetDevice、注册设备监听IMMNotificationClient(监听设备插拔及状态变更)。
通过这些方法,我们能得到系统默认设备、遍历设备列表、打开指定设备并监听设备变更。这样就实现了实时音视频中的设备管理相关的功能。

2、设备初始化
音频设备的启动是整个音频模块的可靠性的重要节点。根据设备类型和设备数据捕获方式,我们可分为3类设备:麦克风采集、扬声器播放、扬声器采集。
首先我们需要一个IMMDevice对象,可以在设备管理的相关功能中获取。

再通过IMMDevice得到IAudioClient,设备的格式设置及初始化通过IAudioClient对象实现。一般都以共享模式打开,其中麦克风采集及扬声器播使用事件驱动方式处理数据,而扬声器采集以回环的方式驱动处理数据。

3、设备功能管理
针对麦克风设备,我们通常需要对其进行数据处理。部分硬件设备和系统支持自带的降噪、增益、消回音等功能。但是一般windows系统下设备比较繁杂不可控,大都使用软件算法处理。
如果我们需要检测设备是否使用了自带的处理功能及相关参数,需要使用Topology模块的功能。

通过IDeviceTopology,我们能够遍历IConnector对象,获得IAudioAutoGainControl、IAudioVolumeLevel等能力对象,并处理相关能力。
注意:IConnector可能是循环嵌套,在遍历IConnector的IPart时需要判别成员对象IPart的类型。

4、数据交互
在设备初始化的时候,我们就根据不同的设备选择了不同的模式进行了启动。不同的设备在各自的模式下,数据驱动也各有不同:
麦克风采集:
在这里插入图片描述
扬声器播放:
在这里插入图片描述
扬声器采集:
在这里插入图片描述
在和设备进行数据交互时,我们需要根据数据获取模式,获取对应的服务对象来获取设备数据。其中采集部分使用IAudioCaptureClient服务用于获取设备数据,播放使用IAudioRenderClient服务获取设备数据传入指针。

在实际的数据交互中,需要另开单独线程处理GetBuffer及ReleaseBuffer。其中麦克风采集及扬声器播放时,都是通过设备事件驱动,可以在设备初始化完成后设置响应的事件句柄(IAudioClient::SetEventHandle)。

在整个音视频系统中,设备数据线程还需要统计数据处理时长、采集播放缓存大小等,用户监听检查设备状态及aec延迟计算。

5、音量管理
一般音量管理只在设备选定后处理当前设备的音量,所以一般使用IAudioEndpointVolume,该对象通过设备对象IMMDevice获取:

IAudioEndpointVolume* pVolume;
pDevice->Activate(__uuidof(IAudioEndpointVolume), 
CLSCTX_ALL, NULL, 
reinterpret_cast<void**>(&pVolume));

得到IAudioEndpointVolume对象后,我们能处理当前设备的音量控制:

pVolume->GetMasterVolumeLevelScalar(&fLevel);
pVolume->SetMasterVolumeLevelScalar(fLevel, NULL);

静音控制:

BOOL mute;
pVolume->GetMute(&mute);
pVolume->SetMute(mute, NULL);

以及注册IAudioEndpointVolumeCallback监听音量状态:

IAudioEndpointVolumeCallback* cbSessionVolume;
//need to do
pVolume>RegisterControlChangeNotify(cbSessionVolume);

6、设备终端监听
在运行过程中除了设备的插拔等操作,还可能有一些属性变更等,一般用IAudioSessionEvents监听:

IAudioSessionControl* ptrSessionControl;
ptrClient->GetService(__uuidof(IAudioSessionControl), (void**)&ptrSessionControl);
IAudioSessionEvents* notify;
ptrSessionControl->RegisterAudioSessionNotification(notify);

该回调监听,能监听该设备的连接工作状态,名称变更等。

一些注意事项

1、线程优先级
在实际的工程开发过程中,我们需要对音频线程的工作线程进行处理。通常通过调用系统模块Avrt.dll,动态调用其下的函数,将调用线程与指定任务(Pro Audio)相关联。上代码:

函数绑定:

avrt_module_ = LoadLibrary(TEXT("Avrt.dll"));
if (avrt_module_)
{
	_PAvRevertMmThreadCharacteristics =(PAvRevertMmThreadCharacteristics)GetProcAddress(avrt_module_,"AvRevertMmThreadCharacteristics");
	_PAvSetMmThreadCharacteristicsA = (PAvSetMmThreadCharacteristicsA)GetProcAddress(avrt_module_,"AvSetMmThreadCharacteristicsA");
	_PAvSetMmThreadPriority =(PAvSetMmThreadPriority)GetProcAddress(avrt_module_, "AvSetMmThreadPriority");
}

在实际的数据处理线程关联:

hMmTask_ = _PAvSetMmThreadCharacteristicsA("Pro Audio",&taskIndex);
if (hMmTask_)
{
	_PAvSetMmThreadPriority(hMmTask_,
	AVRT_PRIORITY_CRITICAL);
}

通过任务绑定,能有效的提升音频数据处理线程的可靠性。

2、工作线程
设备的相关初始化和释放操作,需要在统一的线程处理,部分系统com对象在释放时需要在创建线程释放,不然可能导致释放崩溃。而一些音量选择、监听等的处理可以在用户线程处理,但需要做好多线程安全。

3、设备格式选择
在设备的采样率、声道等格式选择时,如果需要使用自定义的格式,可能出现格式匹配失败或者选择匹配的格式后设备初始化失败的场景。通常此类场景下直接使用默认格式启动。

4、数据处理异常
在数据处理线程处理音频数据时,通常会出现事件响应超时、设备对象异常等情况。通常的处理方法是,先退出数据线程并结束设备,然后检查当前设备是否正常功能,然后重新启动当前设备或选用默认设备。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值