计算音频数据音量_SDL开发笔记(二)：音频基础介绍、使用SDL播放音频

最新推荐文章于 2024-09-11 16:00:30 发布

weixin_39980841

最新推荐文章于 2024-09-11 16:00:30 发布

阅读量633

点赞数

文章标签：计算音频数据音量

本文详细介绍了如何在Qt应用中使用SDL播放音频，包括音频的基本概念、SDL音频播放的关键步骤，如初始化子系统、打开音频设备、播放音频、补充数据等。还提供了具体的SDL_AudioSpec结构体配置示例和播放PCM音频的代码示例，帮助开发者理解SDL音频播放流程。

摘要由CSDN通过智能技术生成

若该文为原创文章，未经允许不得转载
原博主博客地址：https://blog.csdn.net/qq21497936
原博主博客导航：https://blog.csdn.net/qq21497936/article/details/102478062
本文章博客地址：https://blog.csdn.net/qq21497936/article/details/108596396
红胖子(红模仿)的博文大全：开发技术集合（包含Qt实用技术、树莓派、三维、OpenCV、OpenGL、ffmpeg、OSG、单片机、软硬结合等等）持续更新中…（点击传送门）

Qt开发专栏：三方库开发技术（点击传送门）

上一篇：《SDL开发笔记(一)：SDL介绍、编译使用以及工程模板》
下一篇：敬请期待

前言

对于Qt应用来说，为了更大的跨平台通用性，使用SDL播放音频，同时也能做更多的扩充操作。

声波

声音是通过空气传播的一种连续的波，简称声波。声音的强弱体现在声波压力的大小上，音调的音调体现在声音的频率上。
声音信号由两个基本参数是频率和复读。信号的频率指的是信号每秒变化的次数，用Hz表示。
频率范围为20Hz20Khz的信号成为音频信号。该范围内的音频声音幅度在0120dB之间，可被人感知到。
声音转换为数字信号，则成为音频信号。

音频信号

音频信号（acoustic signals）是带有语音、音乐和音效的有规律的声波的频率、幅度变化信息载体。根据声波的特征，可把音频信息分类为规则音频和不规则声音。其中规则音频又可以分为语音、音乐和音效。规则音频是一种连续变化的模拟信号，可用一条连续的曲线来表示，称为声波。
声音的三个要素是音调、音强和音色。声波或正弦波有三个重要参数：频率 ω0、幅度An和相位ψn ，这也就决定了音频信号的特征。
对音频信号进行采样，模拟信号数字化后，就是数字音频信号了。

数字音频信号

数字音频计算机数据的存储是以0、1的形式存取的，那么数字音频就是首先将音频文件转化，接着再将这些电平信号转化成二进制数据保存，播放的时候就把这些数据转换为模拟的电平信号再送到喇叭播出，数字声音和一般磁带、广播、电视中的声音就存储播放方式而言有着本质区别。相比而言，它具有存储方便、存储成本低廉、存储和传输的过程中没有声音的失真、编辑和处理非常方便等特点。
数字音频信号，就是我们最终处理的音频数据。
音频数字信号信号具备几个特征：

量化级

简单地说就是描述声音波形的数据是多少位的二进制数据，通常用bit做单位，如16bit、24bit。16bit量化级记录声音的数据是用16位的二进制数，因此，量化级也是数字声音质量的重要指标。我们形容数字声音的质量，通常就描述为24bit（量化级）、48KHz采样，比如标准CD音乐的质量就是16bit、44.1KHz采样。

声道

可以简单的理解为通过一个振膜采样到的音频数据就是一个声道，两个振膜就是两个声道，以此类推。振膜一般有大、中、小三种尺寸，尺寸越大，对声波越敏感，成本也越高。一个麦克风里面有的有一个振膜，有的有两个振膜。一个振膜的麦克风进行的是Mono单声道录音，两个振膜的麦克风进行的是Stereo双声道立体声录音。五声道环绕立体声录音就是麦克风1录取东北方向的声音，麦克风2录取西北方向的声音，麦克风3录取西南方向的声音，麦克风4录取东南方向的声音，麦克风5录取正前方的声音。另外还有四声道环绕立体声录音和七声道环绕立体声录音。

采样率

简单地说就是通过波形采样的方法记录1秒钟长度的声音，需要多少个数据。44KHz采样率的声音就是要花费44000个数据来描述1秒钟的声音波形。原则上采样率越高，声音的质量越好。

比特率

一种数字音乐压缩效率的参考性指标，表示记录音频数据每秒钟所需要的平均比特值（比特是电脑中最小的数据单位，指一个0或者1的数），通常我们使用Kbps(通俗地讲就是每秒钟1024比特)作为单位。CD中的数字音乐比特率为1411.2Kbps（也就是记录1秒钟的CD音乐，需要1411.2×1024比特的数据），近乎于CD音质的MP3数字音乐需要的比特率大约是112Kbps～128Kbps。

压缩率

通常指音乐文件压缩前和压缩后大小的比值，用来简单描述数字声音的压缩效率。

SDL音频播放流程解析

基本流程如下：

步骤一：初始化子系统

初始化音频系统，其他多余的系统不用初始化。

步骤二：根据音频信息打开音频设备

填充好SDL_AudioSpec音频信息，打开音频设备，此时会返回最接近的音频设备，若没有接近的则第二个参数返回0，此时我们直接第二个参数如0，无需返回。

步骤三：开始播放

使用SDL_PauseAudio(0)进行播放。

步骤四：循环补充数据

根据缓冲区数据长度和文件剩余的数据长度进行补充，若缓冲区数据没了，就补充一次，使用SDL_Delay进行1ms的延迟，用当前缓存区剩余未播放的长度大于0结合前面的延迟进行等待。

步骤四（附加）：回调函数

开始播放后，会有音频其他子线程来调用回调函数，进行音频数据的补充，经过测试每次补充4096个字节。

步骤五：关闭音频设别

步骤六：退出SDL系统

SDL播放音频相关变量

struct SDL_AudioSpec

SDL_AudioSpec是包含音频输出格式的结构体，同时它也包含当音频设备需要更多数据时调用的回调函数，此结构体是关键。

typedef struct SDL_AudioSpec { int freq; // DSP频率—每秒采样数 SDL_AudioFormat format; // 音频数据格式 Uint8 channels; // 通道数1-单声道，2-立体声 Uint8 silence; // 音频缓冲静音值（计算） Uint16 samples; // 基本是512、1024设置不合适可能会导致卡顿’ Uint16 padding; // 对于某些编译环境是必需的 Uint32 size; // 音频缓冲区大小（字节）（计算） SDL_AudioCallback callback; // 为音频设备提供数据回调(空值使用SDL 自身预先定义的SDL_QueueAudio ()回调函数) void *userdata; // 传递给回调的Userdata（对于空回调忽略） } SDL_AudioSpec;

举例：播放pcm音频“匆匆那年-44100-16位-双通道.pcm”

// 音频结构体设置 SDL_AudioSpec sdlAudioSpec; sdlAudioSpec.freq = 44100; sdlAudioSpec.format = AUDIO_S16SYS; sdlAudioSpec.channels = 1; sdlAudioSpec.silence = 0; sdlAudioSpec.samples = 1024; sdlAudioSpec.callback = callBack_fillAudioData; sdlAudioSpec.userdata = 0;

SDL播放音频相关原型

SDL_Init()

int SDLCALL SDL_Init(Uint32 flags);

使用此函数初始化SDL库，必须在使用大多数其他SDL函数之前调用它，初始化的时候尽量做到“够用就好”，而不要用SDL_INIT_EVERYTHING。会出现一些不可预知的问题。

参数一：输入初始化的设备

SDL_OpenAudio()

int SDL_OpenAudio(SDL_AudioSpec * desired, SDL_AudioSpec * obtained);

此函数使用所需参数打开音频设备，然后如果成功，则返回0，将实际硬件参数放入已获得指向的结构。如果获得的为空，则音频传递给回调函数的数据将被保证在请求的格式，并将自动转换为硬件音频格式（如有必要）。如果失败，此函数返回-1，则无法打开音频设备，或无法设置音频线程。

参数一：输入需要打开的音频设备参数；
参数二：返回打开成功的音频设备参数；

SDL_PauseAudio()

extern DECLSPEC void SDLCALL SDL_PauseAudio(int pause_on);

暂停音频功能。函数暂停和取消暂停音频回调处理。
打开音频后，应使用参数0调用它们开始播放声音的设备。这样就可以在打开音频设备后安全地初始化回调函数的数据。
暂停期间，静音将写入音频设备。

SDL_MixAudio：混音播放函数

void SDL_MixAudio(Uint8 * dst, const Uint8 * src, Uint32 len, int volume);

这需要播放音频格式和混音的两个音频缓冲区它们执行加法、音量调节和溢出剪辑。音量的范围从0到128，应设置为SDL_MIX_MAXVOLUME全音频音量。注意这不会改变硬件的音量。
这是为了方便起见，可以混合音频数据。

参数一：目标数据，这个是回调函数里面的stream指针指向的，直接使用回调的stream指针即可。
参数二：音频数据，这个是将需要播放的音频数据混到stream里面去，那么这里就是我们需要填充的播放的数据。
参数三：音频数据的长度，这个是我们填充过去的长度。
参数四：音量，0~128范围，SAL_MIX_MAXVOLUME为128，设置的是软音量，不是硬件的音响。

SDL_Delay()

void SDL_Delay(Uint32 ms);

在返回之前等待指定的毫秒数。

SDL_Quit()

void SDLCALL SDL_Quit(void);

此函数用于清除所有初始化的子系统。在所有退出条件后调用它。

Demo源码

void SDLManager::testPlayPCM() { int ret = 0; // 音频结构体 SDL_AudioSpec sdlAudioSpec; // sdlAudioSpec.freq = 44100; sdlAudioSpec.freq = 22050; // sdlAudioSpec.format = AUDIO_U8; // x // sdlAudioSpec.format = AUDIO_S8; // x // sdlAudioSpec.format = AUDIO_U16LSB; // x // sdlAudioSpec.format = AUDIO_S16LSB; // √ // sdlAudioSpec.format = AUDIO_U16MSB; // x // sdlAudioSpec.format = AUDIO_U16LSB; // x // sdlAudioSpec.format = AUDIO_S16MSB; // x // sdlAudioSpec.format = AUDIO_U16; // x sdlAudioSpec.format = AUDIO_S16; // √ // sdlAudioSpec.format = AUDIO_S16SYS; // x // sdlAudioSpec.format = AUDIO_S32SYS; // x // sdlAudioSpec.format = AUDIO_F32SYS; // x // sdlAudioSpec.format = AUDIO_F32MSB; // x sdlAudioSpec.channels = 1; sdlAudioSpec.silence = 0; sdlAudioSpec.samples = 1024; // 导致错误512~1024之间 sdlAudioSpec.callback = callBack_fillAudioData; sdlAudioSpec.userdata = 0; QString fileName; #if 0 fileName = "testPCM/王妃-22050-16位-单通道.pcm"; sdlAudioSpec.freq = 22050; sdlAudioSpec.channels = 1; sdlAudioSpec.format = AUDIO_S16; #endif #if 1 fileName = "testPCM/匆匆那年-44100-16位-双通道.pcm"; sdlAudioSpec.freq = 44100; sdlAudioSpec.channels = 2; sdlAudioSpec.format = AUDIO_S16; #endif #if 0 fileName = "testPCM/北京北京8k16bits单声道.pcm"; sdlAudioSpec.freq = 8000; sdlAudioSpec.channels = 1; sdlAudioSpec.format = AUDIO_S16; #endif #if 0 fileName = "testPCM/冰雨片段48k16bit单声道.pcm"; sdlAudioSpec.freq = 48000; sdlAudioSpec.channels = 1; sdlAudioSpec.format = AUDIO_S16; #endif #if 0 fileName = "testPCM/浪花一朵朵片段48k16bit单声道.pcm"; sdlAudioSpec.freq = 48000; sdlAudioSpec.channels = 1; sdlAudioSpec.format = AUDIO_S16; #endif QFile file(fileName); if(!file.open(QIODevice::ReadOnly)) { LOG << "Failed" << file.exists(); return; } // 步骤一：初始化音频子系统 ret = SDL_Init(SDL_INIT_AUDIO); if(ret) { LOG << "Failed"; return; } // 步骤二：打开音频设备 ret = SDL_OpenAudio(&sdlAudioSpec, 0); if(ret) { LOG << "Failed"; return; } // 步骤三：开始播放 SDL_PauseAudio(0); #if 1 // 步骤四：一次性读取所有的数据 QByteArray data = file.readAll(); int pos = 0; _audioPos = (uint8_t *)data.data(); _audioLen = data.size(); pos += data.size(); while(_audioLen > 0) { SDL_Delay(1); } #else // 步骤四：一次性读取4096 int readSize = 4096; while(true) { _audioPos = (uint8_t *)file.read(readSize).data(); _audioLen = readSize; while(_audioLen > 0) { SDL_Delay(1); } } #endif // 步骤：播放完毕 SDL_CloseAudio(); // 步骤：释放SDL SDL_Quit(); if(file.isOpen()) { file.close(); return; } } void SDLManager::callBack_fillAudioData(void *userdata, uint8_t *stream, int len) { SDL_memset(stream, 0, len); if(_audioLen == 0) { return; } len = (len > _audioLen ? _audioLen : len); SDL_MixAudio(stream, _audioPos, len, SDL_MIX_MAXVOLUME); _audioPos += len; _audioLen -= len; // 每次加载4096 LOG << len; }

工程模板：对应版本号v1.1.0

对应版本号v1.1.0：播放裸PCM数据。

上一篇：《SDL开发笔记(一)：SDL介绍、编译使用以及工程模板》
下一篇：敬请期待

原博主博客地址：https://blog.csdn.net/qq21497936
原博主博客导航：https://blog.csdn.net/qq21497936/article/details/102478062
本文章博客地址：https://blog.csdn.net/qq21497936/article/details/108596396

weixin_39980841

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫