python播放pcm音频

安装pysdl2库,会遇到找不到dll文件的问题

错误信息

PYSDL2_DLL_PATH: unset

官网下载

http://www.libsdl.org/download-2.0.php

下载,解压到目录

程序中通过环境变量,指定目录

import os
os.environ["PYSDL2_DLL_PATH"] = "D:\SDL2-2.0.14-win32-x64"

但PCM格式和音源参数关系很大,必须指定正确,否则无法播放。

SDL库参数设置说明

参考文章 最简单的视音频播放示例9:SDL2播放PCM_雷霄骅的博客-CSDN博客

SDL库架构

SDL播放音频的流程

SDL播放音频的流程狠简单,分为以下步骤。

1. 初始化

1) 初始化SDL。

2) 根据参数(SDL_AudioSpec)打开音频设备

2. 循环播放数据

1) 播放音频数据。

2) 延时等待播放完成。

详细说明,还是值得仔细看下,其实视频处理中,ffplay就调用了sdl2库来进行播放

SDL播放音频的流程
SDL播放音频的流程狠简单,分为以下步骤。

1. 初始化
1) 初始化SDL。

2) 根据参数(SDL_AudioSpec)打开音频设备

2. 循环播放数据
1) 播放音频数据。

2) 延时等待播放完成。

下面详细分析一下上文流程。


1. 初始化
1) 初始化SDL。

使用SDL_Init()初始化SDL。该函数可以确定希望激活的子系统。SDL_Init()函数原型如下:
int SDLCALL SDL_Init(Uint32 flags)

其中,flags可以取下列值:
SDL_INIT_TIMER:定时器
SDL_INIT_AUDIO:音频
SDL_INIT_VIDEO:视频
SDL_INIT_JOYSTICK:摇杆
SDL_INIT_HAPTIC:触摸屏
SDL_INIT_GAMECONTROLLER:游戏控制器
SDL_INIT_EVENTS:事件
SDL_INIT_NOPARACHUTE:不捕获关键信号(这个不理解)
SDL_INIT_EVERYTHING:包含上述所有选项

有关SDL_Init()有一点需要注意:初始化的时候尽量做到“够用就好”,而不要用SDL_INIT_EVERYTHING。因为有些情况下使用SDL_INIT_EVERYTHING会出现一些不可预知的问题。例如,在MFC应用程序中播放纯音频,如果初始化SDL的时候使用SDL_INIT_EVERYTHING,那么就会出现听不到声音的情况。后来发现,去掉了SDL_INIT_VIDEO之后,问题才得以解决。

2) 根据参数(SDL_AudioSpec)打开音频设备
使用SDL_OpenAudio()打开音频设备。该函数需要传入一个SDL_AudioSpec的结构体。DL_OpenAudio()的原型如下。
int SDLCALL SDL_OpenAudio(SDL_AudioSpec * desired,
                                          SDL_AudioSpec * obtained);

它的参数是两个SDL_AudioSpec结构体,它们的含义:
desired:期望的参数。
obtained:实际音频设备的参数,一般情况下设置为NULL即可。


SDL_AudioSpec结构体的定义如下。
typedef struct SDL_AudioSpec
{
    int freq;                   /**< DSP frequency -- samples per second */
    SDL_AudioFormat format;     /**< Audio data format */
    Uint8 channels;             /**< Number of channels: 1 mono, 2 stereo */
    Uint8 silence;              /**< Audio buffer silence value (calculated) */
    Uint16 samples;             /**< Audio buffer size in samples (power of 2) */
    Uint16 padding;             /**< Necessary for some compile environments */
    Uint32 size;                /**< Audio buffer size in bytes (calculated) */
    SDL_AudioCallback callback;
    void *userdata;
} SDL_AudioSpec;

其中包含了关于音频各种参数:
freq:音频数据的采样率。常用的有48000,44100等。
format:音频数据的格式。举例几种格式:
 AUDIO_U16SYS:Unsigned 16-bit samples
 AUDIO_S16SYS:Signed 16-bit samples
 AUDIO_S32SYS:32-bit integer samples
 AUDIO_F32SYS:32-bit floating point samples
channels:声道数。例如单声道取值为1,立体声取值为2。
silence:设置静音的值。
samples:音频缓冲区中的采样个数,要求必须是2的n次方。
padding:考虑到兼容性的一个参数。
size:音频缓冲区的大小,以字节为单位。
callback:填充音频缓冲区的回调函数。
userdata:用户自定义的数据。
在这里记录一下填充音频缓冲区的回调函数的作用。当音频设备需要更多数据的时候会调用该回调函数。回调函数的格式要求如下。
void (SDLCALL * SDL_AudioCallback) (void *userdata, Uint8 * stream,
                                            int len);

回调函数的参数含义如下所示。
userdata:SDL_AudioSpec结构中的用户自定义数据,一般情况下可以不用。
stream:该指针指向需要填充的音频缓冲区。
len:音频缓冲区的大小(以字节为单位)。
在回调函数中可以使用SDL_MixAudio()完成混音等工作。众所周知SDL2和SDL1.x关于视频方面的API差别很大。但是SDL2和SDL1.x关于音频方面的API是一模一样的。唯独在回调函数中,SDL2有一个地方和SDL1.x不一样:SDL2中必须首先使用SDL_memset()将stream中的数据设置为0。


2. 循环播放数据
1) 播放音频数据。
使用SDL_PauseAudio()可以播放音频数据。SDL_PauseAudio()的原型如下。
void SDLCALL SDL_PauseAudio(int pause_on)

当pause_on设置为0的时候即可开始播放音频数据。设置为1的时候,将会播放静音的值。

2) 延时等待播放完成。
这一步就是延时等待音频播放完毕了。使用像SDL_Delay()这样的延时函数即可。
 

C的代码样例

/**
 * 最简单的SDL2播放音频的例子(SDL2播放PCM)
 * Simplest Audio Play SDL2 (SDL2 play PCM) 
 *
 * 雷霄骅 Lei Xiaohua
 * leixiaohua1020@126.com
 * 中国传媒大学/数字电视技术
 * Communication University of China / Digital TV Technology
 * http://blog.csdn.net/leixiaohua1020
 *
 * 本程序使用SDL2播放PCM音频采样数据。SDL实际上是对底层绘图
 * API(Direct3D,OpenGL)的封装,使用起来明显简单于直接调用底层
 * API。
 *
 * 函数调用步骤如下: 
 *
 * [初始化]
 * SDL_Init(): 初始化SDL。
 * SDL_OpenAudio(): 根据参数(存储于SDL_AudioSpec)打开音频设备。
 * SDL_PauseAudio(): 播放音频数据。
 *
 * [循环播放数据]
 * SDL_Delay(): 延时等待播放完成。
 *
 * This software plays PCM raw audio data using SDL2.
 * SDL is a wrapper of low-level API (DirectSound).
 * Use SDL is much easier than directly call these low-level API.
 *
 * The process is shown as follows:
 *
 * [Init]
 * SDL_Init(): Init SDL.
 * SDL_OpenAudio(): Opens the audio device with the desired 
 *					parameters (In SDL_AudioSpec).
 * SDL_PauseAudio(): Play Audio.
 *
 * [Loop to play data]
 * SDL_Delay(): Wait for completetion of playback.
 */
 
#include <stdio.h>
#include <tchar.h>
 
extern "C"
{
#include "sdl/SDL.h"
};
 
//Buffer:
//|-----------|-------------|
//chunk-------pos---len-----|
static  Uint8  *audio_chunk; 
static  Uint32  audio_len; 
static  Uint8  *audio_pos; 
 
/* Audio Callback
 * The audio function callback takes the following parameters: 
 * stream: A pointer to the audio buffer to be filled 
 * len: The length (in bytes) of the audio buffer 
 * 
*/ 
void  fill_audio(void *udata,Uint8 *stream,int len){ 
	//SDL 2.0
	SDL_memset(stream, 0, len);
	if(audio_len==0)
			return; 
	len=(len>audio_len?audio_len:len);
 
	SDL_MixAudio(stream,audio_pos,len,SDL_MIX_MAXVOLUME);
	audio_pos += len; 
	audio_len -= len; 
} 
 
int main(int argc, char* argv[])
{
	//Init
	if(SDL_Init(SDL_INIT_AUDIO | SDL_INIT_TIMER)) {  
		printf( "Could not initialize SDL - %s\n", SDL_GetError()); 
		return -1;
	}
	//SDL_AudioSpec
	SDL_AudioSpec wanted_spec;
	wanted_spec.freq = 44100; 
	wanted_spec.format = AUDIO_S16SYS; 
	wanted_spec.channels = 2; 
	wanted_spec.silence = 0; 
	wanted_spec.samples = 1024; 
	wanted_spec.callback = fill_audio; 
 
	if (SDL_OpenAudio(&wanted_spec, NULL)<0){ 
		printf("can't open audio.\n"); 
		return -1; 
	} 
 
	FILE *fp=fopen("../NocturneNo2inEflat_44.1k_s16le.pcm","rb+");
	if(fp==NULL){
		printf("cannot open this file\n");
		return -1;
	}
	int pcm_buffer_size=4096;
	char *pcm_buffer=(char *)malloc(pcm_buffer_size);
	int data_count=0;
 
	//Play
	SDL_PauseAudio(0);
 
	while(1){
		if (fread(pcm_buffer, 1, pcm_buffer_size, fp) != pcm_buffer_size){
			// Loop
			fseek(fp, 0, SEEK_SET);
			fread(pcm_buffer, 1, pcm_buffer_size, fp);
			data_count=0;
		}
		printf("Now Playing %10d Bytes data.\n",data_count);
		data_count+=pcm_buffer_size;
		//Set audio buffer (PCM data)
		audio_chunk = (Uint8 *) pcm_buffer; 
		//Audio buffer length
		audio_len =pcm_buffer_size;
		audio_pos = audio_chunk;
		
		while(audio_len>0)//Wait until finish
			SDL_Delay(1); 
	}
	free(pcm_buffer);
	SDL_Quit();
 
	return 0;
}

C语言的播放示例(文章原文)

最简单的视音频播放示例9:SDL2播放PCM_雷霄骅的博客-CSDN博客


 

python也有个例子

参考的文章和代码可以运行,但是有个小bug,参数要参考上面的参数说明,要设置对

GitHub - mrcuck/py_audio_player

博客

python-pcm音频播放器_python 播放pcm_库克先生的博客-CSDN博客

贴上能正确运行的代码,主要是采样率和声道设置一定要正确

import sys
import ctypes
import os
os.environ["PYSDL2_DLL_PATH"] = "D:\SDL2-2.0.14-win32-x64"

from sdl2 import *


class audio_ctx:  # Context

    def __init__(self, fid, flag):
        self.f = open(fid, 'rb')
        self.runflag = flag

    def __del__(self):
        self.f.close


def audio_cb(udata, stream, len):
    c = ctypes.cast(udata, ctypes.py_object).value
    buf = c.f.read(2048)
    if not buf:
        SDL_PauseAudio(1)
        c.runflag = 0
        return
    SDL_memset(stream, 0, len)
    SDL_MixAudio(
        stream, ctypes.cast(
            buf, POINTER(ctypes.c_ubyte)), len, SDL_MIX_MAXVOLUME)


def main():
    print ("begin ...")
    
    SDL_Init(0)
    ctx = audio_ctx('C:/Users/pocea/Desktop/KXWELL/dev/语音识别/pcm-player/16k_10.pcm', 1)
    audiocallback = audio.SDL_AudioCallback(audio_cb)
    reqspec = audio.SDL_AudioSpec(
        16000, audio.AUDIO_S16SYS, 1, 1024, audiocallback, id(ctx))
    spec = audio.SDL_AudioSpec(0, 0, 0, 0)  # nonsence
    audio.SDL_OpenAudio(reqspec,None) #   ctypes.byref(spec))
    SDL_PauseAudio(0)
    while ctx.runflag:
        SDL_Delay(1)
    SDL_Quit()
    print ("exit ...")
    return 0


if __name__ == "__main__":
    sys.exit(main())

关键是下面这几行

reqspec = audio.SDL_AudioSpec(
        16000, audio.AUDIO_S16SYS, 1, 1024, audiocallback, id(ctx))
    spec = audio.SDL_AudioSpec(0, 0, 0, 0)  # nonsence
    audio.SDL_OpenAudio(reqspec,None) #   ctypes.byref(spec))

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

海里的鱼2022

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值