PCM和WAV格式,Linux下使用ffmpeg命令采集音频数据的方法

音频采集三要素

1.采样大小(位深):一个采样用多少bit存放,常用的是16bit。
2.采样率:采样频率,8K, 16K, 32K, 44.1K, 48K
3.声道数:单声道,双声道,多声道

码率计算

PCM数据音频流码率=采样率x采样大小x声道数

WAV

WAV为微软公司(Microsoft)开发的一种声音文件格式,它符合RIFF(Resource Interchange File Format)文件规范,用于保存Windows平台的音频信息资源,被Windows平台及其应用程序所广泛支持。WAVE文件通常只是一个具有单个“WAVE”块的RIFF文件,该块由两个子块(”fmt”子数据块和”data”子数据块),格式如下图所示:
在这里插入图片描述
该格式的实质就是在PCM文件的前面加了一个文件头,每个字段的的含义为

typedef struct{
	char ChunkID[4];//内容为"RIFF"
	unsigned long ChunkSize;//存储文件的字节数(不包含ChunkID和ChunkSize这8个字节)
	char Format[4];//内容为"WAVE"
}WAVE_HEADER;

typedef struct{
	char Subchunk1ID[4];//内容为"fmt"
	unsigned long Subchunk1Size;//存储该子块的字节数(不含前面的Subchunk1ID和Subchunk1Size这8个字节)
	unsigned short AudioFormat;//存储音频文件的编码格式,例如若为PCM则其存储值为1,若为其他非PCM格式的则有一定的压缩。
	unsigned short NumChannels;//通道数,单通道(Mono)值为1,双通道(Stereo)值为2,等等
	unsigned long SampleRate;//采样率,如8k,44.1k等
	unsigned long ByteRate;//每秒存储的bit数,其值=SampleRate * NumChannels * BitsPerSample/8
	unsigned short BlockAlign;//块对齐大小,其值=NumChannels * BitsPerSample/8
	unsigned short BitsPerSample;//每个采样点的bit数,一般为8,16,32等。
}WAVE_FMT;

typedef struct{
	char Subchunk2ID[4];//内容为“data”
	unsigned long Subchunk2Size;//内容为接下来的正式的数据部分的字节数,其值=NumSamples * NumChannels * BitsPerSample/8
}WAVE_DATA;

例子:
在这里插入图片描述
C++读取WAV音频文件的头部数据的实现方法

Linux使用ffmpeg命令采集音频

ffmpeg -f alsa -i hw:0,0 xxx.wav

在这里插入图片描述
输出的音频文件为out.wav。

使用ffplay即可播放刚刚采集的声音。

ffplay out.wav

在这里插入图片描述

  • 3
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

VectorAL

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值