pcm转wav格式
pcm我电脑听不了,转成wav格式可以听。
windows 版本 :https://ffmpeg.zeranoe.com/builds/
根据文档说明,
如果要将pcm转为wav格式,则输入如下命令:
ffmpeg.exe -acodec pcm_s16le -f s16le -ac 1 -ar 16000 -i 16k_1.pcm -ac 1 -ar 16000 16k.wav
m4a转其他格式
我不就想用个m4a格式的音频转pcm,再语音识别吗?
你瞧瞧,百度官方这里说的是人话吗:
pcm(不压缩),也称为raw格式。音频输入最原始的格式,不用再解码。
wav(不压缩,pcm编码):在pcm文件的开头出上加上一个描述采样率,编码等信息的字节。
amr(有损压缩格式),对音频数据进行有损压缩,类似mp3文件。
m4a(有损压缩格式,AAC编码),对音频数据进行有损压缩,通常仅供微信小程序使用的格式。自行转换比较复杂。
.
pcm,wav,amr,m4a(m4a仅支持极速版)
.
语音识别标准版:2QPS免费
语音识别极速版:根据实际调用的次数,系统每小时会对您的百度云账户进行扣费。用多少付多少。根据月累计调用量,可自动享受阶梯折扣。同时,可购买预付次数包。购买后一年内有效,价格更优惠。
试了下:
ffmpeg.exe -i 20191211_101535.m4a -acodec pcm_s16le -f s16le -ac 1 -ar 16000 -i 16k_1.pcm
确实不行。
但m4a转mp3是可以的:
ffmpeg.exe -i 20191211_101535.m4a result.mp3
pcm转wav也是可以的。
ffmpeg.exe -i 20191211_101535.m4a result.wav
就是转pcm不行,报错如下:
那就直接用wav切分后再用就行了呗。
尝试
在我不屈不挠的探索下,发现即使用m4a转换成wav格式的音频,也可以用开源C++代码进行分割。所以就已经达到我的目标了。
集成Webrtc的VAD,用于切分音频文件 https://github.com/Baidu-AIP/speech-vad-demo
具体怎么切分,请看另一节。将音频分割为60s内的短文件