硬核音频格式转换[ffmpeg]

pcm转wav格式

pcm我电脑听不了,转成wav格式可以听。

windows 版本 :https://ffmpeg.zeranoe.com/builds/

根据文档说明,
如果要将pcm转为wav格式,则输入如下命令:

ffmpeg.exe -acodec pcm_s16le -f s16le -ac 1 -ar 16000 -i 16k_1.pcm -ac 1 -ar 16000 16k.wav

在这里插入图片描述

m4a转其他格式

我不就想用个m4a格式的音频转pcm,再语音识别吗?
你瞧瞧,百度官方这里说的是人话吗:

pcm(不压缩),也称为raw格式。音频输入最原始的格式,不用再解码。
wav(不压缩,pcm编码):在pcm文件的开头出上加上一个描述采样率,编码等信息的字节。
amr(有损压缩格式),对音频数据进行有损压缩,类似mp3文件。
m4a(有损压缩格式,AAC编码),对音频数据进行有损压缩,通常仅供微信小程序使用的格式。自行转换比较复杂
.
pcm,wav,amr,m4a(m4a仅支持极速版
.
语音识别标准版:2QPS免费
语音识别极速版:根据实际调用的次数,系统每小时会对您的百度云账户进行扣费。用多少付多少。根据月累计调用量,可自动享受阶梯折扣。同时,可购买预付次数包。购买后一年内有效,价格更优惠。

试了下:

ffmpeg.exe -i 20191211_101535.m4a -acodec pcm_s16le -f s16le -ac 1 -ar 16000 -i 16k_1.pcm

确实不行。

但m4a转mp3是可以的:

ffmpeg.exe -i 20191211_101535.m4a result.mp3

在这里插入图片描述
pcm转wav也是可以的。

ffmpeg.exe -i 20191211_101535.m4a result.wav

就是转pcm不行,报错如下:
在这里插入图片描述
那就直接用wav切分后再用就行了呗。

尝试

在我不屈不挠的探索下,发现即使用m4a转换成wav格式的音频,也可以用开源C++代码进行分割。所以就已经达到我的目标了。
在这里插入图片描述
集成Webrtc的VAD,用于切分音频文件 https://github.com/Baidu-AIP/speech-vad-demo

具体怎么切分,请看另一节。将音频分割为60s内的短文件

资料

音频文件转码 http://ai.baidu.com/ai-doc/SPEECH/7k38lxpwf

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值