音频文件转码工具文档
目录
1.3. wav 文件转 16k 16bits 位深的单声道pcm文件 2
1.4. mp3 文件转 16K 16bits 位深的单声道 pcm文件 2
1.8. 输出amr-nb 音频 :全称是:Adaptive Multi-Rate,自适应多速率 5
本文描述如何从其它格式的音频转成符合语音识别输入要求格式的音频文件。
由于底层识别使用的是pcm,因此推荐直接上传pcm文件。如果上传其它格式,会在服务器端转码成pcm,调用接口的耗时会增加。
语音识别仅支持以下格式 :pcm(不压缩)、wav(不压缩,pcm编码)、amr(有损压缩格式);8k/16k 采样率 16bit 位深的单声道。即:
- pcm wav amr 格式三选一。 正常情况请使用pcm。其中wav格式需要使用pcm编码。
- 采用率二选一 8000 或者 16000。正常情况请使用16000
- 单声道
ffmpeg -y -i 16k.wav -acodec pcm_s16le -f s16le -ac 1 -ar 16000 16k.pcm
44100 采样率 单声道 16bts pcm 文件转 16000采样率 16bits 位深的单声道pcm文件
ffmpeg -y -f s16le -ac 1 -ar 44100 -i test44.pcm -acodec pcm_s16le -f s16le -ac 1 -ar