音频文件转码工具文档 目录 1. 音频文件转码 1 1.1. 简介 1 1.2. 转换命令示例 2 1.3. wav 文件转 16k 16bits 位深的单声道pcm文件 2 1.4. mp3 文件转

本文档详细介绍了如何使用ffmpeg工具将不同格式的音频文件转码为符合语音识别要求的格式,如pcm、wav和amr。内容涵盖转码命令示例、参数设置以及输出音频的格式要求,包括采样率、位深和声道数。此外,还提供了查看音频文件格式的ffprobe使用方法。
摘要由CSDN通过智能技术生成

音频文件转码工具文档

目录

1. 音频文件转码 1

1.1. 简介 1

1.2. 转换命令示例 2

1.3. wav 文件转 16k 16bits 位深的单声道pcm文件 2

1.4. mp3 文件转 16K 16bits 位深的单声道 pcm文件 2

1.5. M4a转换pcm 3

1.6. M4a转换wav 3

1.7. ffmpeg 使用说明 3

1.7.1. 简介 3

1.7.2. 编译参数与支持格式 4

1.7.3. 输入音频参数 4

1.7.4. 输出音频参数 4

1.8. 输出amr-nb 音频 :全称是:Adaptive Multi-Rate,自适应多速率 5

1.8.1. 常用参数 6

1.8.2. 参数拼接 6

1.9. 查看音频格式ffprobe使用 6

1.10. pcm文件音频时长计算 8

 

 

  1. 音频文件转码
    1. 简介

本文描述如何从其它格式的音频转成符合语音识别输入要求格式的音频文件。

由于底层识别使用的是pcm,因此推荐直接上传pcm文件。如果上传其它格式,会在服务器端转码成pcm,调用接口的耗时会增加。

语音识别仅支持以下格式 :pcm(不压缩)、wav(不压缩,pcm编码)、amr(有损压缩格式);8k/16k 采样率 16bit 位深的单声道。即:

  1. pcm wav amr 格式三选一。 正常情况请使用pcm。其中wav格式需要使用pcm编码。
  2. 采用率二选一 8000 或者 16000。正常情况请使用16000
  3. 单声道

示例音频文件下载

    1. 转换命令示例
    2. wav 文件转 16k 16bits 位深的单声道pcm文件

ffmpeg -y  -i 16k.wav  -acodec pcm_s16le -f s16le -ac 1 -ar 16000 16k.pcm 

44100 采样率 单声道 16bts pcm 文件转 16000采样率 16bits 位深的单声道pcm文件

ffmpeg -y -f s16le -ac 1 -ar 44100 -i test44.pcm  -acodec pcm_s16le -f s16le -ac 1 -ar

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值