之前我们使用FFmpeg命令行工具进行了简单的音视频操作,这次在Mac OS环境下编写代码实现简单的音频录制功能。
FFmpeg命令行音频录制
首先回顾一下Mac OS环境下简单的音频录制命令行实现:
ffmpeg -f avfoundation -i ":0" -t 20 -acodec pcm_s16le -ar 44100 -ac 2 ~/Desktop/output.wav
参数说明:
- • -f avfoundation:指定输入设备为 avfoundation,用于音频录制。
- • -i ":0":指定录制的音频输入源。
- • -t 20:指定录制的时长,单位为秒。
- • -acodec pcm_s16le:指定音频编码器为 pcm_s16le,即无压缩的 PCM 格式。
- • -ar 44100:指定音频采样率为 44100 Hz,即每秒采样 44100 次。
- • -ac 2:指定音频通道数为 2,即立体声。
- • ~/Desktop/output.wav:指定输出文件路径和文件名。可以根据需要修改输出文件的格式和路径。
当然部分参数可以省略:
ffmpeg -f avfoundation -i ":0" -t 20 ~/Desktop/output.wav
下面我们将编程实现简化后的音频录制功能,即录制一段20秒的音频保存在指定位置。
编程实现音频录制功能
利用FFmpeg的api进行音频录制操作,先了解一下其中一些常用api
相关API
- AVInputFormat
AVInputFormat 是 FFmpeg 中表示输入媒体格式的结构体。每个输入媒体格式(例如:MP4、AVI、FLV 等)都对应一个 AVInputFormat 结构体。它包含了该格式的名称、扩展名、支持的输入编解码器等信息。
使用 AVInputFormat 结构体,你可以根据输入文件的格式选择合适的输入格式,或者根据需要注册自定义的输入格式。
- AVOutputFormat
AVOutputFormat 是 FFmpeg 中表示输出媒体格式的结构体。每个输出媒体格式(例如:MP4、AVI、FLV 等)都对应一个 AVOutputFormat 结构体。它包含了该格式的名称、扩展名、支持的输出编解码器等信息。
使用 AVOutputFormat 结构体,你可以根据输出文件的格式选择合适的输出格式,或者根据需要注册自定义的输出格式。
- AVFrame:
AVFrame 是 FFmpeg 中表示音视频帧的结构体。它包含了音视频帧的原始数据和相关的信息,如时间戳、宽度、高度等。每个 AVFrame 对应一个音频或视频帧。
AVFrame 可以用于存储解码后的音视频帧数据,以及进行音视频处理、转码等操作。它提供了用于访问和操作音视频数据的函数和成员变量,如 data、linesize、pts 等。
- AVFormatContext
AVFormatContext 是 FFmpeg 中表示音视频容器格式的上下文结构体。它包含了音视频文件的整体信息,如文件名、格式、时长、流信息等。AVFormatContext 是操作输入或输出文件的主要数据结构之一。
在音频录制或音视频处理中,你可以通过打开输入文件获得一个 AVFormatContext 结构体,用于读取输入文件的相关信