FFmpeg源码分析：音频滤镜介绍(下)

最新推荐文章于 2024-05-27 15:14:25 发布

音视频开发老马

最新推荐文章于 2024-05-27 15:14:25 发布

阅读量489

点赞数

文章标签： ffmpeg 音视频

本文链接：https://blog.csdn.net/yinshipin007/article/details/130157362

版权

本文深入介绍了FFmpeg的音频滤镜，包括amerge的声道合并，amix的混音操作，apad的静音填充，atempo的变速功能，chorus的合唱效果，haas的哈斯效应，以及silencedetect的静音检测。通过这些滤镜，可以对音频流进行丰富多样的处理和调整。

摘要由CSDN通过智能技术生成

FFmpeg在libavfilter模块提供音视频滤镜。所有的音频滤镜都注册在libavfilter/allfilters.c。我们也可以使用ffmpeg -filters命令行来查看当前支持的所有滤镜，前面-a代表音频。本篇文章主要介绍音频滤镜，包括：混音、静音填充、哈斯效应、合唱效果、均衡器、iir与fir滤波器、低通滤波器、带通滤波器、高通滤波器、变速变调、音量调节、静音检测。

关于音频滤镜的详细介绍，可查看官方文档：音频滤镜。上半部分的音频滤镜，可查看：音频滤镜介绍(上)。

1、amerge

合并，把两个或多个音频流合并到一个多通道的输出流。假如输入声道布局是交错的，那么输出声道布局相应地设置，声道根据需要进行重新排序。相反，假如输入声道布局不是交错的，那么先是第一个输入流的所有声道，然后是第二个输入流，依次类推。

比如合并两个音频流，参考命令如下：

ffmpeg -i one.mp3 -i two.mp3 -filter_complex [0:a][1:a]amerge=inputs=2[aout] -map [aout] out.mp3

2、amix

混音，把所有输入音频流混合成单个音频流。该滤镜仅支持浮点采样格式。如果是整型采样格式，会自动转换成浮点采样格式。参数选项如下：

inputs：输入音频数，默认为2
duration：混音后的音频时长
longest：使用最长的输入流时长(默认)
shortest：使用最短的输入流时长
first：使用第一个输入流时长
dropout_transition：过渡时间，默认为2秒
weights：每个音频流的占比权重，默认所有音频流权重相同
normalize：是否开启归一化，默认开启

混音代码位于libavfilter/af_amix.c，核心代码如下：

// 从FIFO队列读取若干采样数据，然后混音，写到输出缓冲区
static int output_frame(AVFilterLink *outlink)
{
    AVFilterContext *ctx = outlink->src;
    MixContext      *s = ctx->priv;
    AVFrame *out_buf, *in_buf;
    int nb_samples, ns, i;
 
    if (s->input_state[0] & INPUT_ON) {
        nb_samples = frame_list_next_frame_size(s->frame_list);
        for (i = 1; i < s->nb_inputs; i++) {
            if (s->input_state[i] & INPUT_ON) {
                ns = av_audio_fifo_size(s->fifos[i]);
                if (ns < nb_samples) {

最低0.47元/天解锁文章

音视频开发老马

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
FFmpeg源码分析：音频滤镜介绍(下)

本篇文章主要介绍音频滤镜，包括：混音、静音填充、哈斯效应、合唱效果、均衡器、iir与fir滤波器、低通滤波器、带通滤波器、高通滤波器、变速变调、音量调节、静音检测。相反，假如输入声道布局不是交错的，那么先是第一个输入流的所有声道，然后是第二个输入流，依次类推。混音时，如果是浮点数据调用vector_fmac_scalar函数指针，来自libavutil/float_dsp.h的AVFloatDSPContext结构体一个成员变量。因此，延迟的声音听起来会更慢或更快，即延迟的声音会围绕原始声音进行调谐。
复制链接

扫一扫