【音视频连载-011】第二季 FFmpeg 一层一层获取文件信息

公众号回复:666,领取学习资源大礼包

本篇文章主要是讲解如何通过 FFmpeg 代码来获取文件信息。

首先准备一个文件,用命令行来查看它的基本信息。

文件地址如下:

https://github.com/glumes/av-beginner/blob/master/resource/video/video-avi-320x320.avi

这个文件很有意思,它的内容是一个时钟,每隔一秒,秒针都会跳动,同时还会发出滴答的声音,很方便后续做音视频同步处理。

执行命令如下:

ffmpeg  -i  your_file_path

得到的结果如下图:

从图中获取如下的信息:

  • 视频时长 duration 为 12s

  • 开始时间点 start  0s

  • 比特率 bitrate 42 kb/s

另外,还可以得出该文件有两路流,一路视频,一路音频。

以上这些信息都可以在一个叫 AVFormatContext 的结构体中得到。

除此之外,还可以看到该视频文件的分辨率是 320x320 ,音频采样率是 8000Hz ,以上信息需要通过一个叫 AVCodecContext 的结构体去获得。

信息获取

本篇文章就讲一讲如何获得 AVFormatContext 并查看它的信息。

核心代码很简单如下:

    // 声明并初始化 AVFormatContext
    AVFormatContext * fmt_ctx = avformat_alloc_context();

    int ret = RET_OK;
    
    // 打开文件
    if ((ret = avformat_open_input(&fmt_ctx, filename, nullptr, nullptr)) < 0) {
        logE( "Cannot open input file");
        return ret;
    }
    
    // 获取文件流相关信息
    if ((ret = avformat_find_stream_info(fmt_ctx, nullptr)) < 0) {
        logE("Cannot find stream information");
        return ret;
    }

只有三个简单的函数调用:

avformat_alloc_context

作用如下:

  • 用来初始化 AVFormatContext 结构体的

  • 要配套使用 avformat_free_context 来释放

avformat_open_input

作用如下:

  • 打开输入文件,通过读取文件头 AVFormatContext 就已经能够获取部分信息了,比如文件地址、文件封装格式、有多少路流等等。

  • 但是更多详细信息还需要通过其他方法来获取,比如流信息

  • 要配套使用 avformat_close_input 来关闭文件,并且要在 avformat_free_context 之前调用,否则就出问题了。

avformat_find_stream_info

作用如下:

  • 探测得到视频文件的具体流信息

av_dump_format

作用如下:

  • 通过该方法可以打印文件的相关信息,它的输出和 FFmpeg 命令行输出的内容基本一样。

具体使用:

av_dump_format(mFormatContext,0,filename,0);

最后要进行相关结构体的释放,不要忘了释放的顺序。

avformat_close_input(&mFormatContext);
avformat_free_context(mFormatContext);

信息查看

当运行成功后,就可以查看 AVFormatContext 包含的具体信息了。

先通过 CLion 的 Structure 工具查看 AVFormatContext 具体包含哪些信息。

在 Android Studio 中也可以这样进行查看,方便快速阅读源码。

然后就可以通过打 Log 或者断点的方式查看运行后的具体某个数据是否符合预期了。

以下是通过断点的方式:

以下是通过打 Log 的方式:

    logI("file path is %s", mFormatContext->filename);
    logI("iformat name is %s", mFormatContext->iformat->name);
    logI("nb_streams is %d", mFormatContext->nb_streams);
    logI("bitrate is %lld", mFormatContext->bit_rate);
    logI("duration is %lld", mFormatContext->duration);
    logI("start time is %lld",mFormatContext->start_time);

打印的结果如下:

 [av-beginner]: iformat name is avi
 [av-beginner]: nb_streams is 2
 [av-beginner]: bitrate is 42912
 [av-beginner]: duration is 12000000
 [av-beginner]: start time is 0

可以看到和通过命令行显示的内容基本一致,除了在比特率上在有着些许误差,总的来说符合预期。

想要看更多信息的话,自己也可以去打印或者断点查看。

总结

以上就是音视频基础学习连载的 011 篇。

通过代码来查看文件信息,信息都存储在 AVFormatContext 的各个字段上,只是通过一些方法去获取、填充这些字段。

后面会继续讲到如何创建和获取 AVCodecContext ,敬请期待~~~

本文具体代码见仓库:

https://github.com/glumes/av-beginner

仓库的代码会比文章提前更新,想要抢先知道后续内容,就关注代码吧,欢迎 star 。

能力有限,文中有不对之处,欢迎加我微信 ezglumes 进行交流~~


推荐阅读:

喜欢就点个「在看」吧 ▽

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 支持向量机非线性回归通用MATLAB程序解析 #### 一、概述 本文将详细介绍一个基于MATLAB的支持向量机(SVM)非线性回归的通用程序。该程序采用支持向量机方法来实现数据的非线性回归,并通过不同的核函数设置来适应不同类型的数据分布。此外,该程序还提供了数据预处理的方法,使得用户能够更加方便地应用此程序解决实际问题。 #### 二、核心功能与原理 ##### 1. 支持向量机(SVM) 支持向量机是一种监督学习模型,主要用于分类和回归分析。对于非线性回归任务,SVM通过引入核技巧(kernel trick)将原始低维空间中的非线性问题转换为高维空间中的线性问题,从而实现有效的非线性建模。 ##### 2. 核函数 核函数的选择直接影响到模型的性能。本程序内置了三种常用的核函数: - **线性核函数**:`K(x, y) = x'y` - **多项式核函数**:`K(x, y) = (x'y + 1)^d` - **径向基函数(RBF)**:`K(x, y) = exp(-γ|x - y|^2)` 其中RBF核函数被广泛应用于非线性问题中,因为它可以处理非常复杂的非线性关系。本程序默认使用的是RBF核函数,参数`D`用于控制高斯核函数的宽度。 ##### 3. 数据预处理 虽然程序本身没有直接涉及数据预处理的过程,但在实际应用中,对数据进行适当的预处理是非常重要的。常见的预处理步骤包括归一化、缺失值处理等。 ##### 4. 模型参数 - **Epsilon**: ε-insensitive loss function的ε值,控制回归带宽。 - **C**: 松弛变量的惩罚系数,控制模型复杂度与过拟合的风险之间的平衡。 #### 三、程序实现细节 ##### 1. 函数输入与输出 - **输入**: - `X`: 输入特征矩阵,维度为(n, l),其中n是特征数量,l是样本数量。 - `Y`: 目标值向量,长度为l。 - `Epsilon`: 回归带宽。 - `C`: 松弛变量的惩罚系数。 - `D`: RBF核函数的参数。 - **输出**: - `Alpha1`: 正的拉格朗日乘子向量。 - `Alpha2`: 负的拉格朗日乘子向量。 - `Alpha`: 拉格朗日乘子向量。 - `Flag`: 标记向量,表示每个样本的类型。 - `B`: 偏置项。 ##### 2. 核心代码解析 程序首先计算所有样本间的核矩阵`K`,然后构建二次规划问题并求解得到拉格朗日乘子向量。根据拉格朗日乘子的值确定支持向量,并计算偏置项`B`。 - **核矩阵计算**:采用RBF核函数,通过`exp(-(sum((xi-xj).^2)/D))`计算任意两个样本之间的相似度。 - **二次规划**:构建目标函数和约束条件,使用`quadprog`函数求解最小化问题。 - **支持向量识别**:根据拉格朗日乘子的大小判断每个样本是否为支持向量,并据此计算偏置项`B`。 #### 四、程序扩展与优化 - **多核函数支持**:可以通过增加更多的核函数选项,提高程序的灵活性。 - **自动调参**:实现参数自动选择的功能,例如通过交叉验证选择最优的`Epsilon`和`C`值。 - **并行计算**:利用MATLAB的并行计算工具箱加速计算过程,特别是当样本量很大时。 #### 五、应用场景 该程序适用于需要进行非线性回归预测的场景,如经济预测、天气预报等领域。通过调整核函数和参数,可以有效应对各种类型的非线性问题。 ### 总结 本程序提供了一个支持向量机非线性回归的完整实现框架,通过灵活的核函数设置和参数调整,能够有效地处理非线性问题。对于需要进行回归预测的应用场景,这是一个非常实用且强大的工具。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值