论文笔记: 视频关键帧抽取相关工作

Liekkas Kono

已于 2024-08-06 08:30:18 修改

阅读量1.9k

点赞数 18

分类专栏：论文学习文章标签：论文阅读关键帧抽取

于 2024-08-06 08:25:39 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/shiwanghualuo/article/details/140944007

版权

论文学习专栏收录该内容

22 篇文章

订阅专栏

2024-08-06，星期二，北京，晴

今天来看视频关键帧抽取主题。随着最近Sora文生视频的火热，视频相关的数据获得逐渐变得重要起来。这也就涉及到提取视频关键帧的问题。

从文本生成视频，我们拆分来看，一般流程是先将文本扩写生成几部分，之后将每部分生成对应的图像，这步的图像就可以看做视频的关键帧；最后由这一些关键帧扩展为完整的视频。

而视频关键帧抽取任务则是上述过程的反向操作，目的是构造训练数据使用。目前互联网上完整视频最多。而有对应关键帧的视频数据集则少之又少。

我们主要来看一篇2020年的综述文章Keyframe Extraction Techniques: A Review（https://elektrika.utm.my/index.php/ELEKTRIKA_Journal/article/download/221/136），该工作中系统总结了视频关键帧抽取部分的常用流程和方法。主要有以下几步来做：

在这里插入图片描述

其中，Keyframe Extraction Process主要有Sampling-Based、Shot-Based、Clustering-Based和其他方法

Sampling-Based:

不考虑视频内容，从视频帧中，均匀或者随机采样即可。直白来说就是每隔几帧采样一次。
缺点是：sample所得帧并不一定代表整个video，而且会有大量内容相似的帧。

Shot-Based:

该方法分为两步：首先检测镜头边缘或转换卡点，将video分成小的shots，之后再做关键帧提取，通常选择小的shots的第一帧和最后一帧最为关键帧。因为这两帧图像，很确定有镜头变换的

Clustering-Based:

聚类相似的视频帧图像点，在每一个cluster中，挑选距离cluster最近的作为关键帧。
缺点是：事先确定cluster数量比较困难

关键帧提取算法评估指标：
Compress ratio:
$\frac{N_{k}}{N_{f}}) \times 100\%$
$N_{f}$ : 视频总帧数

$N_{k}$ : 提取的关键帧数目

Precision and Recall:
$\frac{N_{a}}{N_{k}} \times 100\% \\ Recall = \frac{N_{a}}{N_{a} + N_{m}} \times 100\%$

$N_{a}$ : 准确的keyframes数
$N_{k}$ : 提取得到的keyframes数目
$N_{m}$ : 丢失的key frame数目

F-Measure:
$\times \frac{precisioni \times recall}{precision + recall}$

Computational Time:
提取关键帧所用时间

相关开源仓库

https://github.com/Breakthrough/PySceneDetect
https://github.com/keplerlab/katna
https://github.com/amanwalia123/KeyFramesExtraction

博客等级

码龄10年

176
原创

1180
点赞

3366
收藏

365
粉丝

关注

私信

热门文章

分类专栏

工具 58篇
obsidian 2篇
表格识别 1篇
RapidAI 20篇
开源 3篇
论文学习 22篇
杂项 24篇
深度学习算法核心代码系列 5篇
Python 27篇
深度学习 24篇
PyTorch 11篇

展开全部收起

最新评论

PyTorch中torch、torchvision、torchaudio、torchtext版本对应关系
Liekkas Kono: 官网尚未更新。可自行尝试torchvision最新版本
PyTorch中torch、torchvision、torchaudio、torchtext版本对应关系
IRE905: pytorch2.7对应什么啊
Jupyter Notebook 插入图片最便捷方法
qq_55001084: 为什么我的不可以啊
python logging日志重复打印问题解决方案
北风之神c: 总结的很全面的日志使用，写得赞，博主用心了。此国产日志 https://nb-log-doc.readthedocs.io/zh-cn/latest/articles/c1.html 使用原生 loggng封装，兼容性和替换性100%,只需要一行代码大幅简化logging的使用。 1、日志能根据级别能够自动变彩色。 2、print自动变彩色。 3、日志和print在pycahrm控制台的输出都自动可以点击跳转到文件和行号。 4、多进程日志切割安全，文件日志写入性能高。 5、入参简单，能一键自动记录到多种地方。 6、 nb_log 兼容包含loguru色彩模式,loguru只是nb_log的子集之一. 相比 loguru 有10胜。 pip install nb_log 。
数据集托管平台汇总比较
Liekkas Kono: 这就需要去查一下各自文档了

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。