基于视角变化的视频关键帧提取方法（附代码地址）

最新推荐文章于 2025-04-20 17:46:54 发布

帅帅Go

最新推荐文章于 2025-04-20 17:46:54 发布

阅读量1.9k

点赞数 1

分类专栏：算法与人工智能文章标签：关键帧提取三维重建深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41793877/article/details/102642133

版权

算法与人工智能专栏收录该内容

12 篇文章

订阅专栏

本文提出一种基于深度学习的视频关键帧提取方法，利用SuperPoint神经网络模型提取局部特征，根据场景视角变化幅度动态选择关键帧，有效提高三维重建效果并减少图片集冗余。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在这里插入图片描述
基于图像进行三维重建时，需要从视频中提取关键帧，构成图片集合。

从视频中提取关键帧时，一般的方法是按照固定帧率（时间间隔）来进行提取图片。但由于拍摄视频时，场景视角变化幅度有时大有时小，按照固定帧率提取图片集，如果帧率过小，会丢失一些对三维重建比较关键的帧，而如果帧率过大，则提取的图片集合过大，造成不必要的冗余。

本质上来说，不存在一个合适的帧率进行图片提取。用于三维重建的图片集合，只要保持相邻的两个图片之间的场景重复度足够大即可。而根据固定帧率从视频中提取图片集合的方式，没有抓住其本质。

本文提出一种方法，利用深度学习提取局部特征，根据视频中场景视角的变化幅度来提取关键帧，提高了三维重建的效果，且减少了用于三维重建的图片集的冗余。

方法具体过程如下：

将视频的当前帧作为关键帧放入图片集合，利用神经网络模型superpoint，对当前帧进行关键点（像素点坐标集合）和局部特征（像素点对应的特征，用于表示像素点的唯一性）的提取，存储关键点为cur_keypoints，存储局部特征为cur_descriptors；
对视频下一帧，利用同样的方法进行关键点和局部特征的提取，存储关键点为next_keypoints，存储局部特征为next_descriptors。将next_descriptors与cur_descriptors进行匹配，确定出next_keypoints中与cur_keypoints中相对应的关键点，计算出对应关键点之间的距离，然后求出所有对应关键点的平均距离：distance；
如果步骤2中求出的distance大于等于预先设定的距离D，则将步骤2中的帧作为当前帧，返回到步骤1。如果步骤2中求出的distance<D，则返回步骤2考察视频的下一帧。如果视频读取完毕，则结束。

本方法的优点：

避免了由于提取帧率过小，而丢失一些对三维重建时较为关键的帧；
避免了由于提取帧率过大，而造成图片集合不必要的冗余；
利用深度学习方法提取关键点和局部特征，对不同场景具有很好的鲁棒性；
抓住了关键帧提取的本质。

现已将代码上传到github上，以供大家参考学习。代码地址为：https://github.com/markshih91/video_keyframe_extraction

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。