视频摘要算法综述 ==》Video Synopsis

最新推荐文章于 2023-09-18 09:52:59 发布

山水之间2018

最新推荐文章于 2023-09-18 09:52:59 发布

阅读量7.7k

点赞数 3

分类专栏：视频分析文章标签：视频摘要视频浓缩

本文链接：https://blog.csdn.net/Gavinmiaoc/article/details/101269195

版权

视频分析专栏收录该内容

3 篇文章

订阅专栏

本文探讨视频摘要与浓缩技术，涵盖视频摘要的类型、关键技术和应用领域，包括运动目标检测、轨迹跟踪、背景融合及摘要生成算法，旨在提供视频内容的高效浏览和检索方案。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

广义上来说，摘要可以分为2种，第一种是直接提取视频中的关键帧合成新的视频，该方法虽然也可以缩短视频的时长，但是合成后视频给人一种快进看电影的感觉，而且实际使用较少，所用的方法包括SEDIM，SEDIM-IN，CEA，TEA等方法。

这里分享一个修改后的SEDIM程序，效果很好，http://download.csdn.net/detail/qq_14845119/9840872

算法流程如下图所示，

第二种摘要又称视频浓缩，是对视频内容的一个简单概括，以自动或半自动的方式，先通过运动目标分析，提取运动目标，然后对各个目标的运动轨迹进行分析，将不同的目标拼接到一个共同的背景场景中，并将它们以某种方式进行组合。视频摘要在视频分析和基于内容的视频检索中扮演着重要角色。基于浓缩的摘要是实际使用最广的一种。当然包含技术也更多。

video synopsis实现了将多帧视频融合到了1帧，是一种将时间叠加到空间上的转换。将不同时间出现的人物在同一时间显示出来。

主要技术包括：

（1）背景帧建模，生成一张背景图片，包括抽取静止帧，归一化等方法

（2）运动目标检测，包括帧间差，背景建模，混合高斯，等方法

（3）目标轨迹跟踪提取，包括光流，meanshift，camshift，KCF，TLD，STC，staple，multi-cut等方法

（4）轨迹优化算法，保证摘要后同一帧中的目标物尽量不重合或者最小化的减少重合覆盖问题

（5）目标背景融合拼接，包括阿尔法融合，泊松融合等方法

适用范围：本地视频文件，视频中目标物少，但整体视频长，可以收到良好的浓缩效果。
————————————————

视频摘要简介

视频摘要分为静态视频摘要和动态视频摘要。静态视频摘要其实不算是视频，是关键帧融合而成。动态视频摘要，是对视频片段进行拼接，本身还是视频。

静态视频摘要主要分为：标题，海报和故事板。标题是视频中的文本检测与分析，构成的文本摘要。海报是关键帧组合。故事板是将结合了标题和海报。

动态视频摘要主要分为：精彩集锦和全局缩略。精彩集锦是指精彩片段，比如整场球赛中识别出进球片段。全局缩略是整个时间轴上的视频片段结合，比如电影的全局缩略，就是为了让用户快速看完，但是尽量不漏掉关键信息。

视频摘要的主要步骤

不管是静态视频摘要还是动态视频摘要，主要步骤都是：内容分析和摘要生成。

（1）内容分析主要分为：内部资源分析和外部资源分析。

（2）摘要生成：数据聚类、曲线规划（去冗余再聚类串联）、机器学习-模式识别

数据聚类和曲线规划可以实现视频片段的去冗余和聚类，模式识别等可以实现对视频片段的内容理解。

3、视频摘要评价标准：大小、连续性、冗余性、运动强度

QBB应用场景规划

1、通过运动目标检测出视频中的精彩片段，通过音频分析检测出视频中匹配的音频部分，两部分融合切割出好的片段；

2、通过模式识别方法对切割后的视频片段进行场景理解。

这里可以结合用户上传的视频描述，模式识别分类出的视频场景理解结果，音频分析结果综合判定，给出内容描述。

视频浓缩

视频浓缩技术通过对原始监控视频进行一定的分析处理，进而提取出原视频中的关键信息，并且将这些关键信息进行一定规律的组合，生成一段浓缩视频，且该浓缩视频能体现出原始视频中的内容。视频浓缩技术是一种将原视频进行时空压缩的方法，它首先提取原视频中的运动目标，然后对运动目标进行轨迹跟踪和分析，按照一定的轨迹组合方式将不同时刻的运动目标通过一定的图像合成技术拼接到相同的背景图像中，进而形成浓缩视频。该技术可以将几十个小时的监控视频浓缩成十几分钟的视频，而且不丢失原始运动信息，供用户进行浏览和分析。这样的浓缩视频除了减少视频长度，方便浏览，还可以实现对原视频目标的快速检索，帮助用户迅速地锁定感兴趣的目标。