简介:针对无监督视频摘要的深度强化学习,具有多样性代表性奖励
再简介:经过分析,是对视频片段进行特征提取,并以此训练一个模型,然后对视频进行摘要分割,而其中过程中的有一个能存储关键帧的数组,则是需要的结果。(项目利用的方法)
项目目标以及算法的介绍
本项目中旨在的目标是关键帧的提取,并根据提取的关键帧来获取关键视频片段。
首先详细介绍Video-Summarization-Pytorch,这是一个视频摘要技术。所谓视频摘要,就是将视频拆解为简短的片段。采取的方法是开发了一个深度摘要网络(DSN)来进行视频摘要。这个DSN为每个视频帧都预测一个概率,然后根据概率分布选择帧,同时这也是我们需要的获取关键帧所需要的关键步骤。
接下来是论文的分析
学习过程
论文作者将视频摘要描述为一个顺序决策过程。同时开发了一个深度摘要网络(DSN)来预测视频帧的概率,并根据预测的概率分布来决定选择哪些帧。论文作者提出了一个端到端的、基于强化学习的DSN训练框架,其中作者设计了一个多样性-代表性reward函数,它直接评估生成摘要的多样性和代表性,如图所示。
通过强化学习训练深度总结网络(DSN)。DSN接收一个视频Vi并采取行动a(即一系列二进制变量),其中视频的部分被选择为摘要S。反馈奖励R(S)是基于摘要的质量,即多样性和代表性。
Deep Summarization Network
(DSN)采用了