Movies2Scenes: Learning Scene Representations Using Movie Similarities

最新推荐文章于 2024-04-22 21:07:32 发布

岳额不到五

最新推荐文章于 2024-04-22 21:07:32 发布

阅读量232

点赞数

分类专栏： movie 视频表示学习数据文章标签：视频 transformer

本文链接：https://blog.csdn.net/weixin_40875443/article/details/124916696

版权

movie 同时被 3 个专栏收录

8 篇文章 0 订阅

订阅专栏

数据

5 篇文章 0 订阅

订阅专栏

视频表示学习

1 篇文章 0 订阅

订阅专栏

该研究提出了一种从genre/synopsis/more-like-this信息中选择相似电影，选取前50%相似场景作为正样本的策略。通过将每k帧划分为patch，结合位置嵌入输入到transformer-based网络中，利用对比学习方法学习场景表示。在多个数据集上进行了下游任务的实验，包括在新提出的MovieCL30K和MCD数据集上的预训练和测试。然而，数据集和代码并未公开发布。

摘要由CSDN通过智能技术生成

《2022-arxiv- Movies2Scenes: Learning Scene Representations Using Movie Similarities》
在这里插入图片描述

步骤

从genre/synopsis/more-like-this information中选出类别相同的电影，然后从相似的电影的找出前50%相似的scene作为positive samples
将每k帧的frame划分patch，加上position embedding输入到transformer-based的网络中抽取特征，用公式（2）做contrastive learning，学习scene表示
在多个数据集上进行下游任务

实验

在新提出的MovieCL30K数据集上预训练，其他数据集作为下游任务训练并测试
新提了一个MCD数据集

注

数据集、代码：未公开

岳额不到五

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Movies2Scenes: Learning Scene Representations Using Movie Similarities

《2022-arxiv- Movies2Scenes: Learning Scene Representations Using Movie Similarities》步骤从genre/synopsis/more-like-this information中选出类别相同的电影，然后从相似的电影的找出前50%相似的scene作为positive samples将每k帧的frame划分patch，加上position embedding输入到transformer-based的网络中抽取特征，用公式（
复制链接

扫一扫

专栏目录