Movies2Scenes: Learning Scene Representations Using Movie Similarities

该研究提出了一种从genre/synopsis/more-like-this信息中选择相似电影,选取前50%相似场景作为正样本的策略。通过将每k帧划分为patch,结合位置嵌入输入到transformer-based网络中,利用对比学习方法学习场景表示。在多个数据集上进行了下游任务的实验,包括在新提出的MovieCL30K和MCD数据集上的预训练和测试。然而,数据集和代码并未公开发布。
摘要由CSDN通过智能技术生成

《2022-arxiv- Movies2Scenes: Learning Scene Representations Using Movie Similarities》
在这里插入图片描述

步骤

  1. 从genre/synopsis/more-like-this information中选出类别相同的电影,然后从相似的电影的找出前50%相似的scene作为positive samples
  2. 将每k帧的frame划分patch,加上position embedding输入到transformer-based的网络中抽取特征,用公式(2)做contrastive learning,学习scene表示
  3. 在多个数据集上进行下游任务

实验

  1. 在新提出的MovieCL30K数据集上预训练,其他数据集作为下游任务训练并测试
  2. 新提了一个MCD数据集

数据集、代码:未公开

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值