TVC: TV Show Caption
链接
-
Paper TVR: A Large-Scale Dataset for Video-Subtitle Moment Retrieval
-
ECCV 2020 首先提出TVR,在此基础上拓展了TVC数据集
-
北卡罗来纳大学教堂山分校
-
-
Leaderboard 目前有一篇文章打榜
- [1] HERO: Hierarchical Encoder for Video+Language Omni-representation Pre-training. EMNLP 2020 在TVC上验证了自己提出的编码器HERO(分层结构编码多模态输入),连接2层的Transformer后,比TVCdataset的baseline提升4.6%的CIDEr
数据集介绍
-
21.8K videos from 6 TV shows, 262K captions paired with 108K moments
-
80% train 10%
-