ICCV 2021 | 多模态视频分析与推理比赛来了！行为识别、Re-ID、VQA等四项子任务...-CSDN博客

点击下方卡片，关注“CVer”公众号

AI/CV重磅干货，第一时间送达

ICCV2021 “多模态视频分析与推理比赛”开放注册

此次比赛提供四项分任务竞赛：

1. 视频问答(Video Question Answering)；

2. 基于骨架的动作识别(Skeleton-based Action Recognition)；

3. 基于鱼眼视频的动作识别(Fisheye Video-based Action Recognition)；

4. 行人重识别(Person Re-Identification)。

第一个视频问答的比赛是基于最新的VideoQA数据集：SUTD-TrafficQA。这个数据集重点关注基于交通事件的视频推理，包含了6个非常有挑战性的推理任务。SUTD-TrafficQA 包含有10,080个真实场景的视频和62,535个人工标注的问题。下图是SUTD-TrafficQA数据集中的一个例子。

另外三个竞赛（基于骨架的动作识别，基于鱼眼视频的动作识别和行人重识别）是基于最新的，有挑战性的基于无人机视角的视频理解数据集，UAV-Human。UAV-Human重点关注从无人机视角来理解推理人类行为，包含了67,428个视频样本，6种不同的模态，4个人类行为理解任务和119个视频主题。下图包含UAV-Human数据中的多种样例。

下面是本次比赛的时间安排表

比赛报名开放	2021.05.20
训练数据发布	2021.06.09
测试数据发布	2021.06.13
结果提交开放以及比赛报名结束	2021.06.25
结果提交关闭	2021.07.05

欢迎大家参加比赛，获胜队伍将会被邀请到ICCV2021 Workshop介绍自己的工作。有关本次比赛的更多详细信息，请访问网站或点击阅读原文：

https://sutdcv.github.io/multi-modal-video-reasoning

CVPR和Transformer资料下载
后台回复：CVPR2021，即可下载CVPR 2021论文和代码开源的论文合集
后台回复：Transformer综述，即可下载最新的两篇Transformer综述PDF
CVer-Transformer交流群成立
扫码添加CVer助手，可申请加入CVer-Transformer 微信交流群，方向已涵盖：目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch和TensorFlow等群。
一定要备注：研究方向+地点+学校/公司+昵称（如Transformer+上海+上交+卡卡），根据格式备注，可更快被通过且邀请进群
▲长按加小助手微信，进交流群▲点击上方卡片，关注CVer公众号
整理不易，请给CVer点赞和在看