点击下方卡片,关注“CVer”公众号
AI/CV重磅干货,第一时间送达
ICCV2021 “多模态视频分析与推理比赛”开放注册
此次比赛提供四项分任务竞赛:
1. 视频问答(Video Question Answering);
2. 基于骨架的动作识别(Skeleton-based Action Recognition);
3. 基于鱼眼视频的动作识别(Fisheye Video-based Action Recognition);
4. 行人重识别(Person Re-Identification)。
第一个视频问答的比赛是基于最新的VideoQA数据集:SUTD-TrafficQA。这个数据集重点关注基于交通事件的视频推理,包含了6个非常有挑战性的推理任务。SUTD-TrafficQA 包含有10,080个真实场景的视频和62,535个人工标注的问题。下图是SUTD-TrafficQA数据集中的一个例子。
另外三个竞赛(基于骨架的动作识别,基于鱼眼视频的动作识别和行人重识别)是基于最新的,有挑战性的基于无人机视角的视频理解数据集,UAV-Human。UAV-Human重点关注从无人机视角来理解推理人类行为,包含了67,428个视频样本,6种不同的模态,4个人类行为理解任务和119个视频主题。下图包含UAV-Human数据中的多种样例。
下面是本次比赛的时间安排表
比赛报名开放 | 2021.05.20 |
训练数据发布 | 2021.06.09 |
测试数据发布 | 2021.06.13 |
结果提交开放以及比赛报名结束 | 2021.06.25 |
结果提交关闭 | 2021.07.05 |
欢迎大家参加比赛,获胜队伍将会被邀请到ICCV2021 Workshop介绍自己的工作。有关本次比赛的更多详细信息,请访问网站或点击阅读原文:
https://sutdcv.github.io/multi-modal-video-reasoning
CVPR和Transformer资料下载
后台回复:CVPR2021,即可下载CVPR 2021论文和代码开源的论文合集
后台回复:Transformer综述,即可下载最新的两篇Transformer综述PDF
CVer-Transformer交流群成立
扫码添加CVer助手,可申请加入CVer-Transformer 微信交流群,方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch和TensorFlow等群。
一定要备注:研究方向+地点+学校/公司+昵称(如Transformer+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群
▲长按加小助手微信,进交流群▲点击上方卡片,关注CVer公众号
整理不易,请给CVer点赞和在看