CVPR 2024 Workshop | 首届短视频质量评价学术竞赛已启动+大型数据集KVQ

关注公众号,发现CV技术之美

55fc68eba4beb77be06bf4802205b66e.png

CVPR NTIRE Workshop是计算机视觉领域极具影响力的国际学术研讨会之一,通常涵盖增强、修复、质量评价等底层视觉比赛内容,对于视觉信号处理领域的发展发挥着重要的作用。为推动短视频领域的发展,建立短视频的质量评价标杆,智能媒体计算实验室(中国科学技术大学)联合快手音视频技术部(快手科技有限公司)在第九届NTIRE研讨会 (即CVPR NTIRE 2024)上举办首届短视频质量评价学术竞赛。

大赛背景

短视频已经成为一种不可替代的主流媒体形式之一,例如快手、抖音、Tiktok等。得益于较低的创作成本、丰富的创作模式、以及短而精的创作内容,极大丰富了人们的生活。然而,在短视频创作、上传、到传输过程中,由于复杂的处理流程和多数非专业的创作环境,使得短视频质量差异较大。因此,如何有效衡量短视频的主观质量成为影响短视频平台发展的一个重要挑战。

为此,我们联合第9届CVPR NTIRE Workshop,组织了首届短视频质量评价学术竞赛,以推动短视频领域质量评价算法的研发,让更多研究者了解短视频数据的产生过程,从而促进短视频媒体领域的发展。

大赛介绍

本次比赛采用名为KVQ的大型短视频质量评价数据集,该数据集由快手公司授权采集,联合中国科学技术大学进行数据集标注和标准化。包含风景、人群、食物、肖像等9个内容场景,其中每个内容比例按照快手短视频平台在线统计量制定, 共计4200个短视频。

具体来说,训练集、验证集、测试集按照70%, 10%和20%划分。

在模型开发阶段,训练集和验证集被提供,参赛者可借助训练集训练模型,并通过官方提供的提交示例,在CodaLab服务器注册提交进行评估。

在测试阶段,竞赛组织方将会公布测试集,最终比赛成绩由比赛组织方以测试集上性能结果进行排名。

大赛官网

  • 比赛网址:https://codalab.lisn.upsaclay.fr/competitions/17638

  • 项目主页:https://lixinustc.github.io/projects/KVQ/

  • 论文链接:KVQ: Kwai Video Quality Assessment for Short-form Videos.  (https://arxiv.org/abs/2402.07220)

  • CVPR NTIRE 2024官网:https://cvlai.net/ntire/2024/

大赛要求

本次学术竞赛面向全社会开放,个人、高等院校、科研单位、企业等人员均可报名参加,每位参赛者在测试提交阶段只允许参加一个队伍,每个队伍人数最多不超过8人。

同时每个队伍只允许提交一个比赛结果进行最终排名,请在提交比赛结果和最终方案说明(即Fact sheets)时确定最终方案和队伍名。

为保证比赛的公平性,如使用额外数据集,请在最终方案中说明。

大赛奖励

每个团队是否提交Workshop论文是个人可选的,不作为评奖要求。会议组织方将邀请成绩靠前的队伍提交CVPR2024 Workshop论文,供同行审稿。参与测试阶段提交的团队,尤其是排名靠前和方案新颖的团队将有机会被邀请共同参与挑战报告的撰写。上述论文录用后将发表于CVPR2024 Workshop论文集中。

会议组织方将为获胜团队将提供比赛奖励和证书(具体后续将会更新到比赛主页),比赛奖励(拟美元或者同等价值礼物)将由快手公司或NTIRE组织方进行发放。

大赛组织方

本次比赛由快手音视频技术部与中国科学技术大学智能媒体实验室联合举办。

竞赛组织者联系方式:

Xin Li (lixin666@mail.ustc.edu.cn)
Kun Yuan (yuankun03@kuaishou.com)
Yajing Pei (peiyj@mail.ustc.edu.cn)
Yiting Lu (luyt31415@mail.ustc.edu.cn)
Ming Sun (sunming03@ kuaishou.com)
Radu Timofte (Radu.Timofte@uni-wuerzburg.de)
Chao Zhou (zhouchao@kuaishou.com)
Zhibo Chen (chenzhibo@ustc.edu.cn)

大赛交流群

下面是大赛官方微信群:如遇到问题(如过期)请联系 peiyj@mail.ustc.edu.cn 处理。

4c7c1f5cf3c8143cb2ac007a0082227c.png

e4c9d1c236d1324ce258abaac9a4d0b1.png

附:比赛KVQ数据集简介

  • 项目主页:https://lixinustc.github.io/projects/KVQ/

0aebb767425c62f56b03defa6463b11b.png
图1:KVQ短视频数据集内容示例

近年来,短视频UGC视频平台取得了突破性的进展,数十亿用户积极上传和分享他们的UGC视频,内容涵盖个人生活、专业技能和教育等。尽管如此,由于非专业拍摄或码率限制造成的主观质量的大幅波动迫切需要开发针对短视频质量评估系统。

如上图所示,短视频质量评估存在两个主要挑战,阻碍了现有视频UGC质量评价方法的应用:(i)存在海量的创作/生成模式,例如特效、三段式(请见图1)和各种内容,包括肖像、风景、食物等,这阻碍了VQA模型准确识别决定质量的区域/内容。(ii)复杂的处理流程,例如转码和增强,以及用户上传的视频中存在的复杂失真,这给视频质量评价模型评估短视频质量带来了很大的挑战。

为了促进短视频领域的发展,中国科学技术大学智能媒体实验室联合快手音视频技术部从快手播放平台收集并标注了4200个具备代表性的短视频,构成短视频质量评价数据KVQ(Kwai Video Quality Assessment Database)。

其中收集流程如下:

6f11f437128be8e47fb71d427509590b.png
图2:KVQ数据集收集流程

该数据集包含短视频中多种典型的创作模式,例如三段式、特效、字幕、直播模式以及其他传统创作模式。同时涵盖了短视频平台视频处理的三大类典型的处理流程,如不同类型的增强、前处理、以及转码方式,极具的代表性和可应用性。

374782ed3e8673fbdff866b332089a03.png

同时本数据集也提供了对应的Baseline算法KSVQE,如上图所示,该算法以3D Swin Transformer作为基础,引入CLIP内容先验,借助区域自适应内容采样以及内容自适应调制方法增强模型对于短视频内容的理解能力,解决短视频内容种类繁多、质量关注区域变化大的问题。

同时基于高效迁移学习进行失真预训练模型失真先验的提取和调制,使其更好区分复杂的短视频失真类型,该算法在短视频质量评价数据集KVQ取得了优越的性能。

906d6fc3adaba337eca1a1c07ac96ce9.jpeg

END

加入「视频质量评估交流群👇备注:VQ

66a58b6f4160cf2982b41393d554978d.png

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
目标检测图片已标注YOLO格式数据集可以在以下地方进行下载: 1. Kaggle(https://www.kaggle.com/):Kaggle是一个数据科学竞赛平台,提供各种数据集供用户下载。在Kaggle的数据集页面上,你可以通过搜索相关关键词或者浏览不同的目录来找到YOLO格式的数据集。选择适合你需求的数据集后,你可以通过点击下载按钮来获取数据集。 2. GitHub(https://github.com/):GitHub是一个源代码托管平台,很多开发者和研究者会在上面分享自己的数据集。你可以在GitHub上搜索关键词加上"YOLO dataset"或者"YOLO format dataset"来查找相应的数据集。当找到合适的仓库时,你可以在仓库的页面上找到数据集的下载链接或者通过克隆仓库来获取数据集。 3. Open Images Dataset(https://storage.googleapis.com/openimages/web/index.html):Open Images Dataset是一个由Google提供的大规模图像数据集,其中包括了一些已经标注的目标检测数据。你可以在官方网站上找到YOLO格式的数据集,并通过点击下载按钮来获取数据集。 4. 研究论文和竞赛网站:一些研究论文或者目标检测竞赛网站会提供YOLO格式的数据集供用户下载。常见的论文网站有arXiv(https://arxiv.org/)和CVPR(https://openaccess.thecvf.com/CVPR2021)。常见的竞赛网站有COCO数据集(http://cocodataset.org/)和ImageNet(http://www.image-net.org/)。你可以在这些网站上找到相关的数据集下载链接。 需要注意的是,不同的数据集可能具有不同的许可证要求,所以在下载和使用数据集时,请查阅相关的许可证信息,并遵守相关的规定。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值