CVPR 2025 NTIRE赛事 | XGC质量评估挑战赛，等你来战！

最新推荐文章于 2025-02-20 13:31:13 发布

我爱计算机视觉

最新推荐文章于 2025-02-20 13:31:13 发布

阅读量451

点赞数

原文链接：https://mp.weixin.qq.com/s?__biz=MzIwMTE1NjQxMQ==&mid=2247627602&idx=1&sn=3d0727f918038e9f8f0684d89fadbcd5&chksm=9765ec8a812fc693a3d0ec122ee826e34b447c920f0a2ae0f87632a223781932081cb7c553f0&scene=126&sessionid=0

版权

关注公众号，发现CV技术之美

CVPR NTIRE（New Trends in Image Restoration and Enhancement）Workshop 是计算机视觉顶会CVPR下极具影响力的国际学术研讨会，聚焦图像复原、图像增强、生成技术、质量评估的突破性进展。为了促进不同类型多媒体内容的持续发展，上海交通大学MMLAB联合美团公司、鹏城实验室数字创意研究所、全国信息技术标准化技术委员会多媒体分技术委员会在第十届CVPR NTIRE Workshop中举办XGC Quality Assessment大赛。

赛道1：用户生成视频

比赛网址：https://codalab.lisn.upsaclay.fr/competitions/21611

随着短视频和用户生成内容（UGC）的爆发式增长，视频质量评价已成为现代互联网多媒体领域的核心问题之一。它不仅关乎视频内容的监测与筛选，还直接影响处理资源的分配和用户体验的提升。尤其是在流媒体业务中，细粒度质量评价作为关键技术，能够对多维度的失真问题进行精准识别和处理，为视频内容的优化提供重要支撑。然而，现有的视频质量评价方法大多局限于单一维度的评估，难以全面反映用户生成视频（UGC）的质量的复杂性和多样性。

针对这一问题，本赛道使用了首个多维细粒度UGC质量评价数据库——FineVD-GC。该数据集涵盖了6个维度的细粒度MOS（Mean Opinion Score）分数，为视频质量评价提供了更加全面和精准的评估标准。参赛者将有机会利用这一高质量数据集，探索多维细粒度视频质量评价的创新方法，解决UGC视频中的失真识别、质量优化等关键问题。通过本次竞赛，我们希望能够汇聚全球顶尖的研究团队，共同突破视频质量评价的技术瓶颈，为流媒体业务的未来发展注入新的活力。

训练集

4,190 个 UGC 视频，每个视频都包含 6 个维度的主观质量标注 MOS（Mean Opinion Score）分数，分别是色彩、噪声、伪影、模糊、时序一致性和整体质量

验证集

1,049 个 UGC 视频

测试集

1,049 个 UGC 视频

主办团队：NTIRE2025 XGC质量评价挑战赛-UGC视频赛道由上海交通大学与全国信息技术标准化技术委员会多媒体分技术委员会共同举办。

其中交大团队成员由胡强、刘笑宏、闵雄阔、张小云、翟广涛教授及其带领的博士后段慧煜，硕士研究生杨柳、博士研究生刘璐组成。共同组织者李婧欣就任于全国信息技术标准化技术委员会多媒体分技术委员会。

在比赛中遇到的任何问题可以联系组织者：胡强（qiang.hu@sjtu.edu.cn）。

赛道2：AI生成视频

比赛网址：https://codalab.lisn.upsaclay.fr/competitions/21485

随着AIGC的蓬勃发展，以Sora、可灵AI为代表的模型引领了视频生成领域的一波热潮，为了推进视频生成这一领域的发展，置信准确的自动化评估生成算法性能成为一个重要任务。

而对于AI生成的视频进行质量评价又和传统UGC视频有很大的区别，在对UGC视频进行质量评价时，用户更多关注视频的清晰度、色彩和光照；对于AI生成的视频，用户在进行质量评价时主要关注视频中物体运动的流畅性和内容的真实性，这就需要提出新的视频质量评价（VQA）方法，以准确预测生成视频的质量。

为此，本赛道以生成视频质量评价为主题，任务是基于视频-prompt及其感知质量标签的先验示例，预测生成视频的感知质量分数。目标是设计一种智能算法，期望能获得一个与人工标注的真实值（MOS分数）尽可能高的相关性指标。

本赛道使用了具有多样性和全面性，涵盖多种场景和内容的Q-Eval-Video数据集，总共包含了34,029个AI生成的视频。这些视频由14个不同的视频生成模型（包括cogvideo、SVD等主流模型）使用4,689条prompt生成。

训练集

23,820 条生成视频及其Prompt和质量标注MOS

验证集

3,402条生成视频及其Prompt

测试集

6,807 条生成视频及其Prompt

主办团队：NTIRE2025 XGC质量评价挑战赛- AI Generated Video赛道由上海交通大学与美团公司共同举办。

其中交大团队成员包括刘笑宏、闵雄阔、胡强、翟广涛教授及其带领的博士后孙伟，博士研究生张子澄、李春一，硕士研究生寇腾川、王书石。美团成员包括曹雪智、王宗宇、李啸宇、马利雅、王玮、任思宇。

在比赛中遇到的任何问题可以联系学生组织者：王书石(wss2002@sjtu.edu.cn)。

赛道3：Talking Head

比赛网址：https://codalab.lisn.upsaclay.fr/competitions/21555

近年来，虚拟数字人的出现为人类探索虚拟现实提供了新的形象和可能。尤其是各种数字人脸驱动方法（称为Talker）层出不穷，从最为经典的Wav2Lip到红极一时的SadTalker再到如今栩栩如生的MuseTalk，在让人应接不暇的同时也让人对说话人脸的质量产生了担忧：_“Who is a Better Talker?”_

为了更好地评估不同Talkers的生成效果，促进人脸驱动算法的进一步发展，我们在NTIRE2025中以Talking Head质量评估作为比赛主题，诚邀各位专家学者共同探讨数字人质量评估的新进展与新方法！

本赛道使用了目前为止规模最大、模态最为齐全的说话人脸质量评估数据集THQA-NTIRE，总共囊括了2D生成式和3D采集式共12,247个说话人脸。

训练集

8,927个说话人脸 (包括800个3D说话人脸)及每个说话人脸的质量标注MOS

验证集

1,714个说话人脸 (包括100个3D说话人脸)

测试集

1,606个说话人脸 (包括100个3D说话人脸)

主办团队：NTIRE2025 XGC质量评价挑战赛-Talking Head赛道由上海交通大学与鹏城实验室共同举办。

其中交大团队成员由刘笑宏、闵雄阔、胡强、翟广涛教授及其带领的博士后贾隽、孙伟，博士研究生周颖杰、张子澄、姜燕炜，硕士研究生朱汐蕾和本科生文发荣组成。鹏城实验室团队成员由郭洁教授及其带领的博士后许俐组成。

在比赛中遇到的任何问题可以联系学生组织者：周颖杰（zyj2000@sjtu.edu.cn）、文发荣（wenfarong@sjtu.edu.cn）。

比赛须知

本次挑战赛面向全社会开放，个人、高等院校、科研单位、企业等人员均可报名参赛。每支队伍在每个赛道中只能提交一种质量评价算法进行最终排名，并且提交的方法必须能够本地运行（禁止提交API）。参赛者允许使用语言大模型进行评估方法的设计，但不包括调用闭源模型API（如GPT-4）。参赛队伍可自由选择是否发表竞赛相关论文，且该选择不会成为参加挑战赛或获奖的必要条件。在各个赛道中，排名靠前的参赛者将被邀请向NTIRE研讨会提交论文，以供同行评审。论文录用后将发表在2025年CVPR研讨会论文集中。排名前三位的队伍更是有机会获得由主办团队提供的奖金（或等值奖品），暂定如下：