2022微信大数据挑战赛优胜方案总结

每天给你送来NLP技术干货!


来自:炼丹笔记

赛题介绍

4b19bd78d70a6044fb726e72e3704724.png

  • 比赛名称:微信多模态短视频

  • 比赛页面:https://algo.weixin.qq.com/

  • 比赛类型:多模态分类

多模态短视频分类是视频理解领域的基础技术之一,在安全审核、推荐运营、内容搜索等领域有着十分非常广泛的应用。一条短视频中通常包含有三种模态信息,即文本、音频、视频,它们在不同语义层面的分类体系中发挥着相互促进和补充的重要作用。

本赛题要求参赛队伍基于微信视频号短视频数据以及对应的分类标签标注,采用合理的机器学习技术对指定的测试短视频进行分类预测。

赛题数据

7ad41804705620dadcf47b9fe57b7b47.png

比赛分为初赛和复赛两个阶段:

  • 初赛阶段提供百万量级的无标注数据和十万量级的有标注数据用于训练;

  • 复赛阶段训练数据和初赛相同,主要区别是初赛阶段只提供视频抽帧特征,而复赛阶段提供视频抽帧原始图像。

初赛阶段所有训练数据对参赛队伍开放下载;复赛阶段的训练数据为闭源数据,参赛队伍在腾讯云TI-ONE平台完成训练。

数据集

d86fe33c9952e0fa9c2e989672c4a2a4.png

比赛提供的数据集有三个类别:无标注训练数据集、有标注训练数据集、测试数据集。各类数据集具体包含字段如下表所示。

字段初赛复赛



训练数据集测试数据集训练数据集测试数据集


无标注有标注无标注有标注


id
category_id××××
title
frames_feature×××
frames×××
asr
ocr

评估标准

6fc4bb2cc338d69e91466f578512135d.png

分类的评估指标采用F1,由于有多个类别,而且类别不均衡,所以同时采用F1 micro和F1 macro,取平均值。同时,分类体系包含一级分类和二级分类,在评测中会分别计算并取平均值。

优胜选手分享

67d4671003491af48e470049776d368d.png

f649a7329cbe2a5e4aa0236e065e2afb.png

苟进决赛

5b7acd522001bf8b27668293b9c81eef.png

b46b087d1f9999a32f3e60d63cb46ede.png

cdbce7940969e096ce82d8df8b8f38e3.png

523e862a585d7f9bdb2150497371906e.png

642c8a246fc8cddaff2e454289bbc2dc.png

490b45589fd18dd91fbf6f1ef2bd3c9e.png

67c1cb3d8913042c6ec17dab87aec845.png

8887232e1997d0bb1a3280a21da166d5.png

5d52406c2f431bcc9596f31d08297244.png

529bff23227caaf8700cf772f8c24a2c.png

冲冲冲

dc0689e6ac54b58c3a4b61eeb04a2cd0.png

e924570f866ac4af5d302ca4eb043808.png

68389a5fdbbbe471c1914dcbf5f569ca.png

c3215ae91eb48683c90652ae0adf799d.png

a7cb2fe1445438f2f4b0dcc5b1c057ce.png

ad6b1b28caeaa0c128524ac0af515fcd.png

c7f3fe414f4501a9e315d4a4bbcfc2dc.png

74272bf7d4927e0f9e8429d97176cd2c.png

751b3f2c0f7a67f5199f4306a4a09052.png

e076fed119593ba4cc78d80f50c0d1bd.png

31e6ff9a842324934ddb9e3f4f483a60.png

a9c50342a7f534f223217293d4e7d588.png

618d6a644ca7f980f016c0caa41b7393.png

抱朴子

fe0b19f00fb3f8331adba1c21c810a23.png

649625d81924598ce2f4d703906c45ab.png

1a950e7ae1dae6912dc23c5d757c9117.png

c93391e6afe44beb7176ef04ca8800b8.png

306fa3b1bf155fe1609c3f67aa4862ea.png

dcdcf0033bdce2d1144f185efc985b3b.png

机器不学习啦

a20bed87aa4dc9838e3c7bea33103852.png

b0a23c61f9e9fdff003ef467f972359d.png

cbe63930b4284153140cbb964b0dd424.png

833eb2aaf74bfbebbef15a67785b786e.png

6ab93202155ce5a0e0e69755b0d5f679.png

f3205675dd1ec0aaefd31dda2da5be55.png

b971aacf0f7ec499bd8ef5753ee35ab1.png

e364e4c32c0791512f17ca01ebcbe24d.png

d8c68fd4868c79ca123e1f77ad321b9d.png

f7a5b94fa1a82361f1e20d21a7b77954.png

9d856aba75612fcb14111516802e0f39.png

Warriors

425130e1fdddb332c4862ffe746393fe.png

ee40692dd52eee8d6f9c0fa2099362d0.png

d01f999a27cb19397ead7c922cc13a66.png

ebb219c8c6539e7b0da74beb3ac658c9.png

bf4540d58b033604493b7a3a53a13884.png

f8169880ecca2ba89d74c3d1ef96b7f6.png

a5fc14e36a459435d05ac570e298f0af.png

b4fdba36840b23fddc0aed002f3d7d0d.png

1e6af0cd11a06b36b41603b87ece366e.png

2c5448ec49090098bf4f48e6c26d2a62.png

蜜度信息

88bca8bc4c76d9d34ecc916ccf3e7a30.png

40d49255ac25a294ede8c99fe57112f7.png

95ddc9da6573f6dbe60aaa0e059c9035.png

71bd18e46ece6d853c38b7f9566ec6fc.png

69b8b72f705c1609605aac84b2086936.png

c35224524f3beb66b401cd11efdb0a9d.png


📝论文解读投稿,让你的文章被更多不同背景、不同方向的人看到,不被石沉大海,或许还能增加不少引用的呦~ 投稿加下面微信备注“投稿”即可。

最近文章

为什么回归问题不能用Dropout?

Bert/Transformer 被忽视的细节

中文小样本NER模型方法总结和实战

一文详解Transformers的性能优化的8种方法

DiffCSE: 将Equivariant Contrastive Learning应用于句子特征学习

苏州大学NLP团队文本生成&预训练方向招收研究生/博士生(含直博生)


投稿或交流学习,备注:昵称-学校(公司)-方向,进入DL&NLP交流群。

方向有很多:机器学习、深度学习,python,情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等。

a3201118b7e89734947ac2125fc21841.png

记得备注~

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值