团队名称
不是吧,阿Sir
团队成员
马千里(华东师范大学)
马镭(华东师范大学)
陶思宇(上海科技大学)
团队名次
全国第四名
赛题描述说明介绍
2023大数据挑战赛赛题说明+决赛评分标准回顾
参赛分享与收获
很庆幸能够在三千多个选手中挤进决赛,比赛最可惜的一点是,在初赛后半阶段以及复赛第一个星期,我们都在尝试端到端的建模方式,但最终方案中没有使用这些方法,耽误了我们大量的时间。我们尝试了Word2Vec(trace,log)、VAE(trace)、Multi-Scale ResNet(trace,log)、BERT-Tokenizer(log)等方式,但是在复赛中效果远不如树模型,我们认为主要原因是题目给到的半结构化数据中实际包含的信息并不多,而结构化的Metirc中蕴含了极大量的信息。
我们自认为做的比较亮眼的地方在于:
1. 使用了ExtraTree作为基模型。这是之前比赛留下来的经验。该模型在小样本及特征不稳定情形下表现较好&#