kdd数据集_KDD首次开办AutoML竞赛!自动机器学习第一次

雷刚 发自 凹非寺

量子位 报道 | 公众号 QbitAI

2ea2828c64e8dc8ea79e7a77615be95d.png

KDD首次,也是自动机器学习的首次。

2019年国际数据挖掘顶级会议KDD (ACM SIGKDD CONFERENCE ON KNOWLEDGE DISCOVERY AND DATA MINING),已正式公布了KDD Cup 2019三项重大比赛。

其中,首次引入的AutoML Competition挑战赛。

现在,数据集已放出,挑战赛已开赛,7月16日将开始评审,7月20日会宣布KDD Cup冠军。

第一名将获得15000美元奖金。

比赛详情

本次AutoML竞赛由第四范式和微软承办,参赛选手将利用时序关系数据,设计一个能够自主(无人为干预)实现监督学习的AutoML计算机程序。

该比赛将聚焦在二分类问题,且时序关系数据均来自实际业务场景。

根据大多数实际应用的时间属性,数据集按时间顺序划分为训练集和测试集。

训练集和测试集都由一个主表、一组相关表和一个关系图组成:

5260b1565111f75e9c11e3d1c24cddd1.png

主表包含带有样本标记、部分特征和时序标签的实例,用于二分类。

相关表包含了主表中实例的重要辅助信息,可用于提高预测效果。相关表中的字段可能含有时间标签,意味着该表中的信息与时间有关。

不同表中数据之间的关系用关系图描述。需要注意的是,任何两个表(主表或相关表)都可以有一个关系,任何一对表最多只能有一个关系。

主办方保证训练集和测试集的关系图是相同的。

参赛者需要提交通过主表、相关表和关系图自动构建机器学习模型的AutoML方案。

一旦经过训练,模型将以测试主表(不包括样本标记)、相关表和关系图作为输入,并预测测试集的样本标记。参赛者提交的方案将在受限制的计算资源和时间内进行测试。

为了让参赛者能够更好的开发并评估方案,主办方提供了10个时序关系数据集,其中5个公共数据集,5个私有数据集。

数据集地址如下:

https://www.4paradigm.com/competition/kddcup2019#data

比赛流程

本次挑战赛分为Feedback(反馈)、Check(校验)、AutoML(盲测)3个阶段。

Feedback阶段,参赛者基于公开数据集设计并提交AutoML方案。

Check阶段,方案在参赛者无法看到效果的条件下,在私有数据集上进行测试,确保方案在下一阶段顺利运行。

AutoML阶段将测试方案在私有数据集上的性能,无需人为干预情况下完成训练和预测,最终按照AUC进行排名。

具体时间表为:

2019年4月1日:比赛开始,发布公共数据集。参与者可以开始提交代码并在排行榜上获得即时反馈信息。

2019年6月27日:Feedback阶段结束,Feedback阶段的代码自动迁移到Test阶段。

2019年7月7日:Check阶段结束,主办方开始代码验证。

2019年7月11日:提交报告的截止日期。

2019年7月16日:AutoML阶段结束,开始评审流程。

2019年7月20日:宣布KDD Cup冠军。

2019年8月4日:在KDD上举办颁奖仪式

奖金情况:

  • 第一名:15000美元
  • 第二名:10000美元
  • 第三名:5000美元
  • 第4-10名:每人500美元

报名资质

最后,再介绍下报名资质:

本次竞赛将在CodaLab竞赛平台上进行。

本次竞赛对所有感兴趣的研究人员、专家和学生完全开放,竞赛组委会成员及相关人员不得参赛。

参赛者可以由一人或多人组成的团队提交方案。

每个团队都需要指定领队,负责与组织者沟通。

一个人只能加入一个团队。

根据AutoML阶段的最终得分来选出比赛的胜利者。

若最终比分相同,则优先考虑解释性更好的方案。

每个参赛团队都必须提供描述其最终解决方案的简短报告(情况说明书)。

通过参加本次竞赛,您将授权组织者权利,对您提交的作品以进行评估和赛后研究。

所有参赛队伍必须在Check阶段两周前至少有一次成功的代码提交,否则视为无效队伍,不参与最终评测。

传送门:

https://www.4paradigm.com/competition/kddcup2019#data

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
提供的源码资源涵盖了Java应用等多个领域,每个领域都包含了丰富的实例和项目。这些源码都是基于各自平台的最新技术和标准编写,确保了在对应环境下能够无缝运行。同时,源码中配备了详细的注释和文档,帮助用户快速理解代码结构和实现逻辑。 适用人群: 适合毕业设计、课程设计作业。这些源码资源特别适合大学生群体。无论你是计算机相关专业的学生,还是对其他领域编程感兴趣的学生,这些资源都能为你提供宝贵的学习和实践机会。通过学习和运行这些源码,你可以掌握各平台开发的基础知识,提升编程能力和项目实战经验。 使用场景及目标: 在学习阶段,你可以利用这些源码资源进行课程实践、课外项目或毕业设计。通过分析和运行源码,你将深入了解各平台开发的技术细节和最佳实践,逐步培养起自己的项目开发和问题解决能力。此外,在求职或创业过程中,具备跨平台开发能力的大学生将更具竞争力。 其他说明: 为了确保源码资源的可运行性和易用性,特别注意了以下几点:首先,每份源码都提供了详细的运行环境和依赖说明,确保用户能够轻松搭建起开发环境;其次,源码中的注释和文档都非常完善,方便用户快速上手和理解代码;最后,我会定期更新这些源码资源,以适应各平台技术的最新发展和市场需求。 所有源码均经过严格测试,可以直接运行,可以放心下载使用。有任何使用问题欢迎随时与博主沟通,第一时间进行解答!

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值