KDD Cup 2019 再确认新赛事!主打「智能出行」,由百度主办 ...

雷锋网 AI 科技评论按:作为目前数据挖掘领域最有影响力、最高水平的国际顶级赛事,KDD Cup 每年都会吸引世界数据挖掘界的顶尖专家、学者、工程师、学生等前来参赛,被外界誉为大数据领域的「奥运会」。据官网消息,今年 KDD Cup 的 Regular ML Track(常规机器学习挑战赛)主打「智能出行」,由百度主办。

TB1URh3Q7zoK1RjSZFlXXai4VXa.jpg

需要强调的是,今年赛事为了让更多人参与进来,除了 Regular ML Track(常规机器学习挑战赛)外,还首次增设了 Auto-ML Track(自动机器学习挑战赛)与 Humanity RL Track(以人为本的强化学习挑战赛)两场比赛。

上周我们对 Auto-ML Track 进行了报道,赛事同样由来自中国的公司——第四范式主办、ChaLearn 和微软协办。而 Humanity RL Track 还未有相关消息发布。

TB1z99nQ4naK1RjSZFBXXcW7VXa.jpg

今年的 Regular ML Track 于 4 月 10 日开赛,赛事持续至 8 月份 KDD 大会召开为止。

百度以「智能出行」为主题布置了两大任务,分别为「场景感知的多模态出行推荐」与「开放应用挑战赛」。前者需要参赛者在考虑城市复杂出行情境下比较各种出行方式,如步行、骑车、打车,以及各种出行方式的组合方案;后者则允许参赛者利用百度开放的大数据自由命题,探索百度大数据在智能城市领域的应用。

关于此次大赛的赛题设置,百度研究院商业智能实验室主任熊辉教授表示:「题目和智能出行相关,多模态出行推荐除了可以为百度地图用户提供更好的用户体验外,还有巨大的社会意义,可减少整体出行时间,平衡交通流量,减少交通拥堵,并最终促进智能交通系统的发展。」

TB1xCl_Q3HqK1RjSZFkXXX.WFXa.jpg TB1xfqcQ4YaK1RjSZFnXXa80pXa.jpg

为了帮助参赛者更好地完成任务,百度将于 4 月 13 日公布从百度地图采集的免费数据集,此外,参赛者被允许利用其他来自网络的信息(如气象数据)来完成任务。

据官网介绍,开放的数据集将能够反映用户与应用之间的交互关系,这些数据可细分为查询记录、显示记录与点击记录,每条记录分别对应关联的会话 ID 与时间戳。此外,百度还将以抹去隐私的方式放出可以反映用户出行偏好的资料。

TB16sV3QVzqK1RjSZFoXXbfcXXa.jpg

查询记录示例

TB171d1Q9zqK1RjSZFHXXb3CpXa.jpg

显示记录示例

TB129xUQ9zqK1RjSZFLXXcn2XXa.jpg

点击记录示例

TB1cwl1Q4TpK1RjSZFMXXbG_VXa.jpg

用户属性示例(可反映用户出行偏好)

今年 Regular ML Track 的具体赛程安排如下:

任务一(场景感知的多模态出行推荐)

2019 年 4 月 10 日,注册网站开通

2019 年 4 月 13 日,发布数据集

2019 年 4 月 17 日,第一阶段的每日评估正式启动

2019 年 4 月 30 日,组队截止日期

2019 年 5 月 30 日,提交第一阶段的最终结果

2019 年 5 月 31 日,第二阶段的每日评估正式启动

2019 年 6 月 20 日,提交第二阶段的最终结果

2019 年 6 月 21 日,第三阶段正式启动

2019 年 7 月 5 日,提交第三阶段的最终结果

2019 年 7 月 15 日,公布获奖名单

2019 年 8 月 4 日,KDD 大会

任务 2(开放应用挑战赛)

2019 年 4 月 10 日,发布数据集 & 提交通道正式启用

2019 年 7 月 15 日,公布获奖名单

2019 年 8 月 4 日,KDD 大会

所有截止日期均对应当日的 UTC 时间晚上 11:59。

奖金池方面,「场景感知的多模态出行推荐」冠军将获得 1 万美金的奖励,而「开放应用挑战赛」优胜者则有 5000 美金奖励。

TB1o5FYQ4TpK1RjSZR0XXbEwXXa.jpg

今年,中国参赛队伍是否会在  KDD Cup 上取得优异成绩呢?让我们一起拭目以待。

大赛官网:https://dianshi.baidu.com/competition/29/rule

雷锋网(公众号:雷锋网) AI 科技评论雷锋网

TF.KDD Cup 99数据集是一个经典的网络入侵检测数据集,用于评估和比较不同入侵检测系统的性能。该数据集由MIT林肯实验室的Research Laboratory of Electronics(RLE)在1999年的KDD Cup竞赛中提供。 该数据集包含了来自真实网络环境中的网络流量数据,包括正常流量和多种类型的入侵行为。这些入侵行为可以分为4个主要类别:拒绝服务(DoS)、用户特权提升(U2R)、远程到本地(R2L)和普通的网络探测。每个类别又包含了不同的具体攻击类型,总计有23种不同的攻击。 数据集中的每个样本都包含了41个特征,包括网络连接的源地址、目的地址、不同的网络协议、连接持续时间等。这些特征用于描述和区分不同的网络连接。 由于该数据集的规模较大,样本数量超过400万,因此它被广泛用于网络入侵检测领域的研究和开发。研究人员可以利用这个数据集来训练和测试入侵检测系统,并评估其对不同类型攻击的识别能力。 然而,由于该数据集过于庞大和复杂,同时存在一些缺陷和不足,如数据不平衡、特征选择不够准确等,所以使用该数据集进行研究的时候需要谨慎。同时,还需要结合其他的辅助数据和技术手段,以提高入侵检测系统的准确性和鲁棒性。 总的来说,TF.KDD Cup 99数据集是一个重要的网络入侵检测数据集,对于研究和开发入侵检测系统具有一定的参考价值,但在使用时需要注意其局限性和缺陷,结合其他资源进行综合分析和评估。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值