kaggle比赛_数据科学最重要的Kaggle比赛如何从入门到精(fang)通(qi)

e8b6973d2bbc997d14a6d8f64358aff3.png

你知道 Kaggle 么?不知道你就真的输了。几乎每个在数据领域有追求的人,都或多或少有和 Kaggle 打过交道或者有想要参加的 Kaggle 的想法。但是对于初入数据领域的小白来说,连搞清楚 Kaggle 的具体规则都不是一件非常容易的事情,这就让我们多了一份使命和责任。全网唯一一家真正指导学生参加 Kaggle 的数据科学训练营。我们希望的不仅仅是给学生最有用的知识,更是希望学生能够最高效地了解并参与到这个数据的大圈子里。

491e09a6aecbd79366f34397aa93d995.png 23842604b09940c0762e8f8204c63b13.png

Kaggle 竞赛是全球最大的数据建模和数据分析竞赛,也是全球范围内的数据科学家聚集与竞技的平台。数据科学家可以在该平台上参与由各大企业发布的竞赛项目,通过分析和建模来解决企业急需解决的问题。

我们的学员在完成基础知识的学习后,会在我们专业导师的带领下参加经由老师认真挑选的具有较大商业价值,且当期正在进行的 Kaggle 竞赛项目,真正通过实际的应用来巩固所学习到的知识。

今天就让我们看看我们以往的数据科学训练营的两个精选 Kaggle 比赛吧!

Avito

92867a22855442a80bf930410e79adbf.png

当在线销售二手商品时,产品描述中微小细致的细节组合可以在鼓励购买兴趣方面产生重大影响。比如:

84f5a738f47821b06faa4283535735a5.png

而且,即使有优化的产品列表,对产品的需求也可能根本不存在 - 令人沮丧的卖家可能已经过度投入营销。

俄罗斯最大的分类广告网站Avito对此问题非常熟悉。平台上的卖家有时会因为需求太少(表示产品或产品列表出现问题)或需求过多而感到沮丧(表明具有良好描述的热门产品价格过低)。

在这次的kaggle比赛中,老师带领我们的同学进行Avito的比赛,我们将根据其完整描述(标题,描述,图像等),其背景(地理位置,发布的类似广告)和历史需求来预测在线广告的需求。对于类似情况下的类似广告。有了这些信息,Avito可以告知卖家如何最好地优化他们的列表,并提供他们应该实际期望获得多少购买兴趣的一些指示。

47042f5965312dc6cb37d6ed228f9fe8.png

在具体竞赛过程中呢,我们从问题解读,目标确立,数据预处理,探索性数据分析,特征工程(feature engineering),集成学习算法(model ensemble)这里面包括kaggle当下比赛最火最快的模型,XGboost和LightGBM,来最终对Avito提出的问题进行预测。

在这次比赛中,数据量高达将近150G,所以在老师的带领下,对于怎么进行大型数据的处理已经分析,同学将会得到很好的学习经验。

此次比赛一共1917个团队参加,共计2427个竞赛者。此次比赛是奖金型比赛。

1st Place - $12,000

2nd Place - $8,000

3rd Place - $5,000

740a58c2a0f677e70ee83b7a14c86b97.png 45ddb1b69ffdcabf8dfd03d4bb878d1d.gif

TalkingData

ab258913d2f6c9163e10fd6ece16ab1a.png

欺诈风险无处不在,但对于在网上投放广告的公司而言,点击欺诈可能会以压倒性的数量发生,从而导致误导点击数据和浪费金钱。广告渠道只需点击广告即可提高成本。中国每月有超过10亿的智能移动设备正在使用,因此中国是世界上最大的移动市场,因此遭受大量的欺诈性流量。

TalkingData 是中国最大的独立大数据服务平台,覆盖全国 70% 以上的有源移动设备。他们每天处理30亿次点击,其中 90% 可能是欺诈性的。他们目前防止应用开发者点击欺诈的方法是衡量用户点击其产品组合的过程,并标记产生大量点击的IP地址,但永远不会最终安装应用。有了这些信息,他们就建立了一个IP黑名单和设备黑名单。

虽然成功,但他们希望始终比欺诈者领先一步,并向Kaggle 社区寻求帮助,以进一步开发他们的解决方案。在与 Kaggle 的第二场比赛中,您面临的挑战是构建一种算法,用于预测用户在点击移动应用广告后是否会下载应用。为了支持您的建模,他们提供了一个慷慨的数据集,涵盖了4天内大约2亿次点击!

这一次的 Kaggle 竞赛

1st Place - $12,500

2nd Place - $7,500

3rd Place - $5,000

时间线:

April 30, 2018 - 必须在这个时间之前加入比赛

April 30, 2018 - 这个时间之后参赛队伍不能再有变动

May 7, 2018 - 最终提交的截止日期

52e8be092f724068644003d5e50ffb7d.png 975f1319f4c3275452ab203d078031d6.gif

你是不是想问我们学员的比赛结果啦?

他们都超!级!优!秀!

截止到目前,我们辅导的学员在 Kaggle 竞赛中取得了很好的成绩,多次拿到单个项目的前3%的名次,并在2016年8月取得了一枚宝贵的竞赛金牌!优秀的 Kaggle 竞赛过程将会成为学员的应聘时的一段宝贵经历。据不完全统计,数据应用学院的莘莘学子们已经在 Kaggle 比赛中获得1枚金牌,4枚银牌及15枚铜牌!

是不是心动了!

快来报名我们的数据科学训练营

如果你不仅仅想要职业辅导,你想要从头开始扎实你的基础,或者从0开始学习数据科学,这一次机会你不能放弃了,数据科学家训练营动力起航,我们给你最完备的教学计划。

开课时间:扫码小姐姐微信问一问哦

4db2d41e92dff25b351f6ea3b2ff1692.png

课程周期:16周

课程形式:

Online Webinar 实时互动 + 视频回放

课程时间:

Saturday 13:00 – 15:00 PT

Saturday 17:00 – 19:00 PT

Sunday   17:00 – 19:00 PT

Tuesday  17:00 – 19:00 PT 

助教知识点答疑:

Wednesday

17:00 – 19:00 PT

Friday

15:00 – 17:00 PT

助教作业答疑:

Saturday 15:30 – 16:30 PT

100 节精选先修课打基础,8 周干货满满的数据科学课程带你变身数据达人,10 位 "FLAG" 名师为你授业解惑,3 个 industrial project 带你体验实战打码到天明的乐趣,什么?还不够刺激?我们带你冲顶 Kaggle 大赛,给你内推,帮你改简历,给你个性化职业辅导,最有经验的导师帮你 mock interview 给你建议,你想要的,我们都能给你。

部分知识点概览

5842e8b708bfb49cbc2f3a9f61e01c8c.png d274fbc0b201e0bb01cbd1485eef5670.png d94f95de7001cc531082ff4fb1330b7c.png 16b60f290a9a672f57e0f96384fbf651.png

<<  滑动查看其他知识点  >>

还等什么?快来咨询吧!

现在有1000美金Early Bird优惠哦!

报满即止

4db2d41e92dff25b351f6ea3b2ff1692.png

往期精彩回顾

不懂数据分析,如何当好HR?员工流失率每减少1%,可减少500万美元的商业成本

矮凳桥小区?曼哈屯?请拿好这份国外地名翻译规范指南

E-Commerce 数据岗位求职必知KPI清单

豆瓣8.7分的AI纪录片——“阿尔法围棋”

斯坦福用算法降低令欧洲头大的难民犯罪率,算法安置难民只需三步

84369b2f19120f05cc9170b0bcf6a2b5.png

28ec0ee23e80ff7c4fb571e4a4750f92.png

点「在看」的人都变好看了哦

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值