1.什么是Kaggle?
Kaggle成立于2010年,是一个进行数据发掘和预测竞赛的在线平台。
从公司的角度来讲,可以提供一些数据,进而提出一个实际需要解决的问题;
从参赛者的角度来讲,他们将组队参与项目,针对其中一个问题提出解决方案,最终由公司选出的最佳方案可以获得5K-10K美金的奖金。
kaggle官方网站 : https://www.kaggle.com/
Kaggle的创建初衷及运营模式,即任用最聪明的人解决世界上最棘手的问题
除此之外,Kaggle官方每年还会举办一次大规模的竞赛,奖金高达一百万美金,吸引了广大的数据科学爱好者参与其中。
2.竞赛模式
Kaggle上的竞赛有各种分类,例如奖金极高竞争激烈的的 “Featured”,相对平民化的 “Research” 以及对于初学者的 “getting Started” 等,但他们整体的项目模式是一样的,就是通过出题方给予的训练集建立模型,再利用测试集算出结果用来评比。
在截止日期之前,所有队伍都可以自由加入竞赛,或者对已经提交的方案进行完善,因此排名也会不断变动,不到最后一刻谁都不知道花落谁家。
Kaggle竞赛另一个有趣的地方在于每个人都有自己的Profile,上面会显示所有自己参与过的项目、活跃度、实时排位、历史最佳排位等。
3.快速上手
刚开始的时候推荐大家从练习赛开始熟悉,练习赛不仅项目难度低,而且是有官方给出的参考方案的,大家可以用来对比改善自己的测试结果,从中进行学习如何在Kaggle上进行机器学习实战练习。
这里推荐一篇入门级的经典练习项目供大家进行学习:
逻辑回归应用之Kaggle泰坦尼克之灾
https://blog.csdn.net/han_xiaoyang/article/details/49797143