手把手教你用Kaggle开启机器学习之旅(附资源链接)

640?wx_fmt=png

作者:NITYTESH AGARWAL 

翻译:闫晓雨

校对:白静

本文约3200字,建议阅读10分钟。

本文分析了Kaggle利于数据科学领域新手学习的几点特征,并带你学习ML相关知识。


640?wx_fmt=png


我经常被朋友和大学生问到“如何入门机器学习或数据科学”。


640?wx_fmt=png


所以,这是我的答案……


前言


早些时候,我不太确定。我会说类似“学这门课”或“读这本教程”或“先学Python(这是我做过的事情)”。但是现在,随着我越来越深入这个领域,我开始意识到我采取的措施的缺点。


所以,事后看来,我认为“入门” 机器学习或数据科学的最佳途径可能是通过Kaggle。


在这篇文章中,我将告诉您为什么我这么认为,以及 如果我的推理令您信服,您将如何做到这一点。


注意:我是一名学生。我不是专业的数据科学家或机器学习工程师。我绝对不是Kaggle的专家。所以,请有保留地采纳我的意见和观点。  :-)

 

但首先,请允许我介绍一下Kaggle并澄清一些关于它的误解。


你可能听说过Kaggle作为一个网站,为机器学习比赛颁发令人难以置信的现金奖励。


640?wx_fmt=png

Kaggle举办的比赛获得最高奖金

(是的,这些是百万美元以上的奖金!)


正是这种名气也引起了很多关于平台的误解,让新手们入门比原来更加犹豫不决。


如果你之前从未听说过Kaggle,也不要担心,因此,不要在意下面提到的任何误解。这篇文章仍然完全有道理。对待下一部分就当我向你介绍Kaggle一样。

 

误解


1. “Kaggle是一个举办机器学习竞赛的网站”


这是对“Kaggle是什么”的不完整描述!我认为竞赛(以及它们丰厚的现金奖励)并不是Kaggle的真谛。看看他们网站的标题——


640?wx_fmt=png

竞赛仅仅是Kaggle的一部分


除了举办竞赛,(它目前已经举办过大概300场比赛),Kaggle还主持了3项非常重要的内容:


  • Datasets

    https://www.kaggle.com/datasets


即使是与任何竞赛都无关的那些:与仅仅300个竞赛(在撰写本文时)相比,它包含9500多个数据集。因此,您可以通过选择任何您感兴趣的数据集来提高您的技能。


640?wx_fmt=png

我觉得最有趣的一些数据集


  • Kernels:

    https://www.kaggle.com/kernels


它们只是Kaggle的Jupyter笔记本版本,反过来,它只是一种非常有效和酷炫的共享代码方式,以及大量的可视化,输出和解释。“内核”选项卡将您带到一个公共内核列表,人们用它来展示一些新工具或分享他们对某些特定数据集的专业知识或见解。


  • Learn:

    https://www.kaggle.com/learn/overview


此选项卡包含免费且实用的实践课程, 这些课程涵盖了快速入门所需的最低前置课程。他们最好的地方是什么?——一切都是使用Kaggle的内核完成的(如上所述)。这意味着您可以互动和学习……通过数小时的学习材料不再被动阅读!


640?wx_fmt=png

  • 5
    点赞
  • 39
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值