如何入门机器学习

本篇文章,我将从过来的人角度介绍下机器学习如何从入门到精通,这里我们谈经验,谈工具,更谈方法论。

1.入门

作为初入机器学习的小白,你可能除了一颗好奇的心和一番热血外什么都不没有,当然最好还是希望你能有线性代数、微积分和概率论的基础。你可能会心存顾虑:学过但忘了。不用担心,这种东西不用就会忘,但只要用到,学一学便会;或者说你可能真的没学过,这个也不用担心,只要你真的想学现在也来得及。

好了废话不多说,我们进入入门阶段的正题。入门阶段主要有三个任务:

  1. 快速看完周志华的《西瓜书》

  2. 看吴恩达 Coursera 上的《机器学习》

  3. 调包跑算法

看完这个后可能大家会有很多不解或者很多疑惑。不着急,我们一个一个解答。

1.1 快速看完《西瓜书》

问题一:为什么要选《机器学习》?

因为这本书真的很不错,作为入门书籍非常合适。同样有名的《统计学习方法》虽然也很不错,但是其对小白来说相对较难。虽然《西瓜书》上面也有公式,但我们在初学的时候太复杂的完全可以先跳过去,并且书中还配有西瓜的例子,可以很好的帮助同学们理解算法的工作过程。

问题二:为什么要快速看完?

我这里强调快速,是因为快速真的很重要。因为如果战线拉得太长,如果一开始看的太细又读哪儿哪不懂,人是很容易有排斥心理的。最简单的一个例子,你想想你背英语单词的时候,多少次是从“abandon”开始背起的。每次快要期末考试了,或者四六级,又或者突然想学英语了,就拿起单词书来背,多少次是还没背到 “b” 就 abandon 了。出现这种情况的一大原因是成就感不足,由于在枯燥无味的知识海洋里没能得到及时的正反馈激励自己继续前行而出现了 abandon 的情况。特别是对于延迟满足感不强的同学来说,很容易在开始入门的时候就栽起了跟头。

问题三:怎么快速看完?要有多块?

我们这里强调的快速阅读并不是说随便翻一番,更不是说“量子波动速读”(手动狗头)。我们阅读前要带着问题去读,比如说算法能用来干什么,算法的输入输出是什么等等。比较好的一种方法是用思维导图来记录每一章的脉络或者主线。以决策树为例,看完《西瓜书》后,我们可能有以下笔记:

通过记录思维导图的方式除了可以帮我们记笔记、理清自己思路外,还有两个非常重要的好处。其中一个是:学完不至于感觉很虚。试想一下,如果你快速看完一本书而不记笔记的话,是不是会有一种猪八戒吃人参果的感觉?(内心OS:西瓜书讲的啥?)如果你有思维导图了,一看就知道决策树是基于多个if判断语句组成分类器(当然,也可能会知道决策树可以用于回归),有多种属性划分可以选择,在生成树的时候可以通过剪枝策略降低过拟合,处理连续值的时候有两种算法,处理缺失值的时候会遇到两个问题等等。

另一个好处是:帮助自己迭代知识。我们知道产品是需要迭代的,知识当然也是要迭代的。这也是为什么我们要分为入门、进阶和精通三步走的一大原因。罗马不是一日建成的,一口也吃不成胖子。

当然作为初学者,我们的思维导图可能没有那么详细,比如说看完《西瓜书》线性分类那一章,我们可能只有:

不多这样也没有关系,知识是不断迭代的,思维导图只是辅助我们学习的一个工具。

至于时间,大家可以自己把握,我是花了不到一个星期看完,每天 3~4 个小时的样子。

1.2 吴恩达Coursera上的《Machine Learning》

问题一:为什么是这门课?

这里要注意,是 Coursera 的《Machine Learning》,不是 CS229 的《Machine Learning》。推荐原因有以下几点:

  • 内容基础,虽然是英文,但是有中文字幕;

  • 15
    点赞
  • 90
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值