之前就对Machine Learning很感兴趣,假期得闲看了Coursera Machine Learning 的全部课程,整理了笔记以便反复体会。
I. Introduction (Week 1)
- What is machine learning
对于机器学习的定义,并没有一个被一致认同的答案。
Arthur Samuel (1959) 给出对机器学习的定义:
机器学习所研究的是赋予计算机在没有明确编程的情况下仍能学习的能力。
Samuel设计了一个西洋棋游戏,他让程序自己跟自己下棋,并记录下来棋盘上的位置可能所导致的结果。在下了将近几万盘之后,计算机学会了棋盘上的哪个位置可以胜利,并最终战胜了程序的设计者。
Tom Mitchell (1998) 给出了一个比较现代且形式化的定义:
对于某个任务T以及性能的衡量P,如果一个计算机程序在完成任务T时,用来衡量性能的P随着经验E而增长,我们就说计算机程序能够通过E来学习。
对于西洋棋游戏,玩西洋棋游戏是任务T,游戏输赢是性能P,一局又一局游戏的过程就是经验E。
对于邮件分类,将垃圾邮件及非垃圾邮件分类就是任务T,分类的正确率就是性能P,查看邮件标签是垃圾还是非垃圾是经验E。
对于机器学习算法可以分为:
- 监督学习
- 非监督学习
一些机器学习应用的例子:
- 数据挖掘
- 一些无法通过手动编程来实现的应用:如自然语言处理、计算机视觉
- 一些自助式程序:推荐系统
- 理解人类是如何学习的