一.什么是机器学习
首先要明白机器学习是什么?实际上,即使是在机器学习的专业人士中,也不存在一个被广泛认可的定义来准确定义机器学习是什么或不是什么。来看一些大牛们尝试的定义:
Arthur Samuel:在进行特定编程的情况下,给予计算机学习能力的领域。
Tom Mitchell:一个好的学习问题定义如下,他说,一个程序被认为能从经验 E 中学习,解决任务 T,达到性能度量值
P,当且仅当,有了经验 E 后,经过 P 评判,程序在处理 T 时的性能有所提升。
我比较同意TOM的说法。这就好比有一个人在下棋,他在与他人下棋的过程中,学会了该怎么下,遇到这个格局要怎么下,下一步怎么走,从而提升自己了下棋的技术,然后打败其他人,成为很厉害的选手一样。其中E就是不断与他人下棋,然后学习,任务T就是去战胜别人,而P就是它在与其他人下棋的时候,战胜他人的概率。
二.机器学习的学习算法
机器学习发展到现在有很多种算法,大致可以分为以监督学习,无监督学习两大类,在之后还出现了在线学习,半监督学习等基于前面两种学习算法发展得来的算法。
1.监督学习
什么是监督学习?
监督式学习(英语:Supervised learning),是一个机器学习中的方法,可以由训练资料中学到或建立一个模式(函数 / learning model),并依此模式推测新的实例。训练资料是由输入物件(通常是向量)和预期输出所组成。函数的输出可以是一个连续的值(称为