启言:
机器学习通过使用过去的经验去指导未来的决策,它的基础目标是归纳,或者从一种未知规则的应用例子中归纳出未知规则。
一、机器学习的定义
一个程序:性能体现在“T”,衡量性能用“P”,提升性能通过经验“E”
可视为:针对一些“T”类型,通过“P”来衡量性能的的任务,从经验“E”中进行学习
二、从经验“E”中学习(监督下和无监督下)
(1)监督学习:“对于输入数据X能预测变量Y”通过标记的输入和输出进行学习,并预测一个输入或输出,也就是:从“正确答案”的例子中进行学习。它在训练集中找规律,然后对测试数据运用这种规律。
常见的监督学习任务:分类和回归
1)分类:分类的目标变量是标称型的,以电影分类为例,一部电影无非是动作片、爱情片、喜剧片等类别。
常见的分类算法:
a.KNN:k-近邻算法,使用距离测量的方法进行分类
b.NaiveBayes:朴素贝叶斯,基于概率论的分类方法,贝叶斯公式。