此篇是概括总结,之后会更新每个模型的笔记。梳理一下这段时间学习的内容。
1 定义 What is Machine Learning
- Arthur Samuel(亚瑟塞缪尔):
the field of study that gives computers the ability to learn without being explicitly programmed.
当计算机在不被明确地编程情况下,赋予它学习能力的研究领域。 - Tom Mitchell (汤姆米切尔):
A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E.
一个程序,用于通过经验E去学习完成任务T,且有评价该任务的度量标准P 。如果它完成任务T的表现P随着经验E而提高,则这个程序就是一种机器学习方法。
2 监督学习与非监督学习
常见的机器学习问题有监督学习(Supervised Learning)和非监督学习(Unsupervised Learning)。
(1)监督学习(supervised learning)
给定的样本集包含数据的标签,即已知需要预测的正确结果,训练时利用正确的标签去”监督“预测出的标签。
- 分类(classification):预测的输出为离散型。
- 回归(regression):预测的输出为连续型。
(2)非监督学习(unsupervised learning)
不用样本集数据的标签,通过数据的内在特征完成任务。
- 聚类(clustering):根据样本的特征,把样本集中的样本汇聚成n个簇,同一个簇内的样本相似,不同簇内的样本不相似。
- 降维(demension reduction):将高维数据降低维度。