提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档
引言
开始学习机器学习,参考的书是周志华著的一本书,对于每天的学习做一个小小的记录。
一、基本术语
1. 数据集
例如收集了一些西瓜的数据 (颜色=绿色;敲声=闷响)这组数据的集合叫做数据集
2.示例或样本
数据集中每条记录是关于一个事件或对象的描述
3.属性或特征
反映事件或对象在某些方面所表现出的性质 例如颜色敲声
属性上的取值 例如绿色闷响称为属性值
4.属性空间、样本空间或者输入空间
属性张成的空间就是属性空间,把颜色、敲声作为两个坐标轴,可以张成一个描述西瓜的空间,每个西瓜都能在这个空间找到自己的坐标位置
5.分类和回归
若预测连续值,此类学习任务叫做回归
若预测离散值,此类学习任务叫做分类
6.聚类和簇
聚类就是把训练集中的东西分成若干组,每个组成为一个簇
7.泛化能力
学得的模型适用于新样本的能力。
8.假设空间
例如 假设空间由 “色泽=?” ^ “根蒂=?” ^ “敲声=?”的可能取值所形成的假设组成。
9.奥卡姆剃刀原则
若有多个观察与假设一致,就选择最简单的那个。