一. 绪论
1. 初识机器学习
1.1 基本术语
- 数据集,作为数据记录的集合;
- 示例(样本),关于一个事件或对象地描述;
- 属性(特征),反映事件或对象在某方面的表现或性质的事项;
- 属性值,属性上的取值;
- 属性空间(样本空间、输入空间,属性张成的空间;
- 特征向量,空间中的每一个实例。
训练集的介绍
从数据中学得模型的过程称为"学习"或"训练", 这个过程通过执行某个学习算法来完成.训练过程中使用的数据称为"训练数据",其中每个样本称为一个“训练样本", 训练样本组成的集合称为"训练集".
1.2 建立关于“预测”的模型任务
- 当预测对象为离散值,称为“分类”任务;当预测对象为连续值,称为“回归”任务;
- 当预测对象涉及两个,称为“二分类”任务,其中一个为“正类”,另一个为“反类”;当预测对象为多个时,称为“多分类”任务;
- 将数据集中的数据分成若干组,每组称为一个“簇”,即聚类任务。