关键术语
1. 特征:一些属性值,例如 体重,羽翼... 我们统称为特征,也称作属性。
2.目标变量:目标变量是机器学习算法的预测结果。我们通常将目标变量成为类别,
并假定分类问题只存在有限个数的类别。
3.数据集:通常使用两套独立的样本集:训练数据和测试数据。使用训练样本集作为算法的输入,
训练完成之后输入测试样本。输入测试样本时,并不提供测试样本的目标变量,由程序员决定样本属于哪个类别。
4.分类:机器学习的分类算法,主要任务是将实例数据划分到合适的分类中。
5.回归:机器学习的另一个任务是回归,它主要是用于预测数值型数据。(例如:数据拟合曲线:通过给定数据点的最有拟合曲 线)。
6.监督学习:分类和回归属于监督学习,之所以称为监督学习,是因为这类算法必须知道预测什么,即目标变量的分类信息。
7.无监督学习:与监督学习对应的是无监督学习,此时数据没有类别信息,也不会给定目标值。
8.聚类:无监督学习中,将数据