在机器学习中,我们接触到的第一样事物,就是机器学习所需的前提:
所需数据:训练集、测试集、特征值。
训练集:用来进行训练,也就是产生模型或者算法的数据集
训练集-->也就是训练数据,当我们选定一些学习模型给予机器时,我们会给予机器一定的训练数据,进行参数估计,然后比对测试集的数据,根据每个模型的误差值来选择一个具体的模型,做为机器学习的首选模型。
测试集:用来专门进行测试已经学习好的模型或者算法的数据集
测试集-->测试数据,一般用来比对经过训练集训练后模型输出的数据,用来检验误差模型的误差值。
特征值:属性的集合,通常用一个向量来表示,附属于一个实例
实例集合:假设集合为X;(X包含了训练集的所有的属性);
假设目标函数为y,那么我们最终想要得到的结果就全部放在y集合中。
x: 每一个实例
X: 样例, 所有实例的集合
学习目标:f: X -> Y
**eg:假设有一个训练集:**
身高 | 体重 | 发长 | 年龄 | 性别 | 所属实例 |
---|---|---|---|---|---|
178cm< |