术语:
示例,样本:所有描述obj的特征的集合,例如人(姓名,年龄,性别)
属性,特征:实例中的元素均为属性
维度:将示例以坐标轴的形式展示,每一个属性占一个维度,即属性个数是维度数
属性空间,样本空间,输入空间:属性的抽象的存在位置
---------------------------------------------------------------------------------------------------------------------------------
数据集:示例的集合
训练集:数据集的一种,用来建立模型的初始数据
验证集:用于调整模型的参数
测试集:用于测试和评估模型
验证集和测试集的区别:
机器学习的步骤为:训练集 --> 验证集 --> 测试集
先训练模型,每次训练完后都用验证集来评判模型参数,从而选择合适的参数
而在训练验证结束后通过测试集来判断模型的准确率
---------------------------------------------------------------------------------------------------------------------------------
离散:例如(猫,狗,猪)的分类
线性:例如 (1 - 10)的一系列数值
聚类:obj离散的分类
簇:obj聚类的数量
---------------------------------------------------------------------------------------------------------------------------------
监督学习:带标签的学习,训练集标记了所有可能的结果,模型只能预测训练集标记的结果
无监督学习:不带标签,训练集无标记,模型自动根据一定规则进行分类
半监督学习:介于两者之间,训练集一部分由标记,一部分无标记
---------------------------------------------------------------------------------------------------------------------------------
不同算法的模型期望相同,推导公式: