1.监督学习、 无监督学习
监督学习:利用一组已知类别的样本调整分类器的参数,使其达到所要求性能的过程,也称为监督训练或有教师学习
无监督学习 :根据类别未知(没有被标记)的训练样本解决模式识别中的各种问题,称之为无监督学习
2. 分类、 回归
分类:通过比较事物之间的相似性,把具有某些共同点或相似特征的事物归属于一个不确定集合的逻辑方法
回归:当因变量和自变量为线性关系时,它是一种特殊的线性模型
3. 聚类、 降维
聚类:将物理或抽象对象的集合分成由类似的对象组成的多个类的过程被称为聚类
降维:降维是通过单幅图像数据的高维化,对单幅图像转化为高维空间中的数据集合进行的一种操作
4. 损失函数
损失函数:将随机事件或其有关随机变量的取值映射为非负实数以表示该随机事件的“风险”或“损失”的函数
5.训练集、测试集、验证集
训练集:用于训练模型以及确定参数。相当于老师教学生知识的过程
验证集:用于确定网络结构以及调整模型的超参数,来确定是否需要继续训练
测试集:用于检验模型的泛化能力,测试集用来形容模型能力的好坏
6. 过拟合、欠拟合
过拟合:训练过度,只对训练集的效果好,对测试集的效果差
欠拟合:训练的不够,对训练集和测试集的效果都差
7.经验风险、期望风险
经验风险:经验风险来源于训练数据集,训练数据集的平均损失也称为经验风险。
期望风险:期望风险针对的是全体数据。也就是已有的数据,未有的数据都包括在内。