机器学习分为有监督学习(分类和回归)和无监督学习(聚类和降维)
从数据中学习出模型的过程,成为训练或者学习
测试集:用来测试模型泛化能力
误差分析:误差指的是算法实际预测输出与样本真实输出之间的差异
模型在测试集上的误差为测试误差;训练集误差为训练误差,总体样本误差为泛化误差
过拟合 欠拟合
自己的理解是方差是评价样本离散程度,偏差是期望输出与真实样本之间差距,
距离靶心距离近偏差低,反之偏差较大,然后根据样本离散程度分析方差大小,
低偏差,高方差,模型为属于过拟合,过拟合应该减少模型复杂度
高偏差,低方差,模型属于欠拟合,适当增加网络复杂度
K折交叉验证:自己理解
就是说每次训练的训练集和测试都不允许重复,无重复抽样。根据平均值返回结果