Day 2
有事补过,今天二更
模型、策略,算法是统计学习三要素。
训练误差与测试误差。
训练误差的大小对判断给定的问题是不是一个容易学习的问题具有一定意义。
通常将学习方法对未知数据的预测能力成为泛化能力。
过拟合现象:过分追求其预测结果的准确性,而其复杂程度比真模型还高。此现象导致其对已知数据预测很好,但对未知数据预测很差的现象。
当模型的复杂度上升的时候,其训练误差逐渐下降至零,测量误差逐渐下降至最小之后再上升。复杂度足够大时,过拟合现象就会出现。
因此需要选择适当的模型,包括:正则化跟交叉验证的方法选择合适的模型。