评估指标有 : score , oob_score
当模型在未知数据(测试集或者袋外数据)上表现糟糕时,模型的泛化程度不够
模型复杂度受到参数影响
-
通过学习曲线(在上一篇的随机森林学习中有体现)
-
通过网格搜索(其他博主博客)
-
方差与偏差
- 一个集成模型(f)在未知数据集(D)上的泛化误差E(f;D),由方差(var),偏差(bais)和噪声(ε)共同决定。
E ( f ; D ) = b i a s 2 ( x ) + v a r ( x ) + ε 2 E(f;D)=bias^2(x)+var(x)+ε^2 E(f;D)=bias2(x)+var(x)+ε2
图像中,每个点就是集成算法中的一个基评估器产生的预测值。红色虚线代表着这些预测值的均值,蓝色的线代表着数据本来的面貌。
- 偏差(反应模型的准确):模型预测与真实值间的差距
- 方差(反应模型的稳定):模型预测值与预测平均水平间的差距
模型与两者的关系
四者间关系
本内容属于个人学习记录,如有侵权请联系删除。
This content is a personal learning record;If there is any infringement, please contact to remove.