随机森林-当算法是回归算法，模型的泛化误差公式推导

最新推荐文章于 2023-11-18 19:25:37 发布

VIP文章 return bool(1)

最新推荐文章于 2023-11-18 19:25:37 发布

阅读量958

点赞数 1

分类专栏： return bool(1)的笔记（该系列文章不一定正确！）文章标签：算法随机森林回归

本文链接：https://blog.csdn.net/liu20020918zz/article/details/128879520

版权

符号	含义
$x$	测试样本
$D$	数据集
$y_D$	$x$ 在数据集中的标记
$y$	$x$ 的真实标记
$f$	训练集 $D$ 学到的模型
$f (x; D)$	由训练集 $D$ 学得的模型 $f$ 对 $x$ 的预测输出
$\bar{f}(x)$	模型 $f$ 对 $x$ 的期望预测输出

因此我们可以得到，学得的算法预测结果的期望为
$\bar{f}(x)=\mathbb{E}_{D}[f(x;D)]$

根据描述，我们来看一下偏差、方差、噪音的公式
偏差是预测值与真实值之间的差异，衡量模型的精度。
$bias^{2}(x)=(\bar{f}(x)-y)^{2}$
方差是模型在不同数据集上输出的结果的方差，衡量模型稳定性。
$var(x)=\mathbb{E}_{D}[(f(x;D)-\bar{f}(x))^{2}]$
噪音是数据收集过程当中不可避免的、与数据真实分布无关的信息
$^{2}=\mathbb{E}_{D}[(y_{D}-y)^{2}]$

现在证明
$\begin{aligned} 泛化误差 &= 偏差^2 + 方差 + 噪音^2 \\ &= bias^2 + variance + noise^2 \end{aligned}$
首先我们假定噪声的期望为 0，也就是
$\mathbb{E}_{D}[y_{D}-y]=0$
有

最低0.47元/天解锁文章

return bool(1)

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
随机森林-当算法是回归算法，模型的泛化误差公式推导

是模型在不同数据集上输出的结果的方差，衡量模型稳定性。是数据收集过程当中不可避免的、与数据真实分布无关的信息。因此我们可以得到，学得的算法预测结果的期望为。根据描述，我们来看一下偏差、方差、噪音的公式。是预测值与真实值之间的差异，衡量模型的精度。首先我们假定噪声的期望为 0，也就是。
复制链接

扫一扫