机器学习公式推导【Day5】算法期望泛化误差

最新推荐文章于 2023-02-04 10:41:32 发布

conquer997

最新推荐文章于 2023-02-04 10:41:32 发布

阅读量1.5k

点赞数 3

分类专栏：机器学习文章标签：人工智能机器学习

本文链接：https://blog.csdn.net/qq_43246110/article/details/105318825

版权

机器学习专栏收录该内容

25 篇文章 12 订阅

订阅专栏

算法期望泛化误差

算法期望泛化误差

（本文为个人学习总结笔记）

算法期望泛化误差

原公式：

$\begin{aligned} E(f ; D)=& \mathbb{E}_{D}\left[\left(f(\boldsymbol{x} ; D)-y_{D}\right)^{2}\right] \\ =& \mathbb{E}_{D}\left[\left(f(\boldsymbol{x} ; D)-\bar{f}(\boldsymbol{x})+\bar{f}(\boldsymbol{x})-y_{D}\right)^{2}\right] \\ =& \mathbb{E}_{D}\left[(f(\boldsymbol{x} ; D)-\bar{f}(\boldsymbol{x}))^{2}\right]+\mathbb{E}_{D}\left[\left(\bar{f}(\boldsymbol{x})-y_{D}\right)^{2}\right] \\ &+\mathbb{E}_{D}\left[+2(f(\boldsymbol{x} ; D)-\bar{f}(\boldsymbol{x}))\left(\bar{f}(\boldsymbol{x})-y_{D}\right)\right] \\ =& \mathbb{E}_{D}\left[(f(\boldsymbol{x} ; D)-\bar{f}(\boldsymbol{x}))^{2}\right]+\mathbb{E}_{D}\left[\left(\bar{f}(\boldsymbol{x})-y_{D}\right)^{2}\right] \\ =& \mathbb{E}_{D}\left[(f(\boldsymbol{x} ; D)-\bar{f}(\boldsymbol{x}))^{2}\right]+\mathbb{E}_{D}\left[\left(\bar{f}(\boldsymbol{x})-y+y-y_{D}\right)^{2}\right] \\ =& \mathbb{E}_{D}\left[(f(\boldsymbol{x} ; D)-\bar{f}(\boldsymbol{x}))^{2}\right]+\mathbb{E}_{D}\left[\left(\bar{f}(\boldsymbol{x})-y+\mathbb{E}_{D}\left[\left(y-y_{D}\right)^{2}\right]\right.\right.\\ &+2 \mathbb{E}_{D}\left[(\bar{f}(\boldsymbol{x})-y)\left(y-y_{D}\right)\right] \\ =& \mathbb{E}_{D}\left[(f(\boldsymbol{x} ; D)-\bar{f}(\boldsymbol{x}))^{2}\right]+(\bar{f}(\boldsymbol{x})-y)^{2}+\mathbb{E}_{D}\left[\left(y_{D}-y\right)^{2}\right] \end{aligned}$

1、第一步：减一个 $\bar{f}(\boldsymbol{x})$ 再加一个 $\bar{f}(\boldsymbol{x})$ ，属于简单的恒等变形。
2、第二步：首先将中括号中的式子展开
$\mathbb{E}_{D}\left[(f(\boldsymbol{x} ; D)-\bar{f}(\boldsymbol{x}))^{2}+\left(\bar{f}(\boldsymbol{x})-y_{D}\right)^{2}+2(f(\boldsymbol{x} ; D)-\bar{f}(\boldsymbol{x}))\left(\bar{f}(\boldsymbol{x})-y_{D}\right)\right]$
然后根据期望的运算性质，得：
$\mathbb{E}_{D}\left[(f(\boldsymbol{x} ; D)-\bar{f}(\boldsymbol{x}))^{2}\right]+\mathbb{E}_{D}\left[\left(\bar{f}(\boldsymbol{x})-y_{D}\right)^{2}\right]+\mathbb{E}_{D}\left[2(f(\boldsymbol{x} ; D)-\bar{f}(\boldsymbol{x}))\left(\bar{f}(\boldsymbol{x})-y_{D}\right)\right]$
3、第三步：再次利用期望的运算性质将第3步得到的式子的最后一项展开
$\begin{aligned} &\mathbb{E}_{D}\left[2(f(\boldsymbol{x} ; D)-\bar{f}(\boldsymbol{x}))\left(\bar{f}(\boldsymbol{x})-y_{D}\right)\right]=\mathbb{E}_{D}[2(f(\boldsymbol{x} ; D)-\bar{f}(\boldsymbol{x})) \cdot \bar{f}(\boldsymbol{x})]-\mathbb{E}_{D}\left[2(f(\boldsymbol{x} ; D)-\bar{f}(\boldsymbol{x})) \cdot y_{D}\right]\\ &=0+0 \end{aligned}$

4、第四步：同第1步一样，减一个y再加一个y，属于简单的恒等变形；
5、第五步：同第2步一样，将最后一项利用期望的运算性质进行展开；
6、第六步：因为 $\bar{f}(\boldsymbol{x})$ 和y均为常量，所以根据期望的运算性质可知，第6步中的第2项可化为
$\mathbb{E}_{D}\left[(\bar{f}(\boldsymbol{x})-y)^{2}\right]=(\bar{f}(\boldsymbol{x})-y)^{2}$
同理，第6步中的最后一项可化为：
$\mathbb{E}_{D}\left[(\bar{f}(\boldsymbol{x})-y)\left(y-y_{D}\right)\right]=2(\bar{f}(\boldsymbol{x})-y) \mathbb{E}_{D}\left[\left(y-y_{D}\right)\right]$
由于此时假设噪声的期望为零，故：
$\mathbb{E}_{D}\left[(\bar{f}(\boldsymbol{x})-y)\left(y-y_{D}\right)\right]=2(\bar{f}(\boldsymbol{x})-y) \cdot 0=0$

conquer997

关注

3
点赞
踩
15

收藏

觉得还不错? 一键收藏
3
评论
机器学习公式推导【Day5】算法期望泛化误差

算法期望泛化误差算法期望泛化误差（本文为个人学习总结笔记）算法期望泛化误差原公式：E(f;D)=ED[(f(x;D)−yD)2]=ED[(f(x;D)−fˉ(x)+fˉ(x)−yD)2]=ED[(f(x;D)−fˉ(x))2]+ED[(fˉ(x)−yD)2]+ED[+2(f(x;D)−fˉ(x))(fˉ(x)−yD)]=ED[(f(x;D)−fˉ(x))2]+ED[(fˉ(x)−yD)2]...
复制链接

扫一扫