习题2-2（nndl）

Refrain*

已于 2022-03-19 19:35:17 修改

阅读量570

点赞数

分类专栏： nndl 课后作业文章标签：线性代数矩阵深度学习

于 2022-03-15 19:45:50 首次发布

本文链接：https://blog.csdn.net/weixin_42660711/article/details/123505910

版权

nndl 课后作业专栏收录该内容

7 篇文章 2 订阅

订阅专栏

2-2 问题

在线性回归中，如果我们给每个样本 $\left( \boldsymbol{x}^{\left( n \right)},y^{\left( n \right)} \right)$ 赋予一个权重 $r^{n}$ ,经验风险函数为 $\mathcal{R}\left( w \right) =\frac{1}{2}\sum_{n=1}^N{\boldsymbol{r}^{\left( n \right)}\left( \boldsymbol{y}^{\left( n \right)}-\boldsymbol{w}^T\boldsymbol{x}^{\left( n \right)} \right) ^2}$
计算其最优参数 $\boldsymbol{w^*}$ ,并分析权重 $r^{n}$ 的作用。

解：风险函数 $\mathcal{R}\left( \boldsymbol{w} \right)$ 是关于 $\boldsymbol{w}$ 的凸函数，将 $r^{n}$ 提到最前面进行叠加，其对 $\boldsymbol{w}$ 的偏导为 $\frac{\partial \mathcal{R}\left( \boldsymbol{w} \right)}{\partial \boldsymbol{w}}=-\frac{1}{2}\sum_{\boldsymbol{n}=1}^N{r^{\left( n \right)}\boldsymbol{X}\left( \boldsymbol{y}-X^T\boldsymbol{w} \right)}$
令上式为零得到 $w^*=\sum_{n=1}^N{r^{\left( n \right)}\left( XX^T \right) ^{-1}Xy}$

结论：我们给每一个样本赋予权重 $r^{n}$ ，这里我理解是在我们进行优化的时候，在局部数据进行优化的时候我们对感兴趣的局部设置权重往往会大一点以用来削弱距离较远的数据带来的影响。倘若在全局进行优化的时候我们往往会给予样本以相差不大的权重；这里权重是对数据处理进行的一次人为的标注，以达到我们所期望的最优参数解。

在邱老师的github课后解答中，我看到答案的解为：
令 $\boldsymbol{R}$ =diag( $r^{n}$ )(对角矩阵)此时 $\boldsymbol{R}$ $\boldsymbol{X}$ 就表示将 $x^{n}$ 赋予权重
$\frac{\partial \mathcal{R}\left( w \right)}{\partial w}=\frac{1}{2}\frac{\partial \mathcal{R}||\boldsymbol{y}-\boldsymbol{X}^T\boldsymbol{w||}^2}{\partial \boldsymbol{w}}=0$
$-\boldsymbol{XR}\left( \boldsymbol{y}-\boldsymbol{X}^{\boldsymbol{T}}\boldsymbol{w} \right) =0$
解得：
$\boldsymbol{w}^*=\left( \boldsymbol{XRX}^{\boldsymbol{T}} \right) ^{-1}\boldsymbol{XRy}$
此解更为简洁，我们注意的是构建矩阵 $\boldsymbol{R}$ 为对角矩阵

Refrain*

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
习题2-2（nndl）

2-2 问题在线性回归中，如果我们给每个样本(x(n),y(n))\left( \boldsymbol{x}^{\left( n \right)},y^{\left( n \right)} \right)(x(n),y(n)) 赋予一个权重rnr^{n}rn,经验风险函数为R(w)=12∑n=1Nr(n)(y(n)−wTx(n))2\mathcal{R}\left( w \right) =\frac{1}{2}\sum_{n=1}^N{\boldsymbol{r}^{\left( n \right)}\
复制链接

扫一扫