nndl-复旦-神经网络与深度学习笔记第三章习题

最新推荐文章于 2022-10-28 22:48:33 发布

CHH3213

最新推荐文章于 2022-10-28 22:48:33 发布

阅读量449

点赞数 2

分类专栏： nndl-神经网络与深度学习随记文章标签：深度学习神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42301220/article/details/110495350

版权

nndl-神经网络与深度学习随记专栏收录该内容

5 篇文章 0 订阅

订阅专栏

第三章习题

参考资料：

https://blog.csdn.net/qq_38252142/article/details/109007372
https://github.com/nndl/solutions/issues

答：决策平面为 $w^Tx+b=0$ ，任意选择决策平面上两点： $x_1、x_2$ ，满足：
$w^Tx_1+b=0$
$w^Tx_2+b=0$
则两式相减得： $w^T(x_1-x_2)=0$ 其中， $x_1-x_2$ 即为决策平面上任意的向量，即权重向量 $w$ 与决策平面正交。

答：假设点x在平面 $f (x; w)$ 的投影点为 $x_1$ ，则点x到平面上的距离可以表示为：
$distance=||x-x_1||$
因为 $x_1$ 为平面上的点，所以满足平面方程，即： $w^Tx_1+b=0$ ，解得 $x_1$ 为：
$x_1=-w^{-T}b$ ，代入距离公式：
$distance=||x+w^{-T}b||=\frac{||w||*||x+w^{-T}b||}{||w||}=\frac{||wx+b||}{||w||}=\frac{|f(x;w)|}{||w||}$

答：由凸函数的性质： $f(\rho x_1+(1-\rho)x_2)\leq \rho x_1+(1-\rho)x_2$ 即得。
由题意可知， $w_c^Tx_1>w_{\bar{c}}^Tx_1$ ， $w_c^Tx_2>w_{\bar{c}}^Tx_2$ 。
则： $\rho(w_c^Tx_1-w_{\bar{c}}^Tx_1)>0$ ， $(1-\rho)(w_c^Tx_2-w_{\bar{c}}^Tx_2)>0$
两式相加： $\rho(w_c^Tx_1-w_{\bar{c}}^Tx_1)+(1-\rho)(w_c^Tx_2-w_{\bar{c}}^Tx_2)>0$
整理得：
$w_c^T(\rho x_1+(1-\rho)x_2)>w_{\bar{c}}^T(\rho x_1+(1-\rho)x_2)$
故得证。

答：不可以。 $\hat{y}=\sigma(w^Tx)=\frac{1}{1+exp(-w^TX)}$ 是连续函数，不适用分类问题。平方损失同样不适合用来优化参数 $w$ ，因为 $\hat{y}$ 到 $y$ 的距离并没有实际意义，无法表示预测的准确性。

在这里插入图片描述
答：正则化就是对最小化经验误差函数上加约束。加入正则化可以限制权重向量的大小，防止过拟合。

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
答：
$x^Tz=x_1z_1+x_2z_2$
$1+x^Tz)^2=1+2x^Tz+(x^Tz)^2$
$\phi(x)^T\phi(z)=1+2x_1z_1+2x_2z_2+2x_1x_2z_1z_2+x_1^2z_1^2+x_2^2z_2^2=1+2x^Tz+(x^Tz)^2$
得证。

关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

CHH3213 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。