（LXTML笔记）Neural Network

最新推荐文章于 2023-07-12 10:57:38 发布

windede

最新推荐文章于 2023-07-12 10:57:38 发布

阅读量201

点赞数

分类专栏：算法学习 LXTML

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_23997101/article/details/79528348

版权

算法学习同时被 2 个专栏收录

29 篇文章 0 订阅

订阅专栏

13 篇文章 0 订阅

订阅专栏

神经网络的话，向前计算是容易地，基本上就是矩阵的乘法加上一点点激活函数的变换，所以这里不做笔记。

Backprop on NNet

下面对学习过程做一点笔记，backprop实际上就是偏导的链式法则
这里写图片描述

我们考虑的是平方误差，即
这里写图片描述

对于输出层，如下图绿框所示，我们对 $e_n$ 关于第 $L$ 层的权重做偏导
这里写图片描述

对于中间的隐含层，如红色框所示做偏导，有暂时不知道 $\frac{\partial e_n}{\partial s_j^{(l)}}$ 是什么，暂时设为 $\delta_j^{(l)}$ ，

下面再来处理 $\delta_j^{(l)}$ ，如下图所示
这里写图片描述

我们发现 $\delta_j^{(l)}$ 需要由所有的 $\delta_j^{(l+1)}$ 得到，这样的话，结合GD，我们可以给出NN的权重更新算法
这里写图片描述
更新公式即

w (l) i j = w (l) i j - η \partial e n \partial w ( l ) i j = w (l) i j - η x (l - 1) i δ (l) j,

$w_{ij}^{(l)}=w_{ij}^{(l)}-\eta \frac{\partial e_n}{\partial w_{ij}^{(l)}}=w_{ij}^{(l)}-\eta x_i^{(l-1)}\delta_j^{(l)},$

有时候不能让权重 $W_{ij}$ 过大，这是因为这会导致tanh函数的结果基本上集中在1附近，所以我们需要对 $E_{in}$
这里写图片描述

做点正则化，比如容易想到的是 $\sum (w_{ij}^{(l)})^2$ ，不过似乎不是太好效果，往往使用下面这个标准化后的正则化条件。
这里写图片描述

autoencoder预训练

与PLA一样，如果一开始给定了合适的初值的话，收敛也好性能也好时间也好都有可能有较好的提升，所以我们也可以对NN进行预训练
这里写图片描述
即，首先仅仅依赖相近的两层，先将其权重预处理好，而不是random几个参数，

基本思想是：

weight就代表了把上一层的输出的信息做一个转换，亦或者说做一个编码，然后传输给下一层。如果我们能够让下一层接收到编码之后的信息所代表的信息是和上一层是基本一样的话，我们认为这就是好的weight

即如下图所示，我们希望能训练处 $g(x)=x$ 一个不动点变换，这个思想还是蛮新颖的，隐含层保留了特征信息，那么由这些特征信息理论上也应该容易还原原来的信息。
这里写图片描述

可以采用平方误差，而输入则是 $\{(x_n,x_n)\}$ 这样的形式，有时候如果要求更强一些，可以要求 $W_{ij}^1=W_{ji}^2$ ，即解码器和编码器的权重是一样的，不过如何才能设置这个限制呢？还没做思考
这里写图片描述

有的时候为了让权重更加strong，我们可以对数据 $\{(x_n,x_n)\}$ 加入一些噪声，比如令 $(\hat{x_n}=x_n+noise)$ ，这样训练的话鲁棒性更好，这也属于一种regularization.
这里写图片描述

课程后面对将所有激活函数换成 $h(x)=x$ 之后的情况进行了分析，直接变成了一个数值分析或者高等代数的习题2333（由此可以导出类似PCA的结果），这里不做赘述。可以查看这里。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
（LXTML笔记）Neural Network

神经网络的话，向前计算是容易地，基本上就是矩阵的乘法加上一点点激活函数的变换，所以这里不做笔记。Backprop on NNet下面对学习过程做一点笔记，backprop实际上就是偏导的链式法则我们考虑的是平方误差，即对于输出层，如下图绿框所示，我们对enene_n关于第LLL层的权重做偏导对于中间的隐含层，如红色框所示做偏导，有暂时不知道∂en∂s(l)j∂e...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。