【机器学习笔记】训练并优化神经网络的步骤

最新推荐文章于 2024-04-20 16:19:16 发布

Liaojiajia-2020

最新推荐文章于 2024-04-20 16:19:16 发布

阅读量522

点赞数

分类专栏： # 机器学习笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/mary_0830/article/details/98354651

版权

机器学习笔记专栏收录该内容

6 篇文章 28 订阅

订阅专栏

训练并优化神经网络的步骤

选择网络结构，即决定选择多少层以及决定每层分别有多少个单元。
第一层的单元数即训练集的特征数量。最后一层的单元数是训练集的结果的类的数量。
如果隐藏层数大于1，确保每个隐藏层的单元个数相同，通常情况下隐藏层单元的个数越多越好。

真正要决定的是隐藏层的层数和每个中间层的单元数。

训练神经网络：

参数的随机初始化

通常需要把参数初始化为趋近于0的极小的值。当使用逻辑回归时，通常将参数初始化为0，但对于神经网络这个方法是不行的，若都初始化为0，那么第二层每个单元节点的值都会是相同的，若都初始化为同一个非零的数，结果也是一样的。所以每个参数要在0附近的正负值范围内随机选取。

利用正向传播方法计算所有的 $h_{\Theta}(x)$

从左向右进行计算，对于输入的任意 $x^{(i)}$ ，计算出 $h_{\Theta}(x^{(i)})$ ，结果的形式是向量。

编写计算代价函数 $J(\theta)$ 的代码
利用反向传播方法计算所有偏导数 $\frac{\partial }{\partial \theta _{jk}^{(l)}}J(\theta )$
使用梯度检验来将反向传播算法得到的偏导数值 $\frac{\partial }{\partial \theta _{jk}^{(l)}}J(\theta )$ ，与数值方法得到的估计值进行比较，以确保两种方法得到的值是接近的

这样做的目的是，在实际运行过程中，代码可能存在很多 $b u g$ ， $J(\Theta)$ 的值虽然可能在减小，但最后得到的值可能存在极大的误差，采用梯度检测的方法可以减小这种错误的概率。需要注意，当检测完后，要把梯度检查的代码注释掉，这个检测操作是非常花费时间的。

使用优化算法（如梯度下降或者其他更加高级的优化算法）来最小化代价函数

需要注意的是，由于神经网络并不是一个线性的模型，其代价函数 $J(\Theta)$ 是个非凹函数，所以我们使用梯度下降等方法得到的结果只是一个局部最优解，并不保证就是全局最优解。

Liaojiajia-2020

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。