神经网络小结：训练的全过程

最新推荐文章于 2024-09-22 22:57:37 发布

NormalConfidence_Man

最新推荐文章于 2024-09-22 22:57:37 发布

阅读量786

点赞数

分类专栏：机器学习文章标签：神经网络机器学习人工智能

本文链接：https://blog.csdn.net/weixin_45434953/article/details/131307582

版权

机器学习专栏收录该内容

17 篇文章 0 订阅

订阅专栏

这一节我们主要是将之前的知识穿起来，形成一个整体。如果之前的没看过可以回翻一下专栏。但是在整体回归之前，我们还需要学习一个小知识点——随机初始化

随机初始化

在神经网络中，我们大致的训练流程就是：通过前向传播得出当前 $\theta$ 下的假设结果，使用代价函数对比得到的假设结果和实际结果y，然后使用反向传播和梯度下降修正 $\theta$ ，使得 $J(\theta)$ 最小。但是在第一次进行前向传播的时候，就需要对 $\theta$ 赋予一定的初值，而简单地将所有的 $\theta$ 设置为0是不可行的。如果是这样的话，会导致所有的隐藏层都计算出同样的的结果，因此在开始之前，我们需要对一开始的 $\theta$ 进行随机初始化

很多编程语言都提供了取随机数的内置函数，我们可以规定 $\theta \in [-\epsilon ,\epsilon ]$ ，比如可以这样进行随机初始化： $\theta=rand(0,1)*(2*\epsilon)-\epsilon$ ，其中rand(0,1)表示在0到1中随机取一个实数

神经网络流程整合

神经网络的流程如下：

1.选择一种架构
首先我们呢根据需要选择一种模型，决定有多少个隐藏层，每个隐藏层有多少个单元。输入层单元和样例特征有关，而输出层则和你需要分类的类别数量有关。有关于如何选择隐藏层的数目后面会介绍

2.随机初始化网络的参数

3.执行前向传播算法
通过前向传播算法，对于任意一个实例 $x^{(i)}$ ，得出其假设函数 $h_\theta(x^{(i)})$ ，这部分在https://blog.csdn.net/weixin_45434953/article/details/131048661的2.2

3.使用计算出的结果计算代价函数
使用各个实例的y和计算出来的 $h_\theta(x^{(i)})$ 根据公式计算出代价函数 $J(\Theta)$ ，这部分和下面的4.都在https://blog.csdn.net/weixin_45434953/article/details/131210254