【深度学习】初探神经网络

intm_

已于 2023-03-12 09:45:31 修改

阅读量111

点赞数

分类专栏：深度学习文章标签：深度学习神经网络机器学习

于 2023-03-11 19:28:28 首次发布

本文链接：https://blog.csdn.net/print_gqh/article/details/129467441

版权

深度学习专栏收录该内容

4 篇文章 0 订阅

订阅专栏

文章目录

写在前面

笔者Blog里【深度学习】系列是为了记录自己在深度学习领域的学习历程，多为简略的笔记和个人的通俗易懂的总结，不是正经科普，不保证描述的准确性，没有详细的讲解过程。可能有的地方会给出出处文章。

梯度下降

梯度下降是最优化的一种方法，梯度其实就是导数，二次函数用导数求最大小值做过吧，导数等于0然后就求出极值。只不过现实生活中情况比较复杂，往往是高次等式没有通用解法，于是就采用梯度下降法。因为梯度就是函数的变化趋势，比如说2元2次函数中，若你在最小值左边，你的梯度应该是负的，越往左梯度绝对值越大，这时如果你x减去一定比例的梯度值，其实就是再往中间最小值靠拢，等到靠近最小值时，梯度值越来越小，x增加越来越少，但是当你持续无限步最终也就达到了最小值。这就是梯度下降简单版例子，现实生活中当然不止这么简单，通常是高次高纬度的，但是原理其实就是一样的。

神经网络简述

神经网络的本质是用线性函数和非线性函数的组合去模拟一个复杂函数来达到想要的效果：例如手写体数字识别，你输入8的数字特征，函数输出数字8。

反向传播

现在问题是你不知道如何设定你的线性函数的参数，于是你需要一个训练集，首先随便设一组参数，结果肯定是惨不忍睹的，为了缩小误差，也就是接近真正的参数组合，我们采用了梯度下降法。这里我们可以一步一步差分整个网络模型，首先是最末端的误差函数，我们就是在求误差函数的最小值，所以误差函数的输入值x(参考梯度例子中的x)就得往梯度方向反向走一步(因为是求最小值所以梯度下降)，这时我们得到了新的使误差更小的输入值，令他为x1。同时误差函数的输入也是我们网络预测值，以前预测x，现在我们希望他预测x1。现在我们知道x并不是自变量，因为他其实是网络最后一层的输出，所以不能直接改变x的值，需要改变的是最后一层的参数，这时我们发现误差函数和最后一层其实就是函数嵌套的关系，因为最后一层的输出就是误差函数的输入。所以我们把他们写成一个函数，然后求对应参数的导(偏导)。然而因为一个复杂网络最后合并写成一整个函数会非常复杂，于是我们采用链式法则，一层一层求导数。这个过程可以一步一步推导到网络的第一层，更新每一个参数，这个过程于是叫反向传播