深度学习相关知识学习笔记

最新推荐文章于 2022-07-24 22:21:55 发布

larry_do

最新推荐文章于 2022-07-24 22:21:55 发布

阅读量256

点赞数 1

分类专栏：初学者进阶文章标签：深度学习卷积神经网络

本文链接：https://blog.csdn.net/qq_31648921/article/details/85676101

版权

初学者同时被 2 个专栏收录

25 篇文章 1 订阅

订阅专栏

进阶

4 篇文章 0 订阅

订阅专栏

1基本概念

（1）机器学习

(2)用于神经网络的监督学习过程的三种典型算法

随机梯度下降算法（SGD）： $\Delta \omega _{ij}= \alpha \delta _{i}x_{j}$
训练完一个数据就更新一次权值
批量算法(batch)：
每次用到所有的训练数据，最后取更新权值的平均值，最后只更新一次权值。
$\Delta \omega_{ij}= \frac{1}{N}\sum_{k=1}^{N}\Delta \omega_{ij}(k)$
$\Delta \omega_{ij}(k)$ 是第k个训练数据的权值更新值
N为训练数据的总数
批量算法所需要的训练时间较长。
小批量算法(minibatch)
是批量算法与SGD的结合

小结：轮数（epoch）:全部数据都参与训练的循环次数。即全部数据都参与了训练，称为一轮。而改变一次权值，被称为网络被训练了1次。在有N个训练数据的前提下，对于批量算法而言，每一轮训练的次数为1，因为其只在所有权值误差计算完以后才更新一次权值。而对于SGD而言，每一轮的训练次数为N，因为其每一组数据计算完都要更新一次权值。而对于小批量法，需要具体考虑其每次从中选择多少数据进行小批量处理。SGD的学习速度更快。

（3）单层神经网络仅能解决线性可分割问题，多层神经网络可以克服单层神经网络的局限性。另外，隐含层激活函数，不能采用线性函数，这样化简后，隐含层将失效。

（4）神经网络的分类

单层神经网络	多层神经网络
	浅层神经网络 /深度神经网络
输入—输出	输入-单隐层-输出/输入-多隐层-输出

（5）代价函数，也称损失函数或目标函数。
代价函数与神经网络的监督学习有关，神经网络的误差越大，代价函数的值越大。

误差的平方和
$J=\sum_{i=1}^{M}\frac{1}{2}(d_{i}-y_{i})^{2}$
交叉熵函数
交叉熵驱动的训练降低误差的速度更快。
其随误差的增大而呈几何上升趋势，即交叉熵函数对误差更敏感。在回归中，可不使用交叉熵函数驱动的学习规则，其他情况下，推荐使用。
$J=\sum_{i=1}^{M}[-d_{i}ln(y_{i})-(1-d_{i})ln(1-y_{i})]$

（6）克服过拟合的重要方法：采用正则化将模型变得尽可能简单。
正则化的精华在于将权重之和引入到代价函数中。
$J=\sum_{i=1}^{M}\frac{1}{2}(d_{i}-y_{i})^{2}+\lambda \frac{1}{2}||\omega ||^{2}$
$J=\sum_{i=1}^{M}[-d_{i}ln(y_{i})-(1-d_{i})ln(1-y_{i})]+\lambda \frac{1}{2}||\omega ||^{2}$