[深度学习]深度学习学习笔记02

最新推荐文章于 2024-03-29 21:22:18 发布

不叫大仁不姓李

最新推荐文章于 2024-03-29 21:22:18 发布

阅读量165

点赞数 1

分类专栏：深度学习

本文链接：https://blog.csdn.net/sszzyzzy/article/details/91578191

版权

深度学习专栏收录该内容

2 篇文章 0 订阅

订阅专栏

损失函数

神经网络通过不断修改自身的参数来尽量达到每条训练数据都正确，都更加接近正确，所以要定义损失函数，用来量化当前成绩与满分之间的差距。

均方差

在这里插入图片描述

def mean_squared_error(y, t):
    return 0.5 * np.sum((y-t)**2) # 就是求每一项的方差，然后累加起来再除以二

交叉熵

在这里插入图片描述

def cross_entropy_error(y, t):
    delta = 1e-7 # 防止除零
    return -np.sum(t * np.log(y + delta))

上面都是针对单一数据的误差计算，对于批量数据，如整个训练集的所有数据计算时，在此基础上取均值。
计算得到误差之后，应该对参数进行修改来使误差降低。

梯度

1.通过用输出的结果对每个输入的参数求偏导，能得到该参数方向上的导数，然后可以在这个切线方向的向上或向下，进行些许的调整来取得更大或者更低的输出值，然后据此修改系数。当再一次使用同样的输入时，就会得到损失函数更小的值。
2.由于计算机无法直接求导，只能通过计算 lim(x->0){ (f(x0+x)-f(x0))/x } 来得到近似的结果
3.因此，通过反向传播来计算出误差
加法原值传递，乘法需要按照输入的比例倒数来分配结果