深度学习笔记：神经网络的学习（2）

Raine_Yang

于 2023-02-04 16:28:05 发布

阅读量477

点赞数

分类专栏：人工智能文章标签：深度学习神经网络学习 python

本文链接：https://blog.csdn.net/Raine_Yang/article/details/128773213

版权

本章上一篇可见链接

https://blog.csdn.net/Raine_Yang/article/details/128682091?spm=1001.2014.3001.5501

梯度下降法（gradient descend）

神经网络学习的目标是找到使损失函数最小的参数（权重和偏置）。通过求得损失函数（总损失关于权重和偏置的函数）梯度，寻找梯度下降的发现，即可找到函数最小值。

注意利用梯度下降发得到的不一定是最小值，而仅仅为一个极小值，及梯度为0.另外，当函数呈扁平状，学习可能会进入一个平坦区域，难以进展，被称为学习高原

梯度法即为从当前函数取值沿梯度方向前进一定距离，然后重新求梯度，再继续迭代。其中每一步前进步幅被称为学习率（learning rate）

用公式表示如下：
在这里插入图片描述
梯度下降法程序实现：

import numpy as np

def gradient_descent(f, init_x, lr = 0.01, step_num = 100):
    x = init_x;
    
    for i in range(step_num):
        grad = numerical_gradient(f, x)
        x -= lr * grad
        
    return x

注：f 要优化的函数，init_x初始值&

最低0.47元/天解锁文章

Raine_Yang

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
深度学习笔记：神经网络的学习（2）

通过求得损失函数（总损失关于权重和偏置的函数）梯度，寻找梯度下降的发现，即可找到函数最小值。注意利用梯度下降发得到的不一定是最小值，而仅仅为一个极小值，及梯度为0.另外，当函数呈扁平状，学习可能会进入一个平坦区域，难以进展，被称为学习高原。学习率这样的参数被称为超参数。神经网络的梯度值损失函数关于权重参数的梯度，如对于一个2 * 3的神经网络权重W，损失函数为L，梯度即为∂L/∂W。注：神经网络损失函数是关于网络输出输出的函数，而网络输出又是关于W的函数，所有损失函数也为关于W的函数。
复制链接

扫一扫

专栏目录