5 神经网络复杂度及学习率

最新推荐文章于 2024-04-16 13:23:39 发布

qq_44705097

最新推荐文章于 2024-04-16 13:23:39 发布

阅读量254

点赞数

分类专栏： tensorflow 文章标签：神经网络学习深度学习

本文链接：https://blog.csdn.net/qq_44705097/article/details/128821667

版权

tensorflow 专栏收录该内容

10 篇文章 1 订阅

订阅专栏

1.神经网络（NN）的复杂度：多用其层数和参数的个数表示。

空间复杂度=层数+总参数

层数=隐藏层数+1个输出层 2=1+1（下图）

总参数= 总的权重数+总的偏置个数 3x4+4(1层)+4x2+2（2层）=26 （下图）

时间复杂度：乘加运算的次数 3x4(1层)+4x2（2层）=20 （下图）

2.学习率（lr): 参数更新的幅度，可以先使用较大的学习率，快速得到较优解，然后逐步减小学习率，使模型在训练后期稳定。

$w_{t+1} = w_{t} -lr*\frac{\partial loss}{\partial w_{t}}$

指数衰减学习率=初始学习率*学习率衰减率的（当前轮数/多少轮衰减一次）次方

import tensorflow as tf

w = tf.Variable(tf.constant(5, dtype=tf.float32))

epoch = 40
LR_BASE = 0.2  # 最初学习率
LR_DECAY = 0.99  # 学习率衰减率
LR_STEP = 1  # 喂入多少轮BATCH_SIZE后，更新一次学习率

for epoch in range(epoch):  # for epoch 定义顶层循环，表示对数据集循环epoch次，此例数据集数据仅有1个w,初始化时候constant赋值为5，循环100次迭代。
    lr = LR_BASE * LR_DECAY ** (epoch / LR_STEP)
    with tf.GradientTape() as tape:  # with结构到grads框起了梯度的计算过程。
        loss = tf.square(w + 1)
    grads = tape.gradient(loss, w)  # .gradient函数告知谁对谁求导

    w.assign_sub(lr * grads)  # .assign_sub 对变量做自减 即：w -= lr*grads 即 w = w - lr*grads
    print("After %s epoch,w is %f,loss is %f,lr is %f" % (epoch, w.numpy(), loss, lr))

qq_44705097

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
5 神经网络复杂度及学习率

2.学习率（lr): 参数更新的幅度，可以先使用较大的学习率，快速得到较优解，然后逐步减小学习率，使模型在训练后期稳定。指数衰减学习率=初始学习率*学习率衰减率的（当前轮数/多少轮衰减一次）次方。1.神经网络（NN）的复杂度：多用其层数和参数的个数表示。总参数= 总的权重数+总的偏置个数 3x4+4。层数=隐藏层数+1个输出层 2=1+1（下图）时间复杂度：乘加运算的次数 3x4。空间复杂度=层数+总参数。
复制链接

扫一扫

专栏目录