tensorflow线性回归小例子(包含梯度裁剪和学习率衰减)

本文通过一个简单的线性回归模型,详细介绍了如何在TensorFlow中实现梯度裁剪和学习率衰减。通过这两个技术,可以优化训练过程,防止梯度爆炸和过早收敛,从而提高模型的泛化能力。
摘要由CSDN通过智能技术生成
import tensorflow as tf
import numpy as np
# 产生随机数
x_data = np.random.rand(100).astype(np.float32)
y_data = x_data * 0.1 + 0.3
# 初始化Weight和bias
Weight = tf.Variable(tf.random_uniform([1], -1.0, 1.0))
bias = tf.Variable(tf.zeros([1], dtype=tf.float32))
# 线性模型
y = Weight * x_data + bias
# loss函数
loss = tf.reduce_mean(tf.square(y_data - y))
# 最小化代价函数
global_steps = tf.Variable(0)  # 用于统计全局步长,常用于学习率衰减等
# 学习率
learning_rate = tf.train.exponential_decay(1.1, global_steps, 10, 0.5, staircase=False)
# 优化器
optimizer = tf.train.GradientDescentOptimizer(learning_rate=learning_rate)
# # 最小化loss
# train_op = optimizer.minimize(loss, global_steps)
# 等价
grads_vars = optimizer.compute_gradients(loss)  # 产生(gradients, Variance)列表
# 梯度裁剪
for i, (g, v) in enumerate(grads_vars):
    if g is not None:
        grads_vars[i] = (tf.clip_by_norm(g, 5), v)  # 阈值这里设为5

train_op = optimizer.apply_gradients(grads_vars, global_steps)  # 更新Variance
# 初始化变量
init = tf.global_variables_initializer()
with tf.Session() as sess:
    sess.run(init)
    for i in range(1000):
        [losses, gradients] = sess.run([loss, train_op])
        if i % 20 == 0:
            print(sess.run(learning_rate))
            print(i, sess.run([Weight, bias]))


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

晴天stick

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值