动手学深度学习学习笔记tf2.0版(3.3: 线性回归的简单实现)

线性回归学习笔记

github代码地址:https://github.com/taichuai/d2l_zh_tensorflow2.0

tf2.0线性回归简单实现,前面数据都是和上一篇一样,就不一一解释了

主要内容总结:
1、创建模型:tf.kears.Sequential(), tf.keras.layer直接创建, 并且可以使用 tensorflow.initializers 进行参数初始化
2、损失函数:tf.losses.MSE(x, y) 等各种,直接进行矩阵计算,得到平均损失,等价于:tf.reduce_mean(tf.square(predicted_y - tf.reshape(desired_y, predicted_y.shape)))
3、优化算法(优化器): tf.keras.optimizers.SGD(learning_rate=0.01)直接定义优化算法
4、训练模型: tape.gradient(l, model.trainable_variables) 记录动态图梯度, trainer.apply_gradients(zip(grads, model.trainable_variables)) 进行梯度自动更新
5、查看参数: model.trainable_variables 查看模型参数

1、创建模型
2、损失函数:tf.losses.MSE(x, y) 等各种,直接进行矩阵计算,得到平均损失,等价于:tf.reduce_mean(tf.square(predicted_y - tf.reshape(desired_y, predicted_y.shape)))

3、优化算法(优化器): tf.keras.optimizers.SGD(learning_rate=0.01)直接定义优化算法

4、训练模型: tape.gradient(l, model.trainable_variables) 记录动态图梯度, trainer.apply_gradients(zip(grads, model.trainable_variables)) 进行梯度自动更新

5、查看参数: model.trainable_variables 查看模型参数

import tensorflow as tf

print(tf.__version__)

from tensorflow.python.client import device_lib
import os
os.environ['CUDA_VISIBLE_DEVICES'] = "0, 1"
gpus = tf.config.experimental.list_physical_devices(device_type='GPU')
cpus = tf.config.experimental.list_physical_devices(device_type='CPU')
print(gpus, cpus)
# 设置当前程序的可见设备范围
tf.config.experimental.set_visible_devices(devices=gpus, device_type='GPU')

# 设置仅在需要时申请:
for gpu in gpus:
    tf.config.experimental.set_memory_growth(gpu, True)
    
# 下面的方式是设置Tensorflow固定消耗GPU:0的2GB显存
tf.config.experimental.set_virtual_device_configuration(
    gpus[0],
    [tf.config.experimental.VirtualDeviceConfiguration(memory_limit=200)]
)

def get_available_gpus():
  local_device_protos = device_lib.list_local_devices()
  return [x.name for x in local_device_protos if x.device_type == 'GPU']

print(get_available_gpus())
with tf.device('/device:GPU:0'):
    w = tf.constant([[2, -3.4]])
    b = tf.constant([4.2])
    x = tf.random.normal([1000, 2], mean=0, stddev=10)
    e = tf.random.normal([1000, 2], mean=0, stddev=0.1)
    W = tf.Variable(tf.constant([5, 1]))
    B = tf.Variable(tf.constant([1]))
w
import random
from matplotlib import pyplot as plt
# 线性回归模型, y = 
# 生成数据,生成1000组数据

num_inputs = 2
num_examples = 1000
true_y = tf.matmul(x, tf.transpose(w))   b
x, true_y
# 读取数据
def set_figsize(figsize=(3.5, 2.5)):
    plt.rcParams['figure.figsize'] = figsize

set_figsize()

plt.scatter(x[: ,1], true_y, 1)
def data_scale(x, y):
    return x, y

db = tf.data.Dataset.from_tensor_slices((x, true_y))
db_all = db.map(data_scale)
# 为了每个epchoes都打散,可以把下面 db 放到每轮内部去shuffle和batch
# db = db_all.shuffle(10)
# db_batch = db.batch(32)
# 查看一组数据
# print(next(iter(db_batch)))
# 构建模型(此处就不需要自己定义变量在进行矩阵计算了,直接调用包就好了)
# 导入模块
from tensorflow import keras
from tensorflow.keras import layers
from tensorflow import initializers as init

# 使用Sequential模式创建
model = keras.Sequential()
model.add(layers.Dense(1, kernel_initializer=init.RandomNormal(stddev=0.01)))
# 定义损失函数
from tensorflow import losses

#均方损失 
loss = losses.MeanSquaredError()
# 定义优化算法
from tensorflow.keras import optimizers
trainer = optimizers.SGD(learning_rate=0.001)

在使用Tensorflow训练模型时,我们通过调用tensorflow.GradientTape记录动态图梯度,执行tape.gradient获得动态图中各变量梯度。通过 model.trainable_variables 找到需要更新的变量,并用 trainer.apply_gradients 更新权重,完成一步训练。

# 训练模型

num_epoches = 3
for epoch in range(num_epoches):
    batch_data = db_all.shuffle(10)
    batch_data = batch_data.batch(32)
    for n, (train_x, train_y) in enumerate(batch_data):
#         print(x, y)
        print('x.shape', x.shape)
        with tf.GradientTape() as tape:
            l = loss(model(train_x), train_y)
        # 自动记录可训练变量
        grads = tape.gradient(l, model.trainable_variables)
        # 完成梯度更新
        trainer.apply_gradients(zip(grads, model.trainable_variables))
        # model.trainable_variables查看模型参数
        print(n , '\n', model.trainable_variables[0])
        # 通过 model.get_weights()[0]查看相关权重
        print(model.get_weights())
    # 每轮求一次全部的平均损失
    l = loss(model(x), true_y)
    print('\n epoch %d , loss: %f' % (epoch, l.numpy()))
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
在Python中,当使用自动微分库(如PyTorch)计算梯度时,只能为标量输出创建梯度。如果尝试为非标量输出创建梯度,就会出现"RuntimeError: grad can be implicitly created only for scalar outputs"的错误。这是因为在计算梯度时,需要将输出值与标量进行比较,以计算梯度的变化情况。 关于您提到的动手深度学习中的MLP(多层感知机),我无法直接回答您的问题,因为您的问题中没有提到与此相关的具体内容。但是,根据您引用的内容,我可以看到您正在讨论梯度计算和使用PyTorch的情况。 为了使用MLP,您需要定义MLP的结构(包括层数、每层的神经元数量等),并且使用PyTorch的相关功能进行实现。然后,您可以通过向前传播输入,并通过损失函数计算损失。接下来,使用自动微分功能计算梯度,并使用优化算法(如随机梯度下降)更新模型的参数。这样,您就可以训练MLP模型并进行预测。 如果您有具体的问题或需要更详细的解释,请提供更多细节,以便我可以更好地帮助您。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [【深度学习】日常笔记7](https://blog.csdn.net/qq_45732909/article/details/131380169)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 33.333333333333336%"] - *2* [Python RuntimeError: thread.__init__() not called解决方法](https://download.csdn.net/download/weixin_38630358/12877726)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 33.333333333333336%"] - *3* [RuntimeError: grad can be implicitly created only for scalar outputs的原因:Pytorch不支持对张量的...](https://blog.csdn.net/qq_40968179/article/details/127973793)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 33.333333333333336%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值