《动手学深度学习》(PyTorch版)代码注释 - 1 【Linear_regression_with_zero】

最新推荐文章于 2024-07-10 19:09:07 发布

Hurri_cane

最新推荐文章于 2024-07-10 19:09:07 发布

阅读量535

点赞数

分类专栏：《动手学深度学习》(PyTorch版)代码注释文章标签： python 深度学习机器学习人工智能算法

本文链接：https://blog.csdn.net/ShakalakaPHD/article/details/108134227

版权

《动手学深度学习》(PyTorch版)代码注释专栏收录该内容

56 篇文章 45 订阅

订阅专栏

说明

本博客代码来自开源项目：《动手学深度学习》(PyTorch版)
并且在博主学习的理解上对代码进行了大量注释，方便理解各个函数的原理和用途

配置环境

使用环境：python3.8
平台：Windows10
IDE：PyCharm

此节说明

次节对应书本上3.2节
此节功能为：线性回归的从零开始实现
由于此节相对容易理解，代码注释量较少

代码

#注释：黄文俊
#邮箱：hurri_cane@qq.com
import torch
from IPython import display
from matplotlib import pyplot as plt
import numpy as np
import random
import sys
sys.path.append("..")
from d2lzh_pytorch import *

#在训练模型的时候，我们需要遍历数据集并不断读取小批量数据样本。这里我们定义一个函数：它每次返回batch_size（批量大小）个随机样本的特征和标签。
# 本函数已保存在d2lzh包中方便以后使用
def data_iter(batch_size, features, labels):
    num_examples = len(features)
    indices = list(range(num_examples))
    random.shuffle(indices)  # 样本的读取顺序是随机的
    for i in range(0, num_examples, batch_size):
        j = torch.LongTensor(indices[i: min(i + batch_size, num_examples)]) # 最后一次可能不足一个batch
        yield  features.index_select(0, j), labels.index_select(0, j)


num_inputs = 2
num_examples = 1000
true_w = [2, -3.4]
true_b = 4.2
features = torch.randn(num_examples, num_inputs,
                       dtype=torch.float32)
labels = true_w[0] * features[:, 0] + true_w[1] * features[:, 1] + true_b
labels += torch.tensor(np.random.normal(0, 0.01, size=labels.size()),
                       dtype=torch.float32)

set_figsize()
plt.scatter(features[:, 1].numpy(), labels.numpy(), 1)
plt.show()

batch_size = 10

for X, y in data_iter(batch_size, features, labels):
    print(X, y)
    break

w = torch.tensor(np.random.normal(0, 0.01, (num_inputs, 1)), dtype=torch.float32)
b = torch.zeros(1, dtype=torch.float32)

w.requires_grad_(requires_grad=True)
b.requires_grad_(requires_grad=True)

lr = 0.03
num_epochs = 3
net = linreg
loss = squared_loss

loop_times = 0

for epoch in range(num_epochs):  # 训练模型一共需要num_epochs个迭代周期
    # 在每一个迭代周期中，会使用训练数据集中所有样本一次（假设样本数能够被批量大小整除）。X
    # 和y分别是小批量样本的特征和标签
    for X, y in data_iter(batch_size, features, labels):
        l = loss(net(X, w, b), y).sum()  # l是有关小批量X和y的损失
        l.backward()  # 小批量的损失对模型参数求梯度
        sgd([w, b], lr, batch_size)  # 使用小批量随机梯度下降迭代模型参数

        # 不要忘了梯度清零
        w.grad.data.zero_()
        b.grad.data.zero_()
        loop_times += 1       #记录优化次数
    train_l = loss(net(features, w, b), labels)
    print('epoch %d, loss %f' % (epoch + 1, train_l.mean().item()))
    print(loop_times)
print("W的真实值：",true_w,'\n'"W的预测值：",w)
print("b的真实值：",true_b,'\n'"b的预测值：",b)