ciaodvd数据集的简单介绍_从头学pytorch(三) 线性回归

最新推荐文章于 2024-05-14 02:54:16 发布

weixin_39639568

最新推荐文章于 2024-05-14 02:54:16 发布

阅读量322

点赞数

文章标签： ciaodvd数据集的简单介绍

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39639568/article/details/113001549

版权

这篇博客介绍了如何使用PyTorch从头开始实现线性回归模型，以ciaodvd数据集为例。内容包括生成数据集、数据读取、模型参数初始化、模型定义、损失函数、优化算法以及模型训练。博客还探讨了PyTorch中简洁的线性回归实现，使用nn.Module和nn.Sequential构建网络，并展示了模型参数的初始化和优化过程。

摘要由CSDN通过智能技术生成

实现线性回归

分为以下几个部分:

生成数据集

读取数据

初始化模型参数

定义模型

定义损失函数

定义优化算法

训练模型

生成数据集

我们构造一个简单的人工训练数据集，它可以使我们能够直观比较学到的参数和真实的模型参数的区别。设训练数据集样本数为1000，输入个数(特征数)为2。给定随机生成的批量样本特征 \(\boldsymbol{X} \in \mathbb{R}^{1000 \times 2}\)，我们使用线性回归模型真实权重 \(\boldsymbol{w} = [2, -3.4]^\top\) 和偏差 \(b = 4.2\)，以及一个随机噪声项 \(\epsilon\) 来生成标签

\[\boldsymbol{y} = \boldsymbol{X}\boldsymbol{w} + b + \epsilon

\]

其中噪声项 \(\epsilon\) 服从均值为0、标准差为0.01的正态分布。噪声代表了数据集中无意义的干扰。

%matplotlib inline

import torch

from IPython import display

from matplotlib import pyplot as plt

import numpy as np

import random

num_inputs = 2

num_examples = 1000

true_w = [2, -3.4]

true_b = 4.2

features = torch.from_numpy(np.random.normal(0, 1, (num_examples, num_inputs)))

print(type(features),features.shape)

labels = true_w[0] * features[:, 0] + true_w[1] * features[:, 1] + true_b

print(type(labels),labels.shape)

labels += torch.from_numpy(np.random.normal(0, 0.01, size=labels.size()))

def use_svg_display():

# 用矢量图显示

display.set_matplotlib_formats('svg')

def set_figsize(figsize=(3.5, 2.5)):

use_svg_display()

# 设置图的尺寸

plt.rcParams['figure.figsize'] = figsize

set_figsize()

plt.scatter(features[:, 1].numpy(), labels.numpy(), 1);

读取数据

每次读取batch_size个样本.注意乱序读取.以使得每个batch的样本多样性足够丰富.

def data_iter(batch_size, features, labels):

num_examples = len(features)

#print(num_examples)

indices = list(range(num_examples))

random.shuffle(indices) # 样本的读取顺序是随机的

#print(indices)

for i in range(0, num_examples, batch_size):

j = torch.LongTensor(indices[i: min(i + batch_size, num_examples)]) # 最后一次可能不足一个batch

#print(j)

yield features.index_select(0, j), labels.index_select(0, j)

batch_size = 10

for X, y in dat

最低0.47元/天解锁文章

weixin_39639568

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。