#softmax回归简洁实现
import torch
from torch import nn
from d2l import torch as d2l
import os
os.environ['KMP_DUPLICATE_LIB_OK']='True'
batch_size = 256
train_iter,test_iter = d2l.load_data_fashion_mnist(batch_size)
#pytorch不会隐式调整输入形状 因此定义了展平层flatten 在线性层前调整网络输入的情况
#这里的意思是输入是256*28*28的批量数据,然后通过展平层展平成256*784的批次
net = nn.Sequential(nn.Flatten(),nn.Linear(784,10))#flatten就是把tensor拍成一个二维的
def init_weights(m):
if type(m) == nn.Linear:
nn.init.normal_(m.weight,std=0.01)#初始化均值为0 标准差为0.01的正态随机初始化模型参数
net.apply(init_weights)
loss = nn.CrossEntropyLoss()
trainer = torch.optim.SGD(net.parameters(),lr = 0.1)
num_epochs = 3
d2l.train_ch3(net,train_iter,test_iter,loss,num_epochs,trainer)
d2l.plt.show()
09-softmax回归简洁实现 动手深度学习
最新推荐文章于 2023-11-19 20:43:26 发布