《动手学深度学习》(PyTorch版)代码注释 - 11 【Dropout_with_simple_way】

最新推荐文章于 2022-11-12 15:57:39 发布

Hurri_cane

最新推荐文章于 2022-11-12 15:57:39 发布

阅读量209

点赞数

分类专栏：《动手学深度学习》(PyTorch版)代码注释文章标签：深度学习 python 人工智能

本文链接：https://blog.csdn.net/ShakalakaPHD/article/details/108155884

版权

《动手学深度学习》(PyTorch版)代码注释专栏收录该内容

56 篇文章 44 订阅

订阅专栏

说明

本博客代码来自开源项目：《动手学深度学习》(PyTorch版)
并且在博主学习的理解上对代码进行了大量注释，方便理解各个函数的原理和用途

配置环境

使用环境：python3.8
平台：Windows10
IDE：PyCharm

此节说明

此节对应书本上3.13节
此节功能为：丢弃法的简单实现
由于此节相对容易理解，代码注释量较少

代码

# 本书链接https://tangshusen.me/Dive-into-DL-PyTorch/#/chapter03_DL-basics/3.12_weight-decay?id=_3123-%e4%bb%8e%e9%9b%b6%e5%bc%80%e5%a7%8b%e5%ae%9e%e7%8e%b0
# 3.13 丢弃法
#注释：黄文俊
#邮箱：hurri_cane@qq.com
import matplotlib.pyplot as plt
import torch
import torch.nn as nn
import numpy as np
import sys
sys.path.append("..")
import d2lzh_pytorch as d2l


num_inputs, num_outputs, num_hiddens1, num_hiddens2 = 784, 10, 256, 256

W1 = torch.tensor(np.random.normal(0, 0.01, size=(num_inputs, num_hiddens1)), dtype=torch.float, requires_grad=True)
b1 = torch.zeros(num_hiddens1, requires_grad=True)
W2 = torch.tensor(np.random.normal(0, 0.01, size=(num_hiddens1, num_hiddens2)), dtype=torch.float, requires_grad=True)
b2 = torch.zeros(num_hiddens2, requires_grad=True)
W3 = torch.tensor(np.random.normal(0, 0.01, size=(num_hiddens2, num_outputs)), dtype=torch.float, requires_grad=True)
b3 = torch.zeros(num_outputs, requires_grad=True)

params = [W1, b1, W2, b2, W3, b3]

drop_prob1, drop_prob2 = 0.2, 0.5

num_epochs, lr, batch_size = 5, 100.0, 256
loss = torch.nn.CrossEntropyLoss()
train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size)

net = nn.Sequential(
        d2l.FlattenLayer(),
        #FlattenLayer为展平层，将输入进来的特征进行展平，如输入28*28的图像展平为1*784
        nn.Linear(num_inputs, num_hiddens1),
        nn.ReLU(),
        nn.Dropout(drop_prob1),
        nn.Linear(num_hiddens1, num_hiddens2),
        nn.ReLU(),
        nn.Dropout(drop_prob2),
        nn.Linear(num_hiddens2, 10)
        )

for param in net.parameters():
        nn.init.normal_(param, mean=0, std=0.01)


optimizer = torch.optim.SGD(net.parameters(), lr=0.5)#指定学习率为0.5的小批量随机梯度下降（SGD）为优化算法
d2l.train_ch3(net, train_iter, test_iter, loss, num_epochs, batch_size, None, None, optimizer)



plt.show()



print("*"*30)