【李沐-LeNet】中的代码学习

é«

已于 2022-03-27 20:24:36 修改

阅读量204

点赞数

文章标签：学习

于 2022-03-12 20:03:41 首次发布

本文链接：https://blog.csdn.net/weixin_43476632/article/details/123399468

版权

net.apply：

model.apply(fn)会递归地将函数fn应用到父模块的每个子模块submodule，也包括model这个父模块自身。

net.train()与net.eval（)（在有dropout层，归一化，sofotmax里面也有归一化，的时候应该告诉网络这是train）

因为：

dropout在训练的时候起作用，在推断的时候不应该对输入加入噪声（dropout相当于正则化）

batch normalization 也只能在训练的时候使用

class Accumulator: #@save
"""在`n`个变量上累加。"""
def __init__(self, n):
self.data = [0.0] * n

def add(self, *args):
self.data = [a + float(b) for a, b in zip(self.data, args)]

def reset(self):
self.data = [0.0] * len(self.data)

def __getitem__(self, idx):
return self.data[idx]

enumerate(sequence, [start=0])

>>> seasons = ['Spring', 'Summer', 'Fall', 'Winter']
>>> list(enumerate(seasons))
[(0, 'Spring'), (1, 'Summer'), (2, 'Fall'), (3, 'Winter')]

#LeNet的结构
Sequential(
  (0): Conv2d(1, 6, kernel_size=(5, 5), stride=(1, 1), padding=(2, 2))
  (1): Sigmoid()
  (2): AvgPool2d(kernel_size=2, stride=2, padding=0)
  (3): Conv2d(6, 16, kernel_size=(5, 5), stride=(1, 1))
  (4): Sigmoid()
  (5): AvgPool2d(kernel_size=2, stride=2, padding=0)
  (6): Flatten(start_dim=1, end_dim=-1)
  (7): Linear(in_features=400, out_features=120, bias=True)
  (8): Sigmoid()
  (9): Linear(in_features=120, out_features=84, bias=True)
  (10): Sigmoid()
  (11): Linear(in_features=84, out_features=10, bias=True)
)

loss= CrossE
optimizer = SGD

é«

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【李沐-LeNet】中的代码学习

net.apply：model.apply(fn)会递归地将函数fn应用到父模块的每个子模块submodule，也包括model这个父模块自身。net.train()与net.eval（)切换训练和评估(推断)的模式dropout在训练的时候起作用，在推断的时候被绕过不起作用，或者等价地，将其概率置为零batch normalization有两种模式，分别对应训练和推断，分别是:model.eval()和model.train().class Accumulato..
复制链接

扫一扫