model.train()&&model.eval()&&with torch.no_grad()用法

爱睡觉的柏拉图

已于 2022-06-13 08:53:16 修改

阅读量1k

点赞数 2

分类专栏：计算机视觉文章标签：深度学习 pytorch batch python

于 2022-06-12 21:16:11 首次发布

本文链接：https://blog.csdn.net/qq_45844431/article/details/125249768

版权

计算机视觉专栏收录该内容

1 篇文章 0 订阅

订阅专栏

1.model.train()

启用 Batch Normalization 和 Dropout
如果模型中有BN层(Batch Normalization）和Dropout，需要在训练时添加model.train()。model.train()是保证BN层能够用到每一批数据的均值和方差。对于Dropout，model.train()是随机取一部分网络连接来训练更新参数。

用法：注意model.train()的位置


    for epoch in range(num_epoches):
        running_loss = torch.Tensor([0]).to(device)
        pbar = tqdm(enumerate(trainloader), total=len(trainloader),position=0)
        model.train()
        for i, data in pbar:
            path_img, img, labels = data
            img, labels = img.to(device), labels.to(device)
            optimizer.zero_grad()
            out = model(img)
            c = out.size()
            loss = criterion(out, labels.long())
            loss.backward()
            optimizer.step()

model.train()一定要是在epoch中并且在dataloader循环前的位置上

2.model.eval

不启用 Batch Normalization 和 Dropout
如果模型中有BN层(Batch Normalization）和Dropout，在测试时添加model.eval()。model.eval()是保证BN层能够用全部训练数据的均值和方差，即测试过程中要保证BN层的均值和方差不变。对于Dropout，model.eval()是利用到了所有网络连接，即不进行随机舍弃神经元。

    model.eval()
    with torch.no_grad():
        pbar = tqdm(enumerate(testloader), total=len(testloader),position=0)
        for i, data in pbar:
            path_img, img, labels = data
            img, labels = img.to(torch.float32).to(device),
labels.to(torch.float32).to(device)
            d = img.size()
            e = labels.size()
            out = model(img)
            f = out.size()
            _, pred = torch.max(out.data, 1)

3.with torch.no_grad()

with torch.no_grad()则主要是用于停止autograd模块的工作，以起到加速和节省显存的作用。它的作用是将该with语句包裹起来的部分停止梯度的更新，从而节省了GPU算力和显存，但是并不会影响dropout和BN层的行为。

注意：在测试模型时候，记得在with torch.no_grad()前面加上model.eval() ，不加model.eval() 会导致测试精度很低

爱睡觉的柏拉图

关注

2
点赞
踩
8

收藏

觉得还不错? 一键收藏
3
评论
model.train()&&model.eval()&&with torch.no_grad()用法

启用 Batch Normalization 和 Dropout如果模型中有BN层(Batch Normalization）和Dropout，需要在训练时添加model.train()。model.train()是保证BN层能够用到每一批数据的均值和方差。对于Dropout，model.train()是随机取一部分网络连接来训练更新参数。用法：注意model.train()的位置model.train()一定要是在epoch中并且在dataloader循环前的位置上2.model.eval不
复制链接

扫一扫