关于Pytorch中model.train()和model.eval()的详解

最新推荐文章于 2024-06-11 09:34:15 发布

BlackMan_阿伟

最新推荐文章于 2024-06-11 09:34:15 发布

阅读量1.1k

点赞数 1

分类专栏： Pytorch 文章标签：深度学习神经网络人工智能算法

本文链接：https://blog.csdn.net/weixin_37724529/article/details/109392029

版权

本文介绍了深度学习中模型训练和测试阶段如何使用Dropout和BatchNormalization。训练时启用这两项技术能加速网络收敛，防止梯度消失，并有助于避免过拟合。BatchNormalization通过计算批次数据的均值和方差，使数据趋于正态分布，其训练参数在评估时不更新。测试时，这些技术被禁用以获得稳定的结果。

摘要由CSDN通过智能技术生成

模型训练
- model.train()
- 启用Dropout和BatchNormalization
- Droupout=True
- BatchNormalization=True
- 训练过程中会以一定的概率丢掉网络连接的节点
模型测试
- model.eval()
- 不启用Dropout和BatchNormalization
- Dropout=False
- BatchNormalization=False
- 测试过程中不会丢掉网络连接的节点
为啥使用BatchNormalization和Dropout？
- 防止者消失
- 加快网络收敛（BN作用）
- 防止过拟合
BatchNormalization
- 主要是计算一个批次的方差
- 其中间的计算就可以想象把一个批次的数据做了一个激活
- 经过BN层的数据趋于正态分布
- 在BN层这是训练一个权值矩阵和偏置的，因此在model.eval()层直接使用训练好的参数
BatchNormalization计算
- 输入一批次数据

最低0.47元/天解锁文章

BlackMan_阿伟

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
4
评论
关于Pytorch中model.train()和model.eval()的详解

模型训练 model.train() 启用Dropout和BatchNormalization Droupout=True BatchNormalization=True 训练过程中会以一定的概率丢掉网络连接的节点模型测试 model.eval() 不启用Dropout和BatchNormalization Dropout=False BatchNormalization=False 测试过程中不会丢掉网络连接的节点为啥使用BatchNormalizati
复制链接

扫一扫