第一课 简介
- 模型构建
- 层
- 前向传播
- 训练参数
- 训练次数
- 学习率
- 优化器
- 损失函数
- 训练过程
- 数据预处理
- 梯度清零
- 前向传播
- 计算损失
- 反向传播
- 更新权重参数
- 检验
- 前向传播
使用GPU进行训练:把数据和模型传入cuda
hub模块:预训练模型加载
model
- 继承nn.module
- 无需反向传播,只需前向传播
- 可学习参数可通过named_parameters()或parameters()返回迭代器
Dasaset
- TensorDataset:将数据类型转化为tesnsor类型
- DataLoader:指定batch_size,shuffle,每次迭代会得到batch_size的数据
for data,label in dataloader
训练时,每步加上model.train()
,会进行标准化和Dropout
,验证时,加上model.eval()
,则不会进行上述操作