深度学习网络总体流程

  1. 环境的搭建

pytorch

  1. dataloader

该部分是批量返回数据的作用

  1. 搭建模型

基于nn.Module构造的model类

其主要部分是神经网络layer和前向计算的forward函数

  1. 损失函数

从特征空间映射到R上的度量函数

常见的损失函数

  1. L2损失(回归)

  1. 交叉熵(概率)

  1. 训练函数(优化方法)

寻找降低损失函数的优化方法,假定损失函数是凸函数

常见优化方法

  1. 随机梯度下降法SGD(最常见最适用)

  1. ADAM(还没学)

  1. 0-1损失(分类过程)

  1. 搭建训练过程

设定常见的超参数如epoch, batch_size并初始化参数

对每一次epoch:

  1. 存储模型参数

  1. 可视化训练误差loss

  1. 可视化测试误差用于调参

在每一batch_size:

  1. 计算损失函数

  1. 梯度清零(在第二次迭代开始生效)

  1. 令所有参数对损失函数求梯度(梯度清零防止累加)

  1. 参数根据优化方法(利用梯度)更新

杂项

一般将过程456写成一个train函数

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值