一、基本配置
1. 调库
2. 超参数
3. 设置 gpu 训练
4. 标签
二、数据读入加载
0. 创造数据,划分训练集、测试集、验证集(带标签)
1. 读入数据
1.1 Pytorch 自带数据集构建Dataset
1.2 自定义Dataset类(class + 多个函数)
2. 加载数据
使用DataLoader来按批次读入数据
三、模型构建
四、模型初始化
五、损失函数
1. 根据场景套函数
2. 根据函数套公式,计算损失
六、优化器
1. 优化器属性和构造
2. 优化器使用
七、训练和评估
1. 训练流程
2. 验证/测试的流程
八、可视化
总结:
记住了套路就不会偏航太远,但记住套路还不够。
单独实现每个环节需要“硬功”,把每个环节衔接起来也需要“硬功”,
根据具体需求微调某部分也需要“硬功”。
“硬功”就是程序员的基本功——数学、计算机、程序语言、逻辑能力。
此外,耐心、勤奋、兴趣都很重要。勤奋不只是手敲得勤快、眼看得勤快、班加得勤快,勤于动脑是主体,动脑优先级最高。
如果一动脑就陷入背诵、记忆的陷阱,那就是在偷懒。
逻辑的推演是无法逃避的,背诵、记忆的勤奋应该放在把大脑输出的逻辑快速用代码表示上,忘记了可以回头再去搜,否则会打断思路。
不要写一行代码就去搜一下函数,至少多写几行代码再去批量搜索函数,不要让宝贵的思路被频繁打断,人比GPT强在逻辑思维,而不是敲代码速度和工作时长。