构建数据集
用Dataset加载代码,构建数据集。
定义神经网络模型
定义超参、损失函数和优化器
超参
是可以调整的参数,可以控制模型训练优化的过程。
一般会定义以下超参用于训练:
一、训练轮次:
训练时遍历数据集的次数。
二、批次大小:
数据集进行分批读取训练,设定每个批次数据的大小。需要选择合适的batch size,可以有效提高模型精度、全局收敛。
三、学习率:
梯度下降法被广泛应用在最小化模型误差的参数优化算法上。梯度下降法通过多次迭代,并在每一步中最小化损失函数来预估模型的参数。学习率就是在迭代过程中,会控制模型的学习进度。
损失函数
用于评估模型的预测值和目标值之间的误差。
优化器
在每个训练步骤中调整模型参数以减少模型误差。
训练与验证
训练:迭代训练数据集,尝试收敛到最佳参数;
验证:迭代测试数据集,检查模型性能是否提升。