https://github.com/PaddlePaddle/PaddleClas (尝鲜版)分类模型
PaddleClas
图像分类基础知识
训练集(train dataset):用来训练模型,使模型能够识别不同类型的特征;
验证集(val dataset):训练过程中的测试集,方便训练过程中查看模型训练程度;
预训练模型
使用在某个较大的数据集训练好的预训练模型,即被预置了参数的权重,可以帮助模型在新的数据集上更快收敛。尤其是对一些训练数据比较稀缺的任务,在神经网络参数十分庞大的情况下,仅仅依靠任务自身的训练数据可能无法训练充分,加载预训练模型的方法可以认为是让模型基于一个更好的初始状态进行学习,从而能够达到更好的性能。
迭代轮数(epoch)
模型训练迭代的总轮数,模型对训练集全部样本过一遍即为一个 epoch。当测试错误率和训练错误率相差较小时,可认为当前迭代轮数合适;当测试错误率先变小后变大时,则说明迭代轮数过大,需要减小迭代轮数,否则容易出现过拟合。
损失函数(Loss Function)
训练过程中,衡量模型输出(预测值)与真实值之间的差异
一、环境配置
环境配置 Python3.7 cuda10.2
git clone https://github.com/Paddle