本文主要讲解一些参数初始化技巧和超参数的设置技巧,模型的理解和设计技巧,如何去指导我们对模型进行调优设计,如何从高(层数深)胖(卷积核庞大)的模型到高瘦或者矮(层数浅)瘦(卷积核较少)的模型去演变,同时性能得到优化或者保持!
训练的过程和阶段可以分为3个阶段:
欠拟合:模型没有很好地捕捉到数据特征(训练集和验证集的loss都大于0.3)。
刚刚好:模型已经完成了我们的任务,满足要求(训练集和验证集上的loss都小于0.01)。
过拟合:模型把数据学习的太彻底,以至于把噪声数据的特征也学习到了(训练集上loss小于0.01,验证集上loss大于0.3)。
遵守的基本原则:快速试错
基本流程:
1 小规模数据集和大模型