错误信息:训练失败,这可能是由于不合适的超参数引起的。
常见的超参数包括学习率、正则化系数、批量大小、隐藏层数、隐藏单元数、权重衰减系数、Dropout比例等。
此错误可能发生在准备训练的时候,也可能发生在训练了一段时间后才报错的,如果是训练一段时间后报的错误,通常在之前可以观察到Loss函数的值一直上涨的情况。正常训练情况下Loss函数的值是逐渐下降的,在上涨说明出现了梯度爆炸的情况。Loss函数基本是在训练到后面的时候,值在0.0几左右的时候,才会有上下波动的情况。训练前期基本都是一个一直减小的状态。
报这个错误的时候,可以先检查一下学习率,把初始学习率改小一点试试看。
如果报以下错误,直接提示的是batch,尝试修改小一点的batch_size。
HALCON算子错误:当在函数'train_dl_model'中调用
'train_dl_model_batch'l.line:182.
Training step failed.This might be caused by
unsuitable hyperparameters(HALCON错误代码:7720)