在做对比实验时,发现有的模型例如double faster-rcnn在训练自己的数据集时会出现训练过程中loss为NaN的情况,可能是lr过大,发现可以更改mmdet模型配置文件,加入梯度裁剪,并且调小lr即可,代码如下:
#在模型的配置文件中加入 可以调整训练过程中的梯度最大值
optim_wrapper = dict(
type='OptimWrapper',
optimizer=dict(
_delete_=True, type='AdamW', lr=0.0025, weight_decay=0.0001),
clip_grad=dict(max_norm=1, norm_type=2)
)