loss
smooth L1 loss能从两个方面限制梯度:当预测框与 ground truth 差别过大时,梯度值不至于过大;当预测框与 ground truth 差别很小时,梯度值足够小。loss过程#---1在3个尺度上,模型一共会有16800个anchors。#---2训练的时候,我们需要选择若干个anchors,让基于这些被选中的anchors的预测结果,参与loss的计算。#---(2)基本的选择规则是,在anchors和某个ground_truth的overlap大于阈值。#---3