看源码的时候发现在检测阶段很有意思,主要分为以下几部 对预测的location解码排除背景目标, 也就是置信度最高的是背景的bounding boxes----不对,原文中也是忽视背景标签,而不是过滤在同类中的框之间做NMS NMS时在同类图中做NMS, 为什么不整体做NMS 是因为防止拥挤物体的错误的抑制掉NMS只关注置信度top_k(原作者是400)的bounding boxes