仅供个人学习使用
1、two stage
rcnn系列都是两阶段模型,需要先在图片上生成一些候选框,然后再对候选框进行分类和框坐标的回归修正。
首先在图片上进行特征提取,之后进入候选框筛选,例如RPN网络,获得较为可能的候选框,然后映射到特征图上,对特征图上的bounding box进行分类和坐标回归。该方法正负样本较为均衡,因为已经RPN网络筛选过一遍了。
2、one stage
yolo,ssd系列都是一阶段模型,将图片划分为不同的部分,再通过设置先验框,例如在v5版本,设置3种划分大小的图片,然后每种上设置3个先验框,9种框。在每个框里进行分类与坐标回归。可使用focal loss解决正负样本过多的问题。