backbone is pre-trained on ImageNet ,which includes
VGG [68], ResNet [26], ResNeXt [86],or DenseNet [30]
neck are usu-ally used to collect feature maps from different stages.
head which is used to predict classes and bounding boxes of ob-jects, such as
e R-CNN [19] series, YOLO [61, 62, 63], SSD
双阶段目标检测:一个阶段提出备选框,一个阶段对备选框进行判断。是一个两阶段级联的网络。主要为RCNN系列的网络。
单阶段的网络,整个生成备选框的过程一体化的实现。代表有YOLO系列和SSD。
双阶段的检测网络,相当于在一阶段的密集检测上增加了一个稀疏的预测器,或者说一阶段网络是二阶段网络的RPN部分
图像语义分割:举例来说,如果一张照片中有多个人于语义分割来说,只要将所由人的像素都归为一类,但是实例分割还要将不同人的像素归为不同的类。也就是说实例分割比语义分割更进一步。
深度学习中的注意力机制(Attention Mechanism)和人类视觉的注意力机制类似,就是在众多信息中把注意力集中放在重要的点上,选出关键信息,而忽略其他不重要的信息。
Anchor-free and Anchor-based
目标检测算法一般可分为anchor-based、anchor-free,或是两者的融合, 区别就在于有没有利用anchor提取候选目标框
1.anchor-based类算法代表是fasterRCNN、SSD、YoloV2/V3等
2.anchor-free类算法代表是CornerNet、ExtremeNet、CenterNet、FCOS等