Backbone
主干网络-提取特征,是之后完成目标检测等一系列任务的基础。
e.g. VGG、ResNet、DenseNet……
(Detection) Head
Backbone之后连接的网络层。
head是获取网络输出内容的网络,利用之前提取的特征,做出预测。比如获得图像分类、目标检测(分类+定位)等任务的结果。
e.g.
[Dense Prediction / One Stage] - RPN、SSD、YOLO、RetinaNet
[Sparse Prediction / Two Stage] - Faster R-CNN、R-FCN、Mask R-CNN
Neck
处于Backbone和head之间,为了更好的利用backbone提取的特征。
e.g.
[Additional blocks] - SPP、ASPP、SAM……
[Path-aggregation blocks] - FPN、Fully-connected FPN、BiFPN……
detector
detector = backbone+neck+head
bottleneck
瓶颈的意思,通常指的是网络输入的数据维度和输出的维度不同,输出的维度比输入的小了许多,就像脖子一样,变细了。经常设置的参数 bottle_num=256,指的是网络输出的数据的维度是256 ,可是输入进来的可能是1024维度的。
热身Warm up
Warm up指的是用一个小的学习率先训练几个epoch,这是因为网络的参数是随机初始化的,一开始就采用较大的学习率容易数值不稳定。
参考博文:
backbone、head、neck等深度学习中的术语解释;
目标检测 Backbone、Neck、Detection head;
汇总|目标检测中的数据增强、backbone、head、neck、损失函数
本文介绍了目标检测中的关键组件,包括主干网络(Backbone)、颈部网络(Neck)及头部网络(Head)。详细阐述了这些组件如何协同工作来实现目标检测任务,并解释了诸如瓶颈(Bottleneck)等概念。
69

被折叠的 条评论
为什么被折叠?



