深度学习backbone、neck、head等术语解释

最新推荐文章于 2025-04-24 10:06:47 发布

zyb-小波

最新推荐文章于 2025-04-24 10:06:47 发布

阅读量9.7k

点赞数 36

分类专栏：图像处理深度学习文章标签：深度学习人工智能

原文链接：https://zhuanlan.zhihu.com/p/137769687

版权

深度学习同时被 2 个专栏收录

13 篇文章

订阅专栏

图像处理

7 篇文章

订阅专栏

本文详述了深度学习中关键组件：backbone网络（如ResNet、VGG）、head设计（RPN、YOLO）、neck提升特征效率（FPN、ASPP），以及数据增强、loss函数和训练技巧。涵盖了常用模型、数据处理策略和优化实践。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

backbone：主干网络，用来提取特征，常用Resnet、VGG等

head：获取网络输出，利用提取特征做出预测

neck：放在backbone和head之间，进一步提升特征的多样性及鲁棒性

bottleneck：瓶颈，通常指网络输入输出数据维度不同，通常输出维度比输入维度小很多

GAP：Global Average Pool全局平均池化，将某个通道的特征取平均值

Warm up：小的学习率先训练几个epoch，这是因为网络的参数是随机初始化的，一开始就采用较大的学习率容易数值不稳定

参考链接：汇总|目标检测中的数据增强、backbone、head、neck、损失函数 - 知乎

一、数据增强方式

random erase
CutOut
MixUp
CutMix
色彩、对比度增强
旋转、裁剪

解决数据不均衡：

Focal loss
hard negative example mining
OHEM
S-OHEM
GHM（较大关注easy和正常hard样本，较少关注outliners）
PISA

二、常用backbone

VGG
ResNet（ResNet18，50，100）
ResNeXt
DenseNet
SqueezeNet
Darknet（Darknet19,53）
MobileNet
ShuffleNet
DetNet
DetNAS
SpineNet
EfficientNet（EfficientNet-B0/B7）
CSPResNeXt50
CSPDarknet53

三、常用Head

Dense Prediction (one-stage):

RPN
SSD
YOLO
RetinaNet
(anchor based)
CornerNet
CenterNet
MatrixNet
FCOS(anchor free)

Sparse Prediction (two-stage):

Faster R-CNN
R-FCN
Mask RCNN (anchor based)
RepPoints(anchor free)

四、常用neck

Additional blocks:

SPP
ASPP
RFB
SAM

Path-aggregation blocks:

FPN
PAN
NAS-FPN
Fully-connected FPN
BiFPN
ASFF
SFAM
NAS-FPN

五、Skip-connections

Residual connections
Weighted residual connections
Multi-input weighted residual connections
Cross stage partial connections (CSP)

六、常用激活函数和loss

激活函数：

ReLU
LReLU
PReLU
ReLU6
Scaled Exponential Linear Unit (SELU)
Swish
hard-Swish
Mish

loss：

MSE
Smooth L1
Balanced L1
KL Loss
GHM loss
IoU Loss
Bounded IoU Loss
GIoU Loss
CIoU Loss
DIoU Loss

七、正则化和BN方式

正则化：

DropOut
DropPath
Spatial DropOut
DropBlock

BN：

Batch Normalization (BN)
Cross-GPU Batch Normalization (CGBN or SyncBN)
Filter Response Normalization (FRN)
Cross-Iteration Batch Normalization (CBN)

八、训练技巧

Label Smoothing
Warm Up