汇总|目标检测中的数据增强、backbone、head、neck、损失函数

最新推荐文章于 2024-08-15 13:53:48 发布

3Ｄ视觉工坊

最新推荐文章于 2024-08-15 13:53:48 发布

阅读量1.8k

点赞数 3

点击上方“3D视觉工坊”，选择“星标”

干货第一时间送达

作者：Tom Hardy

https://zhuanlan.zhihu.com/p/137769687

本文仅做学术分享，如有侵权，请联系删除。

一、数据增强方式

random erase
CutOut
MixUp
CutMix
色彩、对比度增强
旋转、裁剪

解决数据不均衡：

Focal loss
hard negative example mining
OHEM
S-OHEM
GHM（较大关注easy和正常hard样本，较少关注outliners）
PISA

二、常用backbone

VGG
ResNet（ResNet18，50，100）
ResNeXt
DenseNet
SqueezeNet
Darknet（Darknet19,53）
MobileNet
ShuffleNet
DetNet
DetNAS
SpineNet
EfficientNet（EfficientNet-B0/B7）
CSPResNeXt50
CSPDarknet53

三、常用Head

Dense Prediction (one-stage):

RPN
SSD
YOLO
RetinaNet
(anchor based)
CornerNet
CenterNet
MatrixNet
FCOS(anchor free)

Sparse Prediction (two-stage):

Faster R-CNN
R-FCN
Mask RCNN (anchor based)
RepPoints(anchor free)

四、常用neck

Additional blocks:

SPP
ASPP
RFB
SAM

Path-aggregation blocks:

FPN
PAN
NAS-FPN
Fully-connected FPN
BiFPN
ASFF
SFAM
NAS-FPN

五、Skip-connections

Residual connections
Weighted residual connections
Multi-input weighted residual connections
Cross stage partial connections (CSP)

六、常用激活函数和loss

激活函数：

ReLU
LReLU
PReLU
ReLU6
Scaled Exponential Linear Unit (SELU)
Swish
hard-Swish
Mish

loss：

MSE
Smooth L1
Balanced L1
KL Loss
GHM loss
IoU Loss
Bounded IoU Loss
GIoU Loss
CIoU Loss
DIoU Loss

七、正则化和BN方式

正则化：

DropOut
DropPath
Spatial DropOut
DropBlock

BN：

Batch Normalization (BN)
Cross-GPU Batch Normalization (CGBN or SyncBN)
Filter Response Normalization (FRN)
Cross-Iteration Batch Normalization (CBN)

八、训练技巧

Label Smoothing
Warm Up

推荐阅读：

专辑|相机标定
专辑|3D点云
专辑|SLAM
专辑|深度学习与自动驾驶
专辑|结构光
专辑|事件相机
专辑|OpenCV学习
专辑|学习资源汇总
专辑|招聘与项目对接
专辑|读书笔记

重磅！3DCVer-学术论文写作投稿交流群已成立
扫码添加小助手微信，可申请加入3D视觉工坊-学术论文写作与投稿微信交流群，旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。
同时也可申请加入我们的细分方向交流群，目前主要有3D视觉、CV&深度学习、SLAM、三维重建、点云后处理、自动驾驶、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流等微信群，请扫描下面微信号加群，备注：”研究方向+学校/公司+昵称“，例如：”3D视觉 + 上海交大 + 静静“。请按照格式备注，否则不予通过。添加成功后会根据研究方向邀请进去相关微信群。原创投稿也请联系。
▲长按加微信群或投稿
▲长按关注公众号

3D视觉从入门到精通知识星球：针对3D视觉领域的知识点汇总、入门进阶学习路线、最新paper分享、疑问解答四个方面进行深耕，更有各类大厂的算法工程人员进行技术指导。与此同时，星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息，打造成集技术与就业为一体的铁杆粉丝聚集区，近1000+星球成员为创造更好的AI世界共同进步，知识星球入口：

学习3D视觉核心技术，扫描查看介绍，3天内无条件退款
圈里有高质量教程资料、可答疑解惑、助你高效解决问题