汇总|目标检测中的数据增强、backbone、head、neck、损失函数

点击上方“3D视觉工坊”,选择“星标”

干货第一时间送达

作者:Tom Hardy

https://zhuanlan.zhihu.com/p/137769687

本文仅做学术分享,如有侵权,请联系删除。

一、数据增强方式

  1. random erase

  2. CutOut

  3. MixUp

  4. CutMix

  5. 色彩、对比度增强

  6. 旋转、裁剪

解决数据不均衡:

  • Focal loss

  • hard negative example mining

  • OHEM

  • S-OHEM

  • GHM(较大关注easy和正常hard样本,较少关注outliners)

  • PISA

二、常用backbone

  1. VGG

  2. ResNet(ResNet18,50,100)

  3. ResNeXt

  4. DenseNet

  5. SqueezeNet

  6. Darknet(Darknet19,53)

  7. MobileNet

  8. ShuffleNet

  9. DetNet

  10. DetNAS

  11. SpineNet

  12. EfficientNet(EfficientNet-B0/B7)

  13. CSPResNeXt50

  14. CSPDarknet53

三、常用Head

Dense Prediction (one-stage):

  1. RPN

  2. SSD

  3. YOLO

  4. RetinaNet

  5. (anchor based)

  6. CornerNet

  7. CenterNet

  8. MatrixNet

  9. FCOS(anchor free)

Sparse Prediction (two-stage):

  1. Faster R-CNN

  2. R-FCN

  3. Mask RCNN (anchor based)

  4. RepPoints(anchor free)

四、常用neck

Additional blocks:

  1. SPP

  2. ASPP

  3. RFB

  4. SAM

Path-aggregation blocks:

  1. FPN

  2. PAN

  3. NAS-FPN

  4. Fully-connected FPN

  5. BiFPN

  6. ASFF

  7. SFAM

  8. NAS-FPN

五、Skip-connections

  1. Residual connections

  2. Weighted residual connections

  3. Multi-input weighted residual connections

  4. Cross stage partial connections (CSP)

六、常用激活函数和loss

激活函数:

  • ReLU

  • LReLU

  • PReLU

  • ReLU6

  • Scaled Exponential Linear Unit (SELU)

  • Swish

  • hard-Swish

  • Mish

loss:

  • MSE

  • Smooth L1

  • Balanced L1

  • KL Loss

  • GHM loss

  • IoU Loss

  • Bounded IoU Loss

  • GIoU Loss

  • CIoU Loss

  • DIoU Loss

七、正则化和BN方式

正则化:

  • DropOut

  • DropPath

  • Spatial DropOut

  • DropBlock

BN:

  • Batch Normalization (BN)

  • Cross-GPU Batch Normalization (CGBN or SyncBN)

  • Filter Response Normalization (FRN)

  • Cross-Iteration Batch Normalization (CBN)

八、训练技巧

  • Label Smoothing

  • Warm Up

推荐阅读:

重磅!3DCVer-学术论文写作投稿 交流群已成立

扫码添加小助手微信,可申请加入3D视觉工坊-学术论文写作与投稿 微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。

同时也可申请加入我们的细分方向交流群,目前主要有3D视觉CV&深度学习SLAM三维重建点云后处理自动驾驶、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流等微信群,请扫描下面微信号加群,备注:”研究方向+学校/公司+昵称“,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进去相关微信群。原创投稿也请联系。

▲长按加微信群或投稿

▲长按关注公众号

3D视觉从入门到精通知识星球:针对3D视觉领域的知识点汇总、入门进阶学习路线、最新paper分享、疑问解答四个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近1000+星球成员为创造更好的AI世界共同进步,知识星球入口:

学习3D视觉核心技术,扫描查看介绍,3天内无条件退款

 圈里有高质量教程资料、可答疑解惑、助你高效解决问题

一、 智宇眼镜模拟试戴系统简介 智宇眼镜模拟试戴系统采用独特的数字图像处理技术,全球独创眼镜拍照装置及眼镜图像透明度获取理论,将人的裸眼头像与眼镜图像直接合成为一张图片。其它所有眼镜模拟试戴系统都是以flash技术为基础,在flash平台上,首先显示头像,然后在头像上叠加经过透明处理的眼镜flash文件。智宇眼镜试戴系统分为单机版和网络版。单机版适用于眼镜店,有头像拍摄、眼镜管理、顾客管理、实拍对比,框架眼镜模拟试戴,隐形眼镜模拟试戴、镜片染色、试戴眼镜款式自主添加等功能。网络版与网络结合在一起,可以通过网络向顾客提供模拟试戴服务。解决了消费者网购眼镜无法试戴的问题。 二、 智宇眼镜模拟试戴系统的优点 1) 智宇试戴系统根据眼镜图片的尺寸、眼镜真实尺寸、以及瞳距等信息,根据独创的算法实现了精确的等比例试戴。 2) 以flash为平台的眼镜模拟试戴系统能被破解,保密性不强,在系统使用之前要下载庞大的flash组件,严重影响速度。而智宇眼镜模拟试戴系统生成系统库及软件,破解难度极大,且无需加载任何额外组件,大大提升了速度。 3) .智宇眼镜模拟试戴系统将头像与眼镜合成为一张图片,与真实情况相同。而其它眼镜试戴系统将眼镜图片浮于人脸上方,极不真实。 4) 其它眼镜试戴系统需将眼镜图片处理成透明的flash文件,需利用photoshop及flash等软件进行烦琐的图像人工处理。而智宇眼镜试戴系统借助智宇自有的全球独创的拍照装置及理论,只需拍摄眼镜图片,不必进行人工处理,就能实现逼真的效果。 5) .其它眼镜试戴系统的透明度通过人工调节得到,无法100%真实还原眼镜实际透明度,也不能对细节及边缘进行处理。智宇眼镜试戴系统独创图像处理理论,自动100%还原眼镜实际透明度,且无需人工干预,对细节及边缘处理尤为出色。 6) 由于智宇眼镜模拟试戴系统采用独创的理论,使得眼镜镜片部分能实现颜色渐变,给人以立体感,与真实情况完全符合,而其它眼镜模拟试戴系统的镜片部分颜色单一,根本没有立体感,严重偏离真实。 7) .智宇眼镜模拟试戴系统采用数字图像处理技术,使镜片上色、隐形眼镜试戴、眼镜图片款式搜索功能完全可以实现。这也是智宇眼镜模拟试戴系统即将增加的全球独有的一些功能。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值