一、目标检测与图像分类
1. 图像分类
图中有一只狗,将其识别出来即可,不关心其他内容!
2. 目标检测
目标检测要求对图像中的目标类别进行识别,同时,对目标进行定位。
- 识别图像中多个物体的类别和位置。
- 位置通常用边缘框来表示。
(1)边缘框——bounding box
边缘框通过4个数字定义,即左上x,左上y和右下x,右下y;或者 左上x,左上y和宽,高;
(2)边缘框的实现
定义box_corner_to_center()或者box_center_to_corner()函数;
第一个是从左上、右下转换到中间、宽度和高度;
第二个是从中间、宽度和高度转换到左上、右下
(3)数据集
(4)双阶段(Two-stage)&单阶段(One-stage)
双阶段:第一级网络用于候选区域提取,第二级网络对提取的候选区域进行分类和精确坐标回归;以RCNN系列为主要代表。
单阶段:摒弃了候选区域提取这一步,只用一级网络就完成了分类和回归两个任务;以YOLO和SSD为主要代表。
二、牛仔装备检测
1. 任务
三、YOLO V4
1. 摘要
(1)通用的技巧
- 残差连接&加权残差连接(Weighted-Residual-Connections, WRC)
- 跨阶段部分连接(Cross-stage-partial-connections, CSP)
- 跨迷你批量归一化(Cross mini-batch Normalization, CmBN)
- 自对抗训练(Self-adversarial-training, SAT)
- Mish激活函数(Mish-activation)
(2)上述之外,新添加的技巧
- 马赛克数据增广
- DropBlock归一化
- CIoU损失
2. 简介
- 这是一个强大的目标检测器,而且能够解决低端显卡算力不足的问题,只需要1080Ti级别的显卡即可训练。