前言
计算机视觉领域的八大任务:
- 图像分类
- 目标检测
- 图像语义分割
- 场景文字识别
- 图像生成
- 人体关键点检测
- 视频分类
- 度量学习
本文分享基于深度学习的目标检测算法,以及一些好的开源代码。
目标检测算法
1、R-CNN系列
-
R-CNN
R-CNN 流程图:
要点:
- R-CNN 利用 候选区域方法 创建了约 2000 个 ROI(region of interest 感兴趣区域)
-
Fast R-CNN
Fast R-CNN 的流程图:
要点:- Fast R-CNN 把包含特征提取器、分类器和边界框回归器在内的整个网络能通过多任务损失函数进行端到端的训练。
- Fast R-CNN 的训练速度是 R-CNN 的 10 倍,推断速度是后者的 150 倍。
-
Faster R-CNN
Faster R-CNN 的流程图:
要点:- Faster R-CNN 采用与 Fast R-CNN 相同的设计
- 使用候选区域网络(RPN)代替了候选区域方法,RPN效率更高,每幅图像 10 毫秒的速度运行