faster rcnn论文_目标检测论文及解读汇总

17fa1b8a8430698d6204d04dc441e3ec.png
本文结构:
0 前言
1 论文经常提及的几个知识点
2 最新论文
3 one-stage detectors
4 two-stage detectors
5 其他

0.前言

目标检测算法盘点

机器之心:从RCNN到SSD,这应该是最全的一份目标检测算法盘点​zhuanlan.zhihu.com
6b8702f9228bdd84765275ba0bcf17a4.png
先上三张图直观感受一下目标检测算法在准确度(AP)和速度(speed)的对比

fd7e96de7f33a46921a2a9e2956c2b08.png

e6b938ef81981b0e9d0af80ef7c15573.png

e9d19b7098e1e2dc6a18755088571477.png

1.论文经常提及的几个知识点

  • 评价指标AP(mAP)
最完整的检测模型评估指标mAP计算指南(附代码)在这里!_慕课手记​www.imooc.com
847847cd96072d585b19cb09fdefb953.png
https://github.com/rafaelpadilla/Object-Detection-Metrics#create-the-ground-truth-files​github.com
  • 边框回归(Bounding Box Regression)
边框回归(Bounding Box Regression)详解​blog.csdn.net
363a6f5f0bf31d704f33c77fb78f9167.png
  • 非极大值抑制(non maximum suppression)
NMS--非极大值抑制 - shuzfan的专栏 - CSDN博客​blog.csdn.net
ccff43a7ba248ec14ed12473c5966e20.png
  • OHEM(Training Region-based Object Detectors with Online Hard Example Mining)

论文地址:https://arxiv.org/pdf/1604.03540.pdf

论文解读:

论文笔记 OHEM: Training Region-based Object Detectors with Online Hard Example Mining​blog.csdn.net
31ac564aac30fbc42610241c42e616c8.png
OHEM算法及Caffe代码详解 - AI之路 - CSDN博客​blog.csdn.net
7e3e9bb200826e58e1d00f56ada49365.png
  • RPN(Region Proposal Network)
RPN 解析 - lanran2的博客 - CSDN博客​blog.csdn.net
b7ee7ea51e413394bf1ea9edfa3fb1f3.png

2.最新论文

CVPR2018 目标检测(object detection)算法总览​blog.csdn.net
d5538e23a05b456472194fa573c964dc.png
ECCV2018目标检测(object detection)算法总览​blog.csdn.net
17376af913fbbe1f4a4f149d442e34ac.png

3.one-stage detectors

  • SSD(Single Shot MultiBox Detector)

论文地址:https://arxiv.org/pdf/1512.02325.pdf

论文解读:

我是小将:目标检测|SSD原理与实现​zhuanlan.zhihu.com
dc7bc28b061fa31a0515a013aa48d81a.png

SSD: Single Shot MultiBox Detector翻译(包括正式版和预印版)(对原文作部分理解性修改)

方良骥:SSD 系列论文总结​zhuanlan.zhihu.com
  • YOLO(You only look once)

论文地址:

You Only Look Once: Unified, Real-Time Object Detection

YOLO9000: Better, Faster, Stronger

YOLOv3: An Incremental Improvement

代码地址:

keras版本:qqwweee/keras-yolo3

论文解读:

YOLO(You Only Look Once)算法详解​blog.csdn.net
37d3c0325b381e40452bf11f6f6788e9.png
我是小将:目标检测|YOLO原理与实现​zhuanlan.zhihu.com
1303aa58af8e0b6007b30cae806399e9.png
YOLO v2算法详解 - AI之路 - CSDN博客​blog.csdn.net
9e06f8beacc889908c74b0d1aadc4fc2.png
我是小将:目标检测|YOLOv2原理与实现(附YOLOv3)​zhuanlan.zhihu.com
a6b027174e8d928767b48a59b81cccb6.png
YOLO v3算法笔记 - AI之路 - CSDN博客​blog.csdn.net
528f3d64705c80a25642c7952fb38a1c.png
YOLOv3: 训练自己的数据 - 点滴记录 - CSDN博客​blog.csdn.net
1e2d0dc4b4bb7530ba7b9c824100fcd2.png
yolo系列之yolo v3【深度解析】​blog.csdn.net
fd0242acdcc0196f02d43bf62deb6614.png

keras源码解读:

探索 YOLO v3 源码 - 第1篇 训练​juejin.im 探索 YOLO v3 实现细节 - 第2篇 模型​juejin.im 探索 YOLO v3 实现细节 - 第3篇 网络​juejin.im 探索 YOLO v3 实现细节 - 第4篇 数据和y_true​juejin.im 探索 YOLO v3 实现细节 - 第5篇 Loss​juejin.im 探索 YOLO v3 实现细节 - 第6篇 预测 (完结)​juejin.im
  • RetinaNet(Focal Loss for Dense Object Detection)

论文地址:https://arxiv.org/pdf/1708.02002.pdf

论文解读:

论文阅读: RetinaNet - Online Notes - CSDN博客​blog.csdn.net
32f166830f212a29cb37b116729ec562.png
Focal Loss - AI之路 - CSDN博客​blog.csdn.net
88abdf0464689111bac78c0ece012535.png
  • CornerNet
陈泰红:CornerNet:目标检测算法新思路​zhuanlan.zhihu.com
https://blog.csdn.net/u014380165/article/details/83032273​blog.csdn.net
  • CenterNet
OLDPAN:扔掉anchor!真正的CenterNet——Objects as Points论文解读​zhuanlan.zhihu.com
2f0bd12f226d90ba7054a8cc9d8918f3.png

4.two-stage detectors

  • R-CNN(Region-based Convolutional Neural Networks)

论文地址:rbgirshick/rcnn

  • Fast R-CNN

论文地址:https://arxiv.org/pdf/1504.08083.pdf

  • Faster R-CNN(Towards Real-Time Object Detection with Region Proposal Networks)

论文地址:https://arxiv.org/pdf/1506.01497.pdf

论文解读:

Object Detection and Classification using R-CNNs​www.telesens.co
7df0150ef4c08106f91cb28b335f4021.png
白裳:一文读懂Faster RCNN​zhuanlan.zhihu.com
c74600c0a7b4b3bb42bcc9273c13956e.png
  • Mask-RCNN

论文地址:https://arxiv.org/pdf/1703.06870.pdf

论文解读:

Mask-RCNN技术解析 - 跟随技术的脚步-linolzhang的专栏 - CSDN博客​blog.csdn.net
4fff11ec24a4dd50ac9740bbdf908cfe.png
Mask RCNN笔记 - 生如蚁,美如神 - CSDN博客​blog.csdn.net
cae460d4cb024bc4601ca7324f2ab5b4.png
  • Cascade RCNN
https://blog.csdn.net/u014380165/article/details/80602027​blog.csdn.net
  • TridentNet
Naiyan Wang:TridentNet:处理目标检测中尺度变化新思路​zhuanlan.zhihu.com

5.其他

  • FPN(Feature Pyramid Networks for Object Detection)

论文地址:https://arxiv.org/pdf/1612.03144.pdf

论文解读:

FPN(feature pyramid networks)算法讲解​blog.csdn.net
3be08c1f6e8d71920d5437490b334da6.png
  • FCN(Fully Convolutional Networks for Semantic Segmentation)

论文地址:https://arxiv.org/pdf/1411.4038.pdf

论文解读:

全卷积网络 FCN 详解 - 代码学习者coding - 博客园​www.cnblogs.com
f996842bbcf7c80337279b5fc38c1f8c.png
在 PyTorch 中使用 `faster_rcnn_resnet50_fpn` 模型,可以按照以下步骤进行: 1. 安装 PyTorch 和 TorchVision 库(如果未安装的话)。 2. 导入必要的库和模块: ```python import torch import torchvision from torchvision.models.detection.faster_rcnn import FastRCNNPredictor ``` 3. 加载预训练模型 `faster_rcnn_resnet50_fpn`: ```python model = torchvision.models.detection.fasterrcnn_resnet50_fpn(pretrained=True) ``` 4. 修改模型的分类器,将其调整为适合你的任务。由于 `faster_rcnn_resnet50_fpn` 是一个目标检测模型,它的分类器通常是用来检测物体类别的。如果你的任务不需要检测物体类别,可以将分类器替换为一个只有一个输出的线性层: ```python num_classes = 1 # 只检测一个类别 in_features = model.roi_heads.box_predictor.cls_score.in_features model.roi_heads.box_predictor = FastRCNNPredictor(in_features, num_classes) ``` 5. 将模型转换为训练模式,并将其移动到所选设备(如GPU)上: ```python device = torch.device('cuda') if torch.cuda.is_available() else torch.device('cpu') model.to(device) model.train() # 转换为训练模式 ``` 6. 训练模型,可以使用自己的数据集来训练模型,或者使用 TorchVision 中的数据集,如 Coco 或 Pascal VOC 数据集。 7. 在测试阶段,可以使用以下代码来检测图像中的物体: ```python # 定义图像 image = Image.open('test.jpg') # 转换为Tensor,并将其移动到设备上 image_tensor = torchvision.transforms.functional.to_tensor(image) image_tensor = image_tensor.to(device) # 执行推理 model.eval() with torch.no_grad(): outputs = model([image_tensor]) # 处理输出 boxes = outputs[0]['boxes'].cpu().numpy() # 物体框 scores = outputs[0]['scores'].cpu().numpy() # 物体分数 ``` 需要注意的是,`faster_rcnn_resnet50_fpn` 是一个较大的模型,需要较高的计算资源和训练时间。在训练和测试时,建议使用GPU来加速计算。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值