![](https://img-blog.csdnimg.cn/20201014180756738.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
目标检测
文章平均质量分 82
一颗磐石
这个作者很懒,什么都没留下…
展开
-
yolov3网络(DarkNet53)结构详解以及Pytorch代码实现
目录引言网络结构讲解网络结构设计理念残差结构步长为2的卷积替换池化层网络性能评估yolo v3中Darknet-53网络基于Pytorch的代码实现总结引言yolo v3用于提取特征的backbone是Darknet-53,他借鉴了yolo v2中的网络(Darknet-19)结构,在名字上我们也可以窥出端倪。不同于Darknet-19的是,Darknet-53引入了大量的残差结构,并且使用步长为2,卷积核大小为3×3卷积层Conv2D代替池化层Maxpooling2D。通过在ImageNet上的分类表原创 2022-03-18 21:44:48 · 17869 阅读 · 4 评论 -
基于源码详解yolov3的loss【注释满满】
原创 2022-03-12 13:23:20 · 6278 阅读 · 4 评论 -
了解目标检测领域的评估指标mAP
TP:IOU>0.5的检测框数量FP:IOU<=0.5的检测框数量,也包含检测到同一GT的重复检测框数量FN:未被检测到的GT数量Precision=TP/(TP+FP)Recall=TP/(TP+FN)PR曲线:Precision-Recall曲线AP:PR曲线下的面积mAP:各类别AP的平均值...原创 2022-03-02 22:48:02 · 1260 阅读 · 0 评论 -
使用python和opencv通过边缘填充的方式在不改变图像比例的前提下resize图像到目标大小
导读最近在做一个项目,需要使用人脸关键点的坐标变化作为特征。但是发现经过前期的人脸配准、裁剪、resize预处理之后,图像由于宽高比例发生了变化,其中的人脸已经发生了扭曲变形。在这种扭曲的人脸上检测到的关键点那肯定是不准确的了,更不用谈后期的分析了。所以呢,就需要一种方法,在保证图像宽高比例不变的情况下,把目标图像resize到目标大小。我选择了边缘填充的方式,下面详细介绍一下,并附上代码以及效果,供大家使用观赏。原理没啥高科技哈哈哈,大致分为以下几步:分别计算原始图像宽、高与目标图像宽、高的比例原创 2021-07-11 18:08:37 · 6668 阅读 · 12 评论 -
理解目标检测里的Anchor-based和Anchor-free
导读目标检测模型按照anchor划分可分为两类:anchor-based、anchor-free其中,anchor-based的代表算法有:faster r-cnn、ssd、retinaNet、yolo v2、yolo v3…anchor-free的代表算法有:yolo v1、CornerNet、CenterNet…anchor based目前主流的目标检测算法多是anchor-based这一类,其中有two-stage也有one-stage。所谓的anchor是什么?说白了就是事先通过手工或聚类原创 2021-07-06 16:02:46 · 7034 阅读 · 0 评论 -
YOLO v4结构原理解析
导读YOLO v1开启了One-Stage目标检测的大门,检测速度直接甩开Two-Stage几条街,虽然精度与Two-Stage尚有差距,但随着YOLO持续不断地更新换代,通过设计性能更加出色的Backbone以及各种Tricks,现在YOLO系列的检测精度已经不输Two-Stage,并且依然保持着超快的检测速度,被业界广泛使用。目前YOLO已经更新到了第五代,但我觉得YOLO v4这篇文章是最适合大家去认真读的,因为它相当于一部目标检测的综述文章,看完之后会对现在目标检测有一个大致的框架。在计算机视觉的原创 2021-07-04 14:39:07 · 1561 阅读 · 0 评论 -
以提出背景为出发点详细解读Cascade R-CNN
Faster R-CNN结构回顾原创 2021-06-29 22:18:46 · 396 阅读 · 2 评论 -
一文带你吃透ROI Pooling和ROI Align
在Two stage的目标检测算法中,需要先提取出候选框,然后对候选框作精细分类和进一步的回归。这里存在一个问题,即提取出的候选框大小不一,而后续的分类和回归网络需要固定大小的输入。在RCNN中是直接采用了resize操作将不同大小的候选框处理为同等大小,但是这样的暴力做法会使得候选框严重变形,从而造成精度损失。到了Faster-RCNN和Mask-RCNN分别采用ROI Pooling和ROI Align完成这一操作。ROI Pooling在Faster-RCNN中,RPN提取出一系列的候选框,经过R原创 2021-06-01 22:26:39 · 723 阅读 · 0 评论 -
目标检测框架one stage和two stage
目前已提出的目标检测框架分为两类:One Stage和Two Stage,其中Two Stage框架先于One Stage被提出。下面我们分别介绍一下这两种框架,然后做一个比较。One StageOne Stage 的算法框架是在backbone提取得到的feature maps上直接预测物体的位置(x, y, w, h),物体类别,物体置信度,经过单次检测即可得到最终的检测结果。常见的有SSD、Retina-Net以及YOLO系列等。Two Stage相比较于One Stage,Two Stage原创 2021-06-01 15:15:22 · 846 阅读 · 1 评论 -
收藏 | Faster-RCNN详解 (训练过程和RPN与Fast R-CNN)
Faster-RCNN有两种训练方式:四步交替迭代训练和联合训练。本文主要讲解四步交替迭代的训练方式。Faster-RCNN主要由五部分构成:特征提取网络Backbone、RPN、ROI Pooing以及RCNN。其最大的创新点就是提出RPN替代RCNN中的Selective Search,应用卷积神经网络提取ROIs,极大地提升了检测的速度,称为实时目标检测的开山之作。笔者也会着重讲解RPN,请看下文。首先讲一下Faster-RCNN的整体网络结构和训练方式吧,搭建好框架,其余的模块理解起来便会轻松一些原创 2021-05-26 11:02:22 · 7670 阅读 · 5 评论 -
目标检测之Faster RCNN详解
导读:Faster-RCNN发表于NIPS 2015上的一篇论文《Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks》。该算法最大的创新点是提出了RPN(Region Proposal Network)网络,利用Anchor机制将区域生成与卷积网络联系到一起,将检测速度一举提升到17 FPS,而且在VOC 2012测试集上实现了70.4%的检测效果,在当时可谓是以一己之力将目标检测推向了实时的高潮。后面原创 2021-04-13 10:30:36 · 8026 阅读 · 0 评论 -
目标检测之SSD详解
SSD介绍SSD(Single Shot Multibox Detector)是一种单阶多层的目标检测模型,因为SSD只进行了一次框的预测与损失计算,因此属于One-Stage范畴里的一种主流框架,目前仍被广泛应用。SSD从多个角度对目标检测做出了创新,结合了Faster-RCNN和YOLO各自的优点,使得目标检测的速度相比Faster-RCNN有了很大的提升,同时检测精度也与Faster-RCNN不相上下。SSD的创新点和优缺点SSD创新性地在多个不同深度的特征图上进行PriorBox生成、分类、原创 2021-04-06 20:49:28 · 7185 阅读 · 0 评论