目标检测
文章平均质量分 61
Rocky Ding*
全网同名Rocky Ding,AIGCmagic社区创始人,自媒体WeThinkIn主理人,AIGC算法专家,持续分享AI行业前沿资讯、干货经验以及深度思考,欢迎社招/校招/实习面试咨询。
展开
-
深度学习_目标检测_SPP(Spatial Pyramid Pooling)详解
目标检测中的SPP模块详解(全网最详细)原创 2022-08-20 19:00:13 · 3755 阅读 · 0 评论 -
深度学习_目标检测_mAP@.5:.95的含义
mAP@[.5:.95](表示为mAP@[.5,.95])表示在不同IoU阈值(从0.5到0.95,步长0.05)(0.5、0.55、0.6、0.65、0.7、0.75、0.8、0.85、0.9、0.95)上的平均mAP。原创 2020-07-29 14:13:34 · 8941 阅读 · 0 评论 -
深度学习_目标检测_边框回归(Bounding Box Regression)详解
为什么要边框回归?对于上图,绿色的框表示Ground Truth,红色的框为Selective Search提取的Region Proposal。那么即便红色的框被分类器识别为飞机,但是由于红色的框定位不准(IOU < 0.5),那么这张图相当于没有正确的检测出飞机。如果我们能对红色框进行微调,使得经过微调后的框跟Ground Truth更接近,这样岂不是定位会更准确。而Bounding-Box Regression就是用来微调这个框的。边框回归是什么?对于框一般使用四维向量(x,y,w,h转载 2020-07-28 11:37:23 · 3227 阅读 · 1 评论 -
深度学习_目标检测_Soft-MNS详解
Soft-NMS论文链接Soft-NMS介绍针对原始NMS过于hard的问题,论文中提出了Soft-NMS进行解决。那原始的NMS有什么问题呢?我们先看下面的图:在上图中,检测算法本来应该输出两个框,但是原始的NMS算法可能会把score较低的绿框过滤掉(如果绿框和红框的IOU大于设定的阈值就会被过滤掉),导致只检测出一个object(一个马),显然这样object的recall就比较低了。而Soft-NMS比起原始NMS将bbox的得分置零,使用稍低一点的分数代替原有的分数。另外由于Sof原创 2020-07-27 10:52:50 · 760 阅读 · 0 评论 -
深度学习_目标检测_YOLOv1,v2,v3,v4,v5,v6,v7全系列详解(持续更新)
YOLO系列+Stable Diffusion系列模型,全方位解析。原创 2020-07-08 10:33:42 · 62126 阅读 · 9 评论 -
深度学习_目标检测_FPN论文详解
FPN论文详解原创 2020-07-07 10:29:57 · 1382 阅读 · 0 评论 -
深度学习_目标检测_Focal Loss详解
Focal Loss本质Focal Loss本质上解决了分类问题中类别不均衡、分类难度差异的一个损失函数,使得训练更加聚焦在困难样本上。Focal Loss的发展演化Focal Loss是从二分类问题出发,同样的思想可以迁移到多分类问题上。标准交叉熵我们知道二分类问题的标准loss是交叉熵:对于二分类问题我们也几乎适用sigmoid激活函数y^=σ(x)\hat{y} = \sigma(x)y^=σ(x),所以上面的式子可以转化成:这里有1−σ(x)=σ(−x)1 - \sigma(x)原创 2020-06-21 17:24:02 · 975 阅读 · 0 评论 -
深度学习_目标检测_YOLOv5训练Pascal VOC格式的数据集教程
1.搭建环境要求Python版本>=3.7,PyTorch版本>=1.5。并且安装需要的库源:pip install -U -r requirements.txt2.开始准备Pascal VOC格式的数据上图是Pascal VOC格式数据集的标准格式。为了应对YOLOv5的darknet格式 ,我们使用如下代码生成labels标签文件(为了狄简单期间,我们对train和test标签进行生成):import xml.etree.ElementTree as ETimport p原创 2020-06-19 19:25:42 · 8042 阅读 · 22 评论 -
深度学习_目标检测_Pascal VOC数据集介绍
1.JPEGImages主要提供的是Pascal VOC所提供的所有的图片信息,包括训练图片和测试图片。这些图片就是用来进行训练和测试验证的图像数据。2.Annotations主要存放XML格式的标签文件,每个XML对应JPEGImage中的一张图片。<annotation> <folder>VOC2012</folder> <filename>2007_000392.jp原创 2020-06-19 10:32:13 · 408 阅读 · 0 评论 -
深度学习_目标检测_YOLOv4论文详解(持续更新)
YOLOv4全网最详细解析原创 2020-05-24 19:56:48 · 10509 阅读 · 0 评论 -
深度学习_目标检测_非极大值抑制(NMS)以及其Python代码(带注释)
import numpy as npdef py_cpu_nms(dets, thresh): x1 = dets[:, 0] y1 = dets[:, 1] x2 = dets[:, 2] y2 = dets[:, 3] scores = dets[:, 4] areas = (x2 - x1 + 1) * (y2 - y1 + 1) order = scores.argso...原创 2020-04-24 15:55:46 · 436 阅读 · 0 评论 -
深度学习_目标检测_IOU(交并比)Python实现
在图像里,目标检测是其中一个领域,最著名的是以矩形框作为目标检测区域,在图像中表达一个矩形框需要有坐标(top,left,bottom,right),即左上角坐标,右下角坐标。从而可以在给定的两个矩形中计算IOU值(交并比),小数点可以四舍五入保留4位。例如输入:(661,27,679,47)(662,27,682,47)接下来我们用Python来进行编程:def compute_iou...原创 2020-04-04 15:08:30 · 628 阅读 · 0 评论 -
深度学习_目标检测_Faster R-CNN论文详解
Faster R-CNN论文地址Faster R-CNN的创新点设计Region Proposal Networks【RPN】,利用卷积操作后的特征图生成region proposals,代替了Selective Search、EdgeBoxes等方法,速度上提升明显。训练Region Proposal Networks与检测网络【Fast R-CNN】共享卷积层,大幅提高网络的检测速度。...转载 2020-03-10 20:58:20 · 572 阅读 · 0 评论 -
深度学习_目标检测_Fast R-CNN详解
论文地址:Fast R-CNNFast R-CNN创新点规避R-CNN中冗余的特征提取操作,只对整张图像全区域进行一次特征提取。用RoI pooling层取代最后一层max pooling层,同时引入建议框信息,提取相应建议框特征。Fast R-CNN网络末尾采用并行的不同的全连接层,可同时输出分类结果和窗口回归结果,实现了end-to-end的多任务训练【建议框提取除外】,也不需要额外...转载 2020-03-08 20:24:48 · 516 阅读 · 0 评论 -
深度学习_目标检测_R-CNN详解
论文地址:Rich feature hierarchies for accurate object detection and semantic segmentationR-CNN创新点采用CNN网络提取图像特征,从经验驱动的人造特征范式HOG、SIFT到数据驱动的表示学习范式,提高特征对样本的表示能力。采用大样本下有监督预训练+小样本微调的方式解决小样本难以训练甚至过拟合等问题。促使...转载 2020-03-01 12:03:45 · 657 阅读 · 0 评论 -
深度学习_目标检测_R-CNN系列网络
一.R-CNNR-CNN有哪些创新点:使用CNN(ConvNet)对region proposals计算 feature vectors。从经验驱动特征(SIFT、HOG)到数据驱动特征(CNN feature map),提高特征对样本的表示能力。采用大样本下有监督预训练模型和小样本微调(fine-tuning)的方法解决了小样本难以训练甚至过拟合等问题。R-CNN介绍:R-CNN作...原创 2019-11-26 00:40:02 · 1178 阅读 · 0 评论