![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
目标检测
文章平均质量分 74
点PY
If you cannot risk, you cannot grow. If you cannot grow, you cannot become you best. If you cannot become you best, you cannot be happy. If you cannot be happy, what else matters?
展开
-
超大尺寸图像的深度学习模型预测方法
文章目录小尺寸图像输入大尺寸图像输入小尺寸图像输入一般的图像无需裁剪,便可输入模型,进行端到端的训练。它的预测过程也是比较简单的,以二分类为例,将模型输出的概率图通过一定的方法转化为二值图。有两种方法可实现上述过程,其一,若类别数包括背景类,利用argmax输出各维度相同位置处最大值,其二,若类别数不包括背景类,则利用sigmoid压缩其值至0-1之间,利用阈值法,一般为0.5,大于0.5为正类,小于0.5为背景类。net = torch.load('./model.pth', map_locatio原创 2020-06-16 16:05:26 · 3931 阅读 · 7 评论 -
Yolov5的类激活图
这是https://github.com/jacobgil/pytorch-grad-cam/blob/master/tutorials/Class Activation Maps for Object Detection With Faster RCNN.ipynb 中 适用于 YOLO5的教程的简单得多的版本。YOLO5 中的最后一层输出检测结果,因此我们将使用它之前的一层。如果我们要使用另一种方法,如 AblationCAM,我们将需要它,然后您可以查看上面的 faster-rcnn 教程。原创 2022-11-23 12:00:28 · 1205 阅读 · 0 评论 -
目标检测论文、代码、数据集汇总
检测小物体和现场较远处的物体是监视应用中的一个主要挑战。这些物体由图像中少量的像素表示,缺乏足够的细节,使得传统的探测器难以检测。在这项工作中,提出了一个名为切片辅助超推理(SAHI)的开源框架,该框架为小对象检测提供了一个通用的切片辅助推理和微调管道。所提出的技术是通用的,因为它可以应用在任何可用的对象检测器之上,而不需要进行任何微调。原创 2022-10-17 10:32:20 · 6168 阅读 · 1 评论 -
利用YOLOX训练自己的数据集
文章目录准备数据集数据格式转换数据集划分超参设置开始训练TensorRT加速准备数据集ACO是一个用于垃圾检测的图像数据集,包含从热带海滩到伦敦街头在不同环境下拍摄的垃圾的照片,共有1500张图像,4784个box2Db标注。垃圾类别:‘Aluminium foil’, ‘Battery’, ‘Aluminium blister pack’, ‘Carded blister pack’, ‘Other plastic bottle’, ‘Clear plastic bottle’, ‘Glass原创 2022-01-11 11:57:31 · 1430 阅读 · 0 评论 -
YOLOX论文简读
paper: https://arxiv.org/abs/2107.08430code: https://github.com/Megvii-BaseDetection/YOLOX本文是旷视科技在目标检测方面的最新技术总结,同时也是CVPR2021自动驾驶竞赛冠军方案的技术总结。本文将近两年来目标检测领域的各个角度的优秀进展与YOLO进行了巧妙地集成组合(比如解耦头、数据增广、标签分配、Anchor-free机制等)得到了YOLOX,性能取得了大幅地提升,同时仍保持了YOLO系列一贯地高效推理。此.原创 2022-01-10 17:31:57 · 509 阅读 · 0 评论 -
Clustered Object Detection in Aerial Images论文简读
code: https://github.com/fyangneil/Clustered-Object-Detection-in-Aerial-Image文章目录背景介绍网络结构总体框架Cluster Region ExtractionFine Detection on Cluster ChipFusion Operation背景介绍看到下面这张图片,可以发现图片的像素很高,像行人这样的目标在图片中所占像素又小,使其很难与周围的背景分开,并且目标比较分散、分布不均匀,这就是航拍图像的目标检测所面临的.原创 2021-12-08 23:11:48 · 333 阅读 · 0 评论 -
Tiny Object Detection in Aerial Images论文简读
code: https://github.com/jwwangchn/AI-TOD文章目录摘要论文的贡献摘要近年来,地球视觉中的目标探测取得了很大的进展。然而,航空图像中的微小物体检测仍然是一个非常具有挑战性的问题,因为微小物体包含的像素很小,很容易与背景混淆。为了推进航空图像中的微小物体检测研究,我们提出了一种新的航空图像中的微小物体检测数据集(AI-TOD)。具体来说,AI-TOD为280,36张航空图像的8个类别提供了700,621个物体实例。与现有的航空图像目标检测数据集相比,AI-TOD目.原创 2021-12-08 11:02:26 · 2181 阅读 · 2 评论 -
Dual Shot Face Detector论文简读
code: https://github.com/hukkelas/DSFD-Pytorch-Inference, https://github.com/Tencent/FaceDetection-DSFD文章目录摘要论文的贡献摘要在本文中,我们提出了一种新的人脸检测网络,分别解决了人脸检测的三个关键方面,包括更好的特征学习、渐进式损失设计和基于锚定分配的数据增强。首先,我们提出了一个特征增强模块(FEM)来增强原始特征图,将单镜头探测器扩展到双镜头探测器。其次,我们采用由两组不同的锚计算的渐进锚损失原创 2021-09-06 17:46:42 · 192 阅读 · 0 评论 -
为植物病害对象检测引入改进的 PlantDoc 数据集
文章目录背景PlantDoc 数据集简介将 PlantDoc 添加到 Roboflow 公共数据集PlantDoc 的用例数据集地址背景到 2050 年,世界人口预计将达到 97 亿。这是一张大嘴。技术正在推动下一代产量增长。计算机视觉对于更环保、更高效的生产尤其重要。例如,Blue River (John Deere) 的“See & Spray ”使机器能够实时进行杂草检测,使用的除草剂减少 90%,同时更有效地针对有问题的杂草。但农业中的计算机视觉才刚刚开始——更多的开源数据是提高其原创 2021-08-23 15:18:02 · 2556 阅读 · 5 评论 -
关于目标检测样本集中负样本的引入方法
前言在目标检测推理过程中,经常出现误检的情况。将误检的目标引入样本集中,会大幅降低误检率。思路找出误检的目标,并将其裁成切片;将负样本切片粘贴到原先的样本集中。原样本切片引入负样本后的切片代码small_objects_paste.pyimport aug as amimport globimport randomimport osfrom shp2imagexy import shp2imagexydef mkdir(path): if not os.pa原创 2021-04-08 09:32:43 · 1808 阅读 · 3 评论 -
CenterNet2
code:https://github.com/xingyizhou/CenterNet2文章目录1.概要2.相关工作2.1 One-Stage Detectors2.2 Two-Stage Detectors2.3 Anchor Free && DETRTwo-Stage检测的概率解释4 检测器的选择4.1 RetinaNet4.2 CenterNet4.3 ATSS4.4 GFL5.实验5.1 基础Two-Stage模型实验5.2 Real-Time模型实验5.3 SOTA模型对比1原创 2021-03-22 16:32:11 · 4825 阅读 · 6 评论 -
目标检测标签格式转换(水平框)
JSON转YOLOV5import jsonimport osimport globimport cv2def mkdir(path): if not os.path.exists(path): os.mkdir(path)def convert(size, box): dw = 1. / (size[0]) dh = 1. / (size[1]) x = (box[0] + box[1]) / 2.0 - 1 y = (box[2]原创 2021-03-02 17:06:29 · 517 阅读 · 1 评论 -
目标检测数据集(遥感)
文章目录1.D O T A2.UCAS-AOD3.NWPU VHR-104. RSOD-Dataset5. TGRS-HRRSD-Dataset6.TAS7.DIOR8. xView9. HRSC201610.VEDAI11.Cars Overhead With Context(COWC)12.ITCVD13.OpenSAR14.DLR 3K Vehicle15.SZTAKI‐INRIA16.LEVIR17.SSDD18.SSDD+19.AIR-SARShip-1.020.SAR-ship-Dataset2原创 2021-02-02 10:01:31 · 7180 阅读 · 2 评论 -
RuntimeError: CUDA error: device-side assert triggered(目标检测)
我的问题是,在对图像进行letterbox之后,没有对边界框进行检查,可能存在某些框的角点坐标越界的情况原创 2020-11-10 10:54:37 · 227 阅读 · 0 评论 -
OBB目标检测的IOU计算
文章目录1. 基于opencv1. 基于opencv检测框格式:cx, cy, w, h, a.def iou_rotate_calculate(boxes1, boxes2):# print("####boxes2:", boxes1.shape)# print("####boxes2:", boxes2.shape) area1 = boxes1[2] * boxes1[3] area2 = boxes2[2] * boxes2[3] r1 = ((boxe原创 2020-11-04 14:13:07 · 641 阅读 · 0 评论 -
基于arcgis的遥感影像标签制作(目标检测)
文章目录1. 在arcgis中新建线矢量2. 检测框绘制1. 在arcgis中新建线矢量新建线矢量,添加空间参考,例如wgs_1984。2. 检测框绘制原创 2020-10-30 15:18:54 · 3886 阅读 · 4 评论 -
目标检测trick汇总
文章目录1. letterbox1. letterbox当数据集存在许多矩形的图片时,为了便于模型训练,需要统一尺寸,若是暴力resize,会失去图像中的比例信息。letterbox会较好的解决这个问题。def letterbox(img, new_shape, color=(114, 114, 114), auto=False, scaleFill=False, scaleup=True): # Resize image to a 32-pixel-multiple rectangle h原创 2020-10-29 10:34:39 · 553 阅读 · 0 评论 -
目标检测标签格式转换(kitti数据集格式转四坐标)
ef rotatePoint(xc, yc, xp, yp, theta): xoff = xp - xc yoff = yp - yc cosTheta = math.cos(theta) sinTheta = math.sin(theta) pResx = cosTheta * xoff + sinTheta * yoff pResy = - sinTheta * xoff + cosTheta * yoff return xc + p原创 2020-10-24 09:14:03 · 893 阅读 · 0 评论 -
OBB目标检测精度评价
文章目录前言安装DOTA_devkit精度评价代码代码中相关路径参数解析效果展示前言最近接触OBB目标检测比较多,这篇博文简单记录下OBB的精度评价方法。该精度评价方法是基于DOTA_devkit开发的。安装DOTA_devkit参考https://github.com/CAPTAIN-WHU/DOTA_devkit精度评价代码import osimport globimport numpy as npimport polyiouimport matplotlib.pyplot as p原创 2020-10-22 16:34:40 · 1656 阅读 · 1 评论 -
目标检测之目标框损失函数汇总
文章目录前言1. L1 loss&L2 lossL1 LossL2 Loss缺点2. Smooth L1 LossSmooth L1 Loss缺点3. IOU LossIOU loss4. GIoU LossIoU Loss的不足GIoU Loss5. DIoU Loss & CIoU LossGIoU Loss 的不足DIoU LossCIoU Loss前言目标检测任务的损失函数由分类损失和边界框回归损失组成,这部分主要介绍边界框回归损失方法部分,主要涉及 Smooth L1 Loss原创 2020-09-29 14:16:24 · 1908 阅读 · 0 评论 -
基于dota的目标检测(旋转框)paper汇总
文章目录DOTA数据集2020DOTA数据集2020Gliding vertex on the horizontal bounding box for multi-oriented object detectionbest_map为75.02%Oriented Object Detection in Aerial Images with Box Boundary-Aware Vectorsbest_map为75.36%原创 2020-09-27 10:25:30 · 1353 阅读 · 0 评论 -
目标检测旋转框格式转换
文章目录概要数据说明概要本篇博文将对目标检测旋转框格式转换做简单介绍,从带角度的旋转框转为四个焦点的旋转框。数据说明所使用的数据集为HRSC2016。该数据为舰船数据集。原创 2020-09-26 11:21:08 · 2708 阅读 · 8 评论 -
目标检测之小物体增强(旋转框)
文章目录简介增强效果预览数据准备代码简介前段时间介绍了,基于水平框的小目标增强技术,感兴趣的点击这里。这段时间,接触了旋转框的目标检测,本篇博文将旋转框与该项技术结合起来。增强效果预览数据准备DOTA下载txt格式预览代码dota_utils.pyimport sysimport codecsimport numpy as npimport shapely.geometry as shgeoimport osimport reimport math# import pol原创 2020-09-24 14:31:09 · 2283 阅读 · 6 评论 -
BBAVectors-Oriented-Object-Detection(Anchor-free)
文章目录摘要1. 介绍2. 方法2.1 结构2.2 热图2.3 中心点的偏移2.4 包围框的参数2.5 方向3. 实验3.1 和其他模型的对比3.2 消融实验3.3 和baseline的对比3.4 在DOTA数据上的结果可视化paper: https://arxiv.org/abs/2008.07043code: https://github.com/yijingru/BBAVectors-Oriented-Object-Detection摘要这是一篇有方向的物体检测的文章。当前的有方向物体检测往往原创 2020-09-23 17:23:59 · 1248 阅读 · 8 评论 -
基于大遥感影像场景的目标检测数据集的裁剪方法(旋转框)
文章目录前言方法介绍参考前言之前简单介绍了水平框的裁剪方法,感兴趣的点击这里。这篇博文将介绍旋转框的裁剪方法。方法介绍使用DOTA_devkit工具包中的imageSplit.py。 # example usage of ImgSplit split = splitbase(r'example', r'examplesplit') split.splitdata(1)example中的文件路径格式裁剪效果参考https原创 2020-09-23 14:28:25 · 1676 阅读 · 1 评论 -
基于大幅遥感图像的目标检测划框预测过程(水平框)
前言在遥感影像场景中,我们所面对的数据的尺寸大多都是成千上万像素的,这大大超出了目前显卡所能承受的范围。因此这篇博文将简单介绍下如何在大幅遥感影像中进行目标检测。划框预测简单描述下预测的过程:设置划框的大小a,划框之间的重叠度b;计算框的移动长度c,c=a-b;对原图像进行两次镜像延展,第一次延展的长度为能够包含原图像的c的最大整数倍与原图像size的差值,第二次延展为重叠度b;按照从左往右,从上到下的顺序进行划框预测,步长为c;汇总所有的box,label,score,进行非极大值抑制原创 2020-09-16 12:22:40 · 1755 阅读 · 2 评论 -
基于大遥感影像场景的目标检测数据集的裁剪方法(水平框)
文章目录前言代码前言在遥感影像场景下,图像的长宽少则几千×几千,多则几万×几万,不进行裁剪操作的话,无法进行目标检测模型训练。相比于语义分割任务的图像裁剪,目标检测任务的难点在于检测框的判定。下图是一个4000多×4000多的遥感影像。代码"""对原始遥感图像训练数据进行裁切,生成固定大小的patches,适用于HBB(Horizontal Bounding Box)"""import cv2import osimport sysimport numpy as npimport g原创 2020-09-11 15:02:24 · 3507 阅读 · 16 评论 -
目标检测之测试时间增强(TTA)
TTA简单说明:augment: 对图像进行TTA操作;batch_augment:对一批图像进行TTA操作;deaugment_boxes: 对预测框进行TTA操作,该操作与输入图像相反。class BaseWheatTTA: """ author: @shonenkov """ image_size = 512 def augment(self, image): raise NotImplementedError def batch_原创 2020-09-10 13:34:04 · 3113 阅读 · 0 评论 -
目标检测之letterbox
前言深度学习模型输入图片的尺寸为正方形,而数据集中的图片一般为长方形,粗暴的resize会使得图片失真,采用letterbox可以较好的解决这个问题。该方法可以保持图片的长宽比例,剩下的部分采用灰色填充。代码import cv2import numpy as npimport xml.etree.ElementTree as ETclass_dict = {'aircraft': 1}def letterbox(img, new_shape=(640, 640), color=(114原创 2020-09-09 17:17:17 · 17429 阅读 · 10 评论 -
目标检测之小物体增强(水平框)
文章目录简介增强步骤建立小物体样本库贴图paper:https://arxiv.org/pdf/1902.07296.pdfcode:https://github.com/gmayday1997/SmallObjectAugmentation简介本文主要分析MS COCO数据集,以及Mask RCNN在这个数据集上的目标识别、分割性能表现,发现模型对于很小的目标性能较差,而通过这篇文章的做法,可以把小尺度的目标识别精度、分割精度分别提高7.1%以及9.7%。原图增强后增强步骤建立小物体样原创 2020-09-09 15:51:41 · 1331 阅读 · 8 评论 -
efficientDet实战
文章目录前言基于遥感影像的操场检测dataset3.pyconfig.pyconfig_eval.pypaper: https://arxiv.org/abs/1911.09070code: https://github.com/SonwYang/efficientdet前言谷歌大脑团队的研究者发现,EfficientNets 的效率超过之前常用的主干网络。于是研究者将 EfficientNet 主干网络和 BiFPN、复合缩放结合起来,开发出新型目标检测器 EfficientDet,其准确率优于之原创 2020-09-07 16:30:29 · 564 阅读 · 10 评论 -
目标检测中的数据增强方法
文章目录CutmixMixupCutmix def load_cutmix_image_and_boxes(self, index, imsize=1024): """ This implementation of cutmix author: https://www.kaggle.com/nvnnghia Refactoring and adaptation: https://www.kaggle.com/shonenkov ""原创 2020-09-02 15:46:40 · 1161 阅读 · 0 评论 -
目标检测数据集(入门级)
公共血细胞检测数据集:https://public.roboflow.ai/object-detection/bccd预览支持的数据格式原创 2020-08-31 09:09:52 · 1183 阅读 · 0 评论 -
Weighted Boxes Fusion
paper:https://arxiv.org/pdf/1910.13302.pdfcode: https://github.com/ZFTurbo/Weighted-Boxes-Fusion前言我们了解NMS及其soft-NMS。但在这篇博文将简单介绍下WBF(加权框融合),该方法在开放图像数据集中取得了较大的提高。WBF的优势NMS和soft-NMS都排除了一些框,但是WBF利用了所有框的信息。它可以解决某些情况下,模型预测的框不准确。NMS将只能留下一个不准确的框,而WBF将使用来自3个框原创 2020-08-24 18:03:04 · 2787 阅读 · 0 评论 -
CenterNet: object as points分析
文章目录前言网络结构数据加载器损失函数目标中心的损失目标中心的偏置损失目标大小的损失Reference前言anchor-free目标检测属于anchor-free系列的目标检测,相比于CornerNet做出了改进,使得检测速度和精度相比于one-stage和two-stage的框架都有不小的提高,尤其是与YOLOv3作比较,在相同速度的条件下,CenterNet的精度比YOLOv3提高了4个左右的点。CenterNet不仅可以用于目标检测,还可以用于其他的一些任务,如肢体识别或者3D目标检测等等,但这原创 2020-06-27 22:49:22 · 987 阅读 · 0 评论 -
非极大值抑制(Non-Maximum Suppression, NMS)
1. What非极大值抑制,简称为NMS算法,英文为Non-Maximum Suppression。其思想是搜素局部最大值,抑制极大值。NMS算法在不同应用中的具体实现不太一样,但思想是一样的。非极大值抑制,常用于边缘检测、目标检测等计算机视觉任务。2. Why以目标检测为例:目标检测的过程中在同一目标的位置上会产生大量的候选框,这些候选框相互之间可能会有重叠,此时我们需要利用非极大值抑制找...原创 2020-04-14 11:02:31 · 848 阅读 · 2 评论 -
基于matplotlib的目标检测结果展示
前言在图像分类任务里,我们假设图像里只有一个主体目标,并关注如何识别该目标的类别。然而,很多时候图像里有多个我们感兴趣的目标,我们不仅想知道它们的类别,还想得到它们在图像中的具体位置。在计算机视觉里,我们将这类任务称为目标检测(object detection)或物体检测。本篇博文将主要介绍,如何将边界框和类别可视化。边界框在目标检测里,我们通常使用边界框(bounding box)来描述...原创 2020-03-19 19:29:31 · 1217 阅读 · 0 评论