目标检测
文章平均质量分 92
Adenialzz
Keep Learning.
展开
-
DETR精读笔记
DETR精读笔记原创 2022-08-27 16:42:42 · 1969 阅读 · 0 评论 -
图像预处理之warpaffine与双线性插值及其高性能实现
图像预处理之warpaffine与双线性插值及其高性能实现视频讲解:https://www.bilibili.com/video/BV1ZU4y1A7EG代码Repo:https://github.com/shouxieai/tensorRT_Pro本文为视频讲解的个人笔记。warpaffine矩阵变换对于坐标点的变换,我们通常考虑的是旋转、缩放、平移这三种变换。例如将点 P(x,y)P(x,y)P(x,y) 旋转 θ\thetaθ 度,缩放 scalescalescale 倍,平移 ox,o原创 2022-05-06 11:16:57 · 1359 阅读 · 4 评论 -
mmdetection tools工具梳理
mmdetection tools工具梳理mmdetection 是一个非常好用的开源目标检测框架,我们可以用它方便地训练自己的目标检测模型,mmdetection 项目仓库提供许多实用的工具来实现帮助我们进行各种测试。本篇将梳理以下 mmdetection 项目仓库 tools 目录下的各种实用工具。测试版本:mmcv-full == 1.4.8mmdet == 2.24.1训练相关tools/train.py这个自然是最常用的,我们训练模型通常就是用这个脚本来启动,通常只需要传入配置文原创 2022-05-03 17:37:23 · 9862 阅读 · 15 评论 -
关于mmdetection上手的几点说明
关于mmdetection上手的几点说明官方的文档很有参考价值,并且也有中文版,应当是大家上手 mmdetection 的第一参考,本文是记录一些笔者在小白阶段上手 mmdetection 时的一些心得,这些东西没有人提,可能是大佬们觉得这些再自然不过了,也可能是自己在一开始对 mmdet 项目的理解不够,在这里记录一下,如果能帮到其他刚入门的朋友就更好了。**注意:对于官方文档中已有的内容,本文不会重复介绍,二者配合阅读并动手实践是最佳的上手mmdetection的方式。**如有问题或发现错误,欢迎留原创 2022-03-25 23:25:19 · 1606 阅读 · 2 评论 -
Segmentaion标签的三种表示:poly、mask、rle
Segmentaion标签的三种表示:poly、mask、rle不同于图像分类这样比较简单直接的计算机视觉任务,图像分割任务(又分为语义分割、实例分割、全景分割)的标签形式稍为复杂。在分割任务中,我们需要在像素级上表达的是一张图的哪些区域是哪个类别。多边形坐标Polygon第一感下,要表达图像中某个区域是什么类别,只要这个区域“圈起来”,并给它一个标签就好了。的确,用多边形来将目标圈出来确实是最符合我们视觉上对图像的感知的方法。并且在很多数据集的标注过程中,来自人类的手工标注也是通过给出一个一个点的坐原创 2022-02-27 21:37:25 · 12841 阅读 · 4 评论 -
目标检测综述
目标检测综述转自:https://zhuanlan.zhihu.com/p/383616728引言目标检测领域发展至今已有二十余载,从早期的传统方法到如今的深度学习方法,精度越来越高的同时速度也越来越快,这得益于深度学习等相关技术的不断发展。本文将对目标检测领域的发展做一个系统性的介绍,旨在为读者构建一个完整的知识体系架构,同时了解目标检测相关的技术栈及其未来的发展趋势。由于编者水平有限,本文若有不当之处还请指出与纠正,欢迎大家评论交流!本文将从以下九大方面进行展开:背景目标检测算法发展脉转载 2022-01-29 16:40:10 · 3717 阅读 · 0 评论 -
手写nms
手写nms计算宽高的时候加1是为什么?本文总结自互联网的多种nms实现,供参考,非博主原创,各原文链接如下,也建议大家动手写一写。Ref:浅谈NMS的多种实现目标窗口检测算法-NMS非极大值抑制一、faster-rcnn源码阅读:nms的CUDA编程c++版 nmsnms简介首先还是要科普一下nms算法的思想:简单来说就是去重框。这里的重框针对的当然是某一类的框。下面实现的时候也是默认拿到某一类所有的框。算法思路:For a prediction bounding box B, th转载 2022-01-27 16:56:47 · 836 阅读 · 1 评论 -
利用opencv-python绘制多边形框或(半透明)区域填充(可用于分割任务mask可视化)
利用opencv-python绘制多边形框或(半透明)区域填充(可用于分割任务mask可视化)本文主要就少opencv中两个函数polylines和fillPoly分别用于绘制多边形框或区域填充,并会会以常见用途分割任务mask(还是笔者的猪仔数据集^^)可视化举例示范。cv2.polylines()以下是摘自Ref的函数介绍,笔者将在下面结合例子解释其中的参数。cv2.polylines() method is used to draw a polygon on any image.Synta原创 2021-07-23 16:52:53 · 10831 阅读 · 11 评论 -
COCO 数据集格式及mmdetection中的转换方法
COCO 数据集格式及mmdetection中的转换方法COCO格式CV中的目标检测任务不同于分类,其标签的形式稍为复杂,有几种常用检测数据集格式,本文将简要介绍最为常见的COCO数据集的格式。完整的官方样例可自行查阅,以下是几项关键的字段:{ "images": [image], "annotations": [annotation], "categories": [category]}image = { "id": int, "width": in原创 2021-07-12 23:10:59 · 2668 阅读 · 0 评论 -
使用yolov5训练自己的目标检测数据集
使用yolov5训练自己的目标检测数据集yolov4出来后不久,又出现了yolov5,没有论文。虽然作者没有放上和yolov4的直接测试对比,但在COCO数据集的测试效果还是很可观的。很多人考虑到YOLOv5的创新性不足,对算法是否能够进化,因此yolov5的名头仍有争议。但是既然github上有如此多的star,说明还是受到大多数人认可的一个工程。并且yolov5是十分容易上手使用的一个目标检测开源项目,只需要改几个文件,配置好自己的数据集格式和目录结构,即可开始训练,对新手十分友好。可以先把训练跑起原创 2021-07-09 13:52:56 · 1976 阅读 · 2 评论 -
错误类型、混淆矩阵及目标检测常用评价指标
目标检测常用评价指标本文主要参考陈恺大佬在B站商汤账号的介绍mmdetection的视频。检测结果的正确/错误类型真阳性(Ture Positive):算法检测到了某类物体(Positive),而实际图中也确实有这个物体,检测结果正确(True)。假阳性(False Positive):算法检测到了某类物体(Postive),但是图中没有这个物体,检测结果错误(False)。 又称为误检假阴性(False Negtive):算法没有检测到某类物体(Negtive),但是图中有这个物体,检测结果错误原创 2021-07-08 15:49:11 · 2166 阅读 · 0 评论