![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
object detection
图像小白鼠
驽马十驾 功在不舍
展开
-
YOLO3+WIN10+Keras+自己的训练集
@YOLO3+WIN10+Keras+自己的训练集YOLO3+WIN10+Keras+自己的训练集在深度学习的目标检测领域也已经有一段时间了,从之前的学习基础知识到读别人的代码,中间读了很多的博客,这里写下自己的一些经验。训练集的准备训练集我尝试过两种格式,一种是xml格式,一种是json格式,两种格式都可以进行训练,只不过需要修改一下转换脚本。首先先从GitHub上面下载文件,并解压...原创 2019-08-05 15:55:45 · 2903 阅读 · 16 评论 -
RuntimeError: Expected object of type torch.FloatTensor but found type torch.cuda.FloatTensor for ar
运行FPN faster rcnn 进行模型继续训练时出现的BUG,查看了网上的原因,发现时数据格式不匹配,必须得改为cuda格式,所以修改: if args.resume: load_name = os.path.join(output_dir, 'fpn_{}_{}_{}.pth'.format(args.checksession, args.checkepoch, a...原创 2019-09-02 22:55:00 · 1774 阅读 · 0 评论 -
ROI Align 代码解析个人心得(仅供参考)
关于ROI Align的算法原理讲解,博客有很多,但是暂时没发现有讲解源码的,笔者最近使用Faster rcnn代码时就想仔细了解一下roi align的代码。于是就读了一下其代码,代码由C语言写的,也不是非常难理解,在这里贴一下自己对代码的理解,若有错误,欢迎大家批评指正。void ROIAlignForwardCpu(const float* bottom_data, const float...原创 2019-08-15 15:58:48 · 3555 阅读 · 5 评论 -
手撕NMS,numpy实现目标检测的常用模块NMS
目标检测领域的一个重要组件,NMS,非极大值抑制,用于在检测领域剔除同一目标的多重框标注,图示效果如下:NMS过后图片为网络上查找的,侵删。首先,来了解一下NMS,NMS非极大值抑制,即一个目标有多个框的时候,我们进行筛选,选取最好的框,筛选掉那些重复标注的框。那么它是怎么筛选的呢?首先,一个目标在检测过程中,往往会有许多的预测框出现,这些框的score不同,坐标位置也不同。NMS首先...原创 2019-07-27 16:56:08 · 1665 阅读 · 0 评论 -
win10keras版本yolo3显示中文标注
之前的博文被检测到非原创,我只能更改为转载,所以在这里补充一下网友问到中文标注的问题,在此补充说明一下:**博主尝试过各种诸如utf-8 转换格式等操作均不行,后来经过打印信息才发现是显示的字体问题:想显示中文标注,在yolo.py中找到这句代码: font = ImageFont.truetype(font='font/FiraMono-Medium.otf', ...原创 2019-08-05 15:59:02 · 893 阅读 · 1 评论 -
GIOU(generalized IoU)笔记
论文的地址为:https://arxiv.org/abs/1902.09630github代码地址:https://github.com/generalized-iou这篇论文出自CVPR2019,这篇论文提出了一种优化边界框的新方式即GIOU。IOU中文叫并交比,即两者公共的面积占总面积的比值,在目标检测中,常用于衡量bbox的位置准确与否,与GT(ground truth)的IOU越大往...原创 2019-07-26 22:35:29 · 2926 阅读 · 0 评论 -
线下数据增强:对图像进行上下随机颜色填充,并修改对应的xml文件
项目数据不够的时候,往往需要进行数据扩增,此文介绍一种简单的扩增方式,用于线下数据增强。首先贴上代码#此脚本用于填充图片,使得图片变成1280*1280大小import osimport numpy as npfrom PIL import Imagefrom xml.etree.ElementTree import parse, ElementJPEGfilepath = 'JP...原创 2019-07-22 15:43:15 · 1024 阅读 · 0 评论 -
numpy实现GIOU代码
笔者使用numpy实现了GIOU,废话不多说,直接贴上代码:import numpy as npdef GIOU (boxes1 , boxes2 ): "calculate GIOU " ''' boxes1 shape : shape (n, 4) boxes2 shape : shape (k, 4) gious: shape (n, k) ...原创 2019-07-29 22:28:14 · 847 阅读 · 0 评论 -
VOC转coco脚本,仅用于目标检测,非分割任务
首先进行VOC2007转为coco数据集的格式:从github上下载voc转coco的脚本,该脚本不包含语义分割的segmentation,只能用于目标检测的坐标转换下载的传送门:https://github.com/jiachen0212/voc2coco-pattern修改其中的xml2json.py脚本(1)voc_clses= …(此处加上__background__)即填写n加1...原创 2019-07-19 17:26:31 · 2876 阅读 · 7 评论 -
object detection 目标检测算法综述 (记录)
最近找了一些目标检测算法综述,这篇比较好,特此记录一下。对应的博客地址 https://blog.csdn.net/Gentleman_Qin/article/details/84421435原创 2019-07-19 17:19:25 · 291 阅读 · 0 评论 -
YOLO3算法个人算法理解心得
经过一段时间的代码解读和反复试验,加上与各位网友的交流,写下一点个人理解,希望对大家有所帮助。yolo3算法属于one-stage算法,主要体现在,可以直接输出框和类型,这一点和faster-rcnn不一样。在faster-rcnn中,会先进行rpn网络进行proposal的提取,得到roi,随后再与特征图进行roi-pooling,得出结果。而yolo3直接由输入图片和kmean预先设定尺寸的...原创 2019-04-13 21:27:53 · 2347 阅读 · 1 评论 -
RuntimeError: reciprocal is not implemented for type torch.cuda.LongTensor
运行Faster rcnn FPN网络,出现的bug:RuntimeError: reciprocal is not implemented for type torch.cuda.LongTensor解决办法: anchor_target_layer_fpn.py", line 136: num_examples = torch.sum(labels[i] >= 0) ...原创 2019-09-02 23:11:51 · 1884 阅读 · 0 评论