目标检测
ming.zhang
爱科技,爱生活
展开
-
梯度下降法解方程,求函数极值
设要求方程的值:我们采用mse(误差平方和)作为优化函数:上面的问题即可转化为求:的最小值了求该公式的导数/梯度为:我们随机给x初始化一个值,然后使用导数公式来更新x的值,其中lr为学习率/步长:若设置初始值x=10,则更新代码为:x = 10lr = 0.001for i in range(1000): grad = 2 * (x**2 - 5) * (2 * x) x = x - lr * grad print("iteration: {}, gra原创 2021-03-16 20:16:11 · 2260 阅读 · 0 评论 -
目标检测1: rcnn流程梳理及边框损失函数loss分析
个人理解,有很多错误,推荐看论文。1. rcnn 流程梳理及边框损失函数loss分析论文地址(https://arxiv.org/pdf/1311.2524v3.pdf)预测图像时:对于一张图像,使用select search算法得到大约2000个region proposals(候选区域);resize候选区域为227*227,送入vgg/alexnet网络提取特征(vgg/...原创 2018-12-14 22:54:40 · 3896 阅读 · 0 评论 -
目标检测2: faster rcnn对比fast rcnn,训练流程分析,边框损失函数loss分析
注:个人理解,错误难免,推荐看论文1.结构:faster-rcnn(https://arxiv.org/abs/1506.01497)和fast-rcnn(https://arxiv.org/abs/1504.08083)的结构类似,下面二者结合着分析。下图左边为fast rcnn右边为faster rcnn。fast-rcnn的大致流程:fast rcnn把一张图像用select...原创 2018-12-17 20:37:02 · 2404 阅读 · 4 评论 -
目标检测3: yolov3结构原理,boundingbox边框回归
注:a.部分图像是从其他博客偷的!!!;b.个人理解,错误难免,推荐看论文(yolov3:https://arxiv.org/abs/1804.02767;yolov2:https://arxiv.org/abs/1612.08242;yolov3:https://arxiv.org/abs/1804.02767)1. 结构图yolov3-tiny结构(darknet的):yolo...原创 2018-12-17 23:58:12 · 15848 阅读 · 5 评论 -
目标检测4: retinanet网络focal loss分析,网络结构原理
个人理解错误难免,推荐看原文(https://arxiv.org/abs/1708.02002) 作者首先提出了一个问题:在目标检测中,one stage效果较差于two stage的主要原因是:one stage在训练时样本比例不均衡(比如上面的yolov3,在训练时要生成3*13*13 + 3*26*26 + 3*52*52 = 10647个box,但这些box中真正有物体的...原创 2018-12-18 00:17:09 · 3408 阅读 · 0 评论 -
目标检测5: faster-rcnn改进版, yolov3, retinanet效果比较
上接前面4篇。下图显示了faster改进版,yolov3,retinnet结果的比较,图来自yolov3论文。 从效果上看:整体上retinanet效果最好,但速度不及yolov3,约为yolov3的3.8倍。yolov3效果不如retinanet的原因可能是:focal loss起作用了;retinanet使用较多的anchor(retinanet每个尺寸的输出使用9个anchor...原创 2018-12-18 00:25:27 · 12652 阅读 · 0 评论 -
使用yolov3-tiny训练一个人脸检测器
春节放假回家时,在北京西乘坐高铁进站时发现,现在出现了很多自助进站验证对pos机器,主要是对身份证和个人的照片进行匹配,判断是不是同一个人,无需人工check了,省时省力。春节在家没事干,想起了人脸识别的事情,感觉挺好玩,就试着先训一个人脸检测模型。这里的识别效果并不会和目前最先进的模型进行对比,只是觉得好玩测试一下流程而已。 一、人脸检测数据的准备我使用的是widerfac...原创 2019-02-05 17:35:38 · 11374 阅读 · 25 评论 -
目标检测数据增强:翻转、旋转90、随机裁剪、对比度等
在目标检测中,常用到数据增强。下面为集中增强方式。每个函数的输入为图像及box框,返回变换后的图像及box框。这里的demo使用voc格式的.xml标注的数据。使用readAnnotations函数读取xml。返回box框,如box: [[404, 30, 500, 374, 222], [386, 83, 479, 374, 222], [272, 65, 415, 374, 222], ...原创 2019-03-03 14:46:17 · 13271 阅读 · 10 评论 -
把voc格式的标注文件.xml转为coco格式的.json文件
在训练目标检测模型的时候一般使用labelimg标注的图像生产.xml格式的标注文件。有时候需要用到coco格式的json标注文件,在github找到了一个xml转json的脚本。(https://github.com/CivilNet/Gemfield/blob/master/src/python/pascal_voc_xml2json/pascal_voc_xml2json.py)执行该脚...原创 2019-05-19 12:58:24 · 13281 阅读 · 17 评论