目标检测
文章平均质量分 88
再困也得吃
这个作者很懒,什么都没留下…
展开
-
RetinaNet详解
网络结构这里默认3∗33*33∗3个anchor,图中标出以输入为672*640大小时,每层对应的尺度,以及每层对应anchor个数和每个特征层base anchor对应到原图的anchor大小.边界框回归在faster rcnn 中存在3个框,其中anchor, ground truth为已知固定的框, predict 为预测框其中:Anchor:(Ax,Ay,Aw,Ah)Anchor :(A_x,A_y,A_w,A_h)Anchor:(Ax,Ay,Aw,Ah)Predict:(Px原创 2020-05-27 16:20:38 · 11814 阅读 · 8 评论 -
密集场景人物检测项目
之前做了一个较密集场景下的人脸检测项目,主要场景是面向阶梯教室场景。主要难点:目标密集目标尺度变化大使用检测网络:我们知道随着神经网络的层数的增加,其予语义信息会更丰富,但位置信息会越不准确,但同一大小的神经元的感受会越大。所以有效融合高层和低层的信息,即融合语义信息和位置信息,会对检测模型有很大提升。所以目前主流的检测网络均采用如(d)所示的FPN结构,由于任务场景较小,采用了R...原创 2020-02-12 22:23:56 · 1310 阅读 · 4 评论 -
TinyFace论文阅读总结
数据集:WIDER FACE:包括32,203 张包含人脸图片,其中包括393,703张标注人脸。数据集依据检测的难易程度划分为"easy",“medium”,"hard"三种类型FDDB检测方法:基于两阶段检测:1 Improve RCNN:1.1 基础结构:改进Faster RCNN:采用light RCNN(结合Faster rcnn和rfcn的优点,将检测器的head部分...原创 2020-01-13 11:09:07 · 945 阅读 · 0 评论 -
ROI Pooling 和 ROI Align
1. 为什么会提出ROI Pooling?在Rcnn系列检测器中,rcnn在selective search后得到一系列的预选框,再将这些预选框 resize到同样大小的尺寸,通过卷积网络,再进行检测,这是因为固定的卷积网络需要同样大小的输入,这样多次通过网络,不仅费时,box之间存在大量的重复区域,也浪费了计算资源。selective searchresizeCNNImageboxbox_s...原创 2020-01-09 20:45:15 · 676 阅读 · 0 评论 -
voc 数据集制作 + yolo v3 训练 笔记
数据准备课程需要一个目标检测的demo,对单个种类的目标检测,以下为训练记录。1. 文件目录格式VOCdevkitAnnotations00001.xml00002.xml……ImageSetsMaintrain.txttest.txtJPEGImges00001.jpg00002.jpg……labels00001.txt00002...原创 2020-01-09 20:40:28 · 442 阅读 · 0 评论 -
目标检测评估指标(ap,map,PR曲线)
目标检测评估指标1.对于目标检任务,分为单类别和多类别单类别 AP:(average pression)多类别 mAP:(mean average precision)2.计算AP已知:图片上有N个groundtruth,M个预测的bounding box,以及每个预测目标的confidencestep1: 先将bounding box 按照 confidence排序ste...原创 2020-01-04 14:20:19 · 3601 阅读 · 1 评论