目标检测
文章平均质量分 69
右边是我女神
笔记仓库
展开
-
MTCNN-边框回归
在对MTCNN的解读中,第一阶段Pnet的任务是得到候选人脸窗口以及人脸框回归向量。这分别对应着网络部分的face classification以及bounding box regression。另外,在对Pnet的训练过程中是不包含Facial landmark localization的,这主要是因为图像较小,size只有12x12,所以不适合训练。其中,bounding box regression任务中,模型需要得到的数据有些不符合我的构想。以下是数据集制作部分:part1:for b原创 2021-08-31 14:43:12 · 417 阅读 · 0 评论 -
mask&MTCNN
mask在深度学习中的作用大多是为了提取或者屏蔽一些特定的元素。可以理解为张量的过滤器。在CV中,常见的应用有:提取指定区域、图像屏蔽等;一些特殊的激活函数,比如ReLU;一些特殊的训练机制,比如Dropout都可以理解为广义上的mask。因此,mask在整个流程当中,主要应用于数据预处理、模型中间层以及模型损失计算(忽略部分样本,避免带入损失)等等。在MTCNN当中,涉及到判断人脸的二分类问题,由于数据集共分为了:含人脸、含部分人脸以及不含人脸三个类别,所以说我们在用BCE时需要把含部分人脸的样原创 2021-08-30 10:32:24 · 189 阅读 · 0 评论 -
mmdetection-自定义Losses
损失函数的默认配置可能不适用于不同的数据集或者模型,因此修改特定的损失显得很有必要。损失的计算管道给定pre和GT以及weight,损失函数将输入张量映射到最终的损失标量。映射可以分为四个步骤:...原创 2021-08-26 14:52:54 · 1043 阅读 · 0 评论 -
mmdetection-Models
文章目录增加新的backbone定义一个新的backbone引用这一模块在配置文件中使用backbone增加新的necks定义一个neck引用模块在配置文件中使用新模块加入新的Loss在训练网络过程中常用的一些model以及dataset的配置等都放置在mmdet文件夹中。增加新的backbone定义一个新的backbone创建文件:mmdet/models/backbones/mobilenet.pyimport torch.nn as nnfrom ..builder import BAC原创 2021-08-24 14:26:38 · 169 阅读 · 0 评论 -
mmdetection-自定义Data Pipelines
文章目录DataPipelines的设计Data loadingPre-processingFormatting自定义PipelineDataPipelines的设计在torch中,Dataset的作用是决定如何读取训练数据,并且控制读取数据后进行何种操作;而DataLoader的作用是把Dataset得到的数据排列起来,并按照一定的batchsize输入给网络。通常来说,Dataset和DataLoader肩负起了处理数据集的任务,而考虑到目标检测任务中,size不一的问题,在MMCV中创建了一个D原创 2021-08-23 21:23:44 · 321 阅读 · 0 评论 -
mmdetection--自定义数据集
文章目录PASCAL VOC数据集格式组织结构AnnotationImageSetsJPEGImagesCOCO数据集格式组织结构annotations(注释)json格式instances自定义数据集(coco类型)修改config文件dataset模块model模块检查注释文件mmdetection主要支持COCO,次要支持PASCAL VOC(提供了转化为COCO的脚本),因此我们首先介绍COCO和VOC数据集。PASCAL VOC数据集格式PASCAL VOC2007和2012总共分为了四个大原创 2021-08-23 16:33:11 · 1285 阅读 · 0 评论 -
mmdetection--config
文章目录样例解读样例解读文件位置:configs/base/models/faster_rcnn_r50_fpn.py文件只包含了一个字典对象:model。# model settingsmodel = dict( type='FasterRCNN', # 第一部分 backbone=dict( type='ResNet', depth=50, num_stages=4, out_indices=(0, 1原创 2021-08-22 00:03:41 · 114 阅读 · 0 评论 -
mmdetection日志
文章目录测试VOC数据集数据准备测试命令测试VOC数据集数据准备数据集存放目录为:data/VOCdevkit/VOC2007 and data/VOCdevkit/VOC2012测试模型存放目录为:checkpoints配置文件存放目录为:configs/pascal_voc测试命令文件:./tools/test.pypython tools/test.py ${CONFIG_FILE} ${CHECKPOINT_FILE} [--out ${RESULT_FILE}] [--eval $原创 2021-08-21 01:45:43 · 346 阅读 · 0 评论 -
MMDetection: Open MMLab Detection Toolbox and Benchmark(2019)
文章目录IntroductionSupported FrameworksSingle- stage MethodsTwo- stage MethodsMulti-stage MethodsGeneral Modules and MethodsArchitectureModel RepresentationTraining PipelineIntroduction包含两大任务:Object detection;Instance segmentation。MMdetection特点:模块化设计原创 2021-08-10 23:05:15 · 199 阅读 · 0 评论 -
详解Faster R-CNN
RPN的原理和流程我们首先输入图片,并用卷积提取特征。在设计RPN网络之前,需要想明白几个问题。A. 候选锚框该如何设定,称为锚框的设计,这基于以下三点考虑:锚框的大小;锚框的长宽比;锚框的铺设间隔。B. 如何从这些候选锚框中,选出位置合适的锚框,这称为锚框的匹配:正样本:最佳匹配或IoU≥θ+IoU \ge \theta_+IoU≥θ+负样本:IoU<θ−IoU \lt \theta_-IoU<θ−忽略样本:非正非负。注:正样本是针对锚框的匹配程度。C.如原创 2021-05-30 19:58:05 · 337 阅读 · 0 评论 -
Faster R-CNN论文解读
文章目录AbstractIntroduction缘由RPN训练方案Faster R-CNN整体流程Conv layersRPNclsreganchorTranslation-Invariant AnchorsMuti-Scale Anchors as Regression References目标检测的四个基本步骤:候选区域生成;特征提取;分类位置精修Fast R-CNN = Selective Search + Fast R-CNNFaster R-CNN = RPN + Fast R-原创 2021-05-30 18:28:25 · 1635 阅读 · 0 评论 -
如何理解锚框?
文章目录滑动窗口法缺点为什么提出anchor box?滑动窗口法给定固定尺寸的窗口,根据设定的步伐,从左至右、从上到下进行滑动。把每个窗口输入到CNN中进行预测和分类。缺点窗口尺寸固定,不适合识别较大的物体;窗口较多,运算量大。为什么提出anchor box?一个窗口只能检测一个目标;无法解决多尺度问题。综上所述,锚框可以认为是一个基础窗口的N种形变。...原创 2021-05-30 18:14:21 · 484 阅读 · 0 评论