目标检测
文章平均质量分 85
贾小树
这个作者很懒,什么都没留下…
展开
-
论文阅读:You Only Look One-level Feature(YOLOF)
文章目录1、论文总述2、FPN的两大作用3、MiMo和SiMo结构的不同4、一个有争议的点5、topK的取值6、训练时的Other Details参考文献1、论文总述本篇论文针对FPN的作用进行了深入分析,认为主要有两个功能:特征融合和对不同尺度目标进行分而治之优化,然后作者发现这两个作用中比较重要的是分而治之思想,并不是特征融合,这就让人保持怀疑了。作者分析完之后主要有两个工作:(1)去掉FPN,通过残差连接对两个不同感受野的feature map进行相加实现多种尺度感受野覆盖,详见论文中的fig原创 2021-04-02 17:44:44 · 330 阅读 · 0 评论 -
论文阅读:Gaussian YOLOv3: An Accurate and Fast Object Detector Using Localization Uncertainty for Autono
文章目录1、论文总述2、NLL损失函数的优势3、不确定性的具体定义4、IOU与不确定性得分值的关系5、实验结果参考文献1、论文总述本篇论文主要是针对YOLO V3算法进行改进,提高TP的数量,降低FP的数量,改进点是针对原算法的bbox的坐标、高宽输出值是确定值,而用于分类的confidence、class score是概率值,所以作者利用高斯建模对Bbox的位置信息进行改进,通过输出每个值的均值和方差,相当于输出一种高斯分布,让它们也有一种不确定性,有一种得分的概念,这样bbox的得分不仅有类别得分,原创 2021-03-31 20:59:21 · 365 阅读 · 0 评论 -
论文阅读:Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift
文章目录1、论文总述2、Why does batch normalization work3、BN加到卷积层之后的原因4、加入BN之后,训练时数据分布的变化5、与BN配套的一些操作参考文献1、论文总述本篇论文提出了一个对CNN发展影响深远的操作:BN。BN是对CNN中间层feature map在激活函数前进行归一化操作,让他们的分布不至于那么散,这样的数据分布经过激活函数之后更加有效,不至于进入到Tanh和 Sigmoid的饱和区, 至于RELU 激活函数也有一定的效果。论文的动机是为了改善CNN中的原创 2021-03-30 10:48:22 · 462 阅读 · 0 评论 -
论文阅读:Non-local Neural Networks
文章目录1、论文总述1、论文总述本篇论文收到non-local mean opration传统算法的启发,希望在CNN中加入非局部的信息,而不仅仅是卷积核大小的局部信息,整篇论文看着有点蒙,有严格的理论支持,到最后实现的时候发现和self-attention机制比较像,作者说self-attention是Non-local的一种特殊形式。作者验证想法的实验主要用的是视频分类数据,因为非局部不仅仅是空间上的,也可以是时间上的,后续也有目标检测数据上的实验。详细解读可以参考这篇文章:【CV中的Atte原创 2021-03-25 21:47:46 · 110 阅读 · 0 评论 -
论文阅读:Generalized Focal Loss: Learning Qualified and Distributed Bounding Boxes for Dense Object Dete
文章目录1、论文总述1、论文总述本篇论文提出了泛化版的Focal loss(可以同时用于分类和回归分支),既将class 得分和 centerness得分的预测合并为了一个分支,解决了training和test时的gap,而且将边框回归的每个确定值的预测改为了16个离散值的预测,然后将其积分得到最终值。论文非常值得精度,里面值得学习的地方很多。原作者在知乎上对本篇论文解读的已经非常好了,可直接去看,本人就不赘述了。大白话 Generalized Focal Loss本文大概意思:背景框也会预原创 2021-03-22 23:28:36 · 1263 阅读 · 0 评论 -
论文阅读:Probabilistic Anchor Assignment with IoU Prediction for Object Detection(PAA)
文章目录1、论文总述2、 Anchor Assignment的研究进展和优缺点参考文献1、论文总述本篇论文主要是针对anchor的正负样本分配做改进,动机可以看下图:相比于其他工作,作者不仅在anchor assignment阶段提出了自适应分配正负样本的做法,而且在optimization阶段和后处理阶段也加入了想对应的改进,可谓很全面了。当然,最主要的工作还是利用高斯混合模型对anchor进行自适应的正负样本分配,抛弃了原先的基于IOU的分配方法,基于IOU的其实只看了anchor的定位信息,原创 2021-03-18 21:05:03 · 1224 阅读 · 0 评论 -
论文阅读:FreeAnchor: Learning to Match Anchors for Visual Object Detection
文章目录1、论文总述2、手工设计的基于IOU的anchor分配的不合理3、anchor与GT匹配时的3个准则4、一种可以借鉴的性能对比方式1、论文总述本篇论文并不是anchor-free检测模型,是在RetinaNet的基础上进行改进,原先的正负样本分配都是根据手工设计的anchor与GT的IOU,作者认为这样不好,就想自适应的选择anchor作为正样本,具体做法:从IOU值较高的许多anchor中,让网络自己选择正样本(free anchor是这个意思),这块好像是用的最大似然估计做的,该过程从每个对原创 2021-03-17 20:46:32 · 224 阅读 · 0 评论 -
论文阅读:Augmentation for small object detection
文章目录1、论文总述2、举例说明小目标的重要性3、COCO数据集中小目标的分布情况4、Augmentation与Oversampling结合时的3种策略5、复制-粘贴时的3种策略参考文献1、论文总述本篇论文主要针对COCO数据集上的小目标性能进行改进,相对来说,是比较实用的数据处理技巧,适用于所有的anchor-free和anchor-based的目标检测模型。(1)对含有小目标的图像进行过采样,一般过采样率取3时较好,这样大目标受到的影响不会太大,因为总的来说,类别不平衡、不同尺度间的目标数量不平衡原创 2021-03-16 21:03:37 · 514 阅读 · 0 评论 -
论文阅读:Scale-Aware Trident Networks for Object Detection
文章目录1、论文总述2、与image pyramid、FPN相比3、Investigation of Receptive Field4、trident blocks加在哪里5、weight sharing的优势6、Scale-aware Training Scheme7、Fast Inference Approximation8、Ablation Studies9、 Comparison with State-of-the-Arts参考文献1、论文总述本文的动机主要是想改善目标检测中多尺度的问题(小目标原创 2021-01-13 17:24:39 · 365 阅读 · 0 评论 -
论文阅读:DetectoRS: Detecting Objects with Recursive Feature Pyramid and Switchable Atrous Convolution
文章目录1、论文总述2、RFP模块的具体实现3、SAC模块的具体实现4、 Ablation Studies1、论文总述本篇论文提出的目标检测模型DetectoRS在COCO数据集上的性能是当前最好(mAP:54.7),在实例分割和全景分割上效果也不错,主要是因为提出的改进方法是 基于backbone和FPN的, 适用于多种视觉任务,其他次优模型如:ResNeSt,CBnet也是基于backbone的改进,也许现在的趋势就是目标检测的网络结构大致已定(除anchor-free系列外),而且也有论文统计过,原创 2020-06-30 20:25:27 · 4558 阅读 · 0 评论 -
论文阅读:ResNeSt: Split-Attention Networks
文章目录1、论文总述2、1乘1卷积相当于一种注意力机制3、ResNeSt网络结构4、SKNet网络结构5、ResNeSt的两种等价实现6、ResNeSt对resnet网络结构上的改动7、ResNeSt训练时候使用的tricks8、Ablation study9、ResNeSt与其他模型的效果对比10、附录中的彩蛋参考文献1、论文总述本篇论文在投稿阶段就在知乎上引发了广泛讨论,争议很多,这个争议我觉得不仅仅是ResNeSt特有的,而是现在的好多学术论文都有的问题,争议点就在于:文中提出的模型在数据集上提高原创 2020-10-08 15:59:53 · 1141 阅读 · 0 评论 -
论文阅读:CSPNet: A NEW BACKBONE THAT CAN ENHANCE LEARNING CAPABILITY OF CNN
文章目录1、论文总述2、深度可分离卷积的局限性3、CSPNet用于目标检测时关注的3个问题4、CSPNet用在denseNet上时的对比示意5、Real-time object detector的现阶段发展情况6、Partial Transition Layer的几种形式及效果对比7、Apply CSPNet to Other Architectures8、Exact Fusion Model(EFM)的结构及其效果9、CSPNet在三种设备上的不同配置10、CSPNet在COCO数据集上与其他模型的对比1原创 2020-10-06 21:29:35 · 1947 阅读 · 0 评论 -
论文阅读:EfficientDet: Scalable and Efficient Object Detection
文章目录1、论文总述2、各式各样的FPN及其效果3、BiFPN设计的心路历程4、Weighted Feature Fusion4、EfficientDets家族的网络结构图5、Compound Scaling针对目标检测的设置6、实验训练设置细节7、EfficientDet performance on COCO7、 EfficientNet和BiFPN的贡献各有多少8、EfficientDet performance on COCO参考文献1、论文总述本篇论文是Google提出的EfficientNe原创 2020-10-06 00:23:09 · 542 阅读 · 0 评论 -
论文阅读:AutoAssign
文章目录1、论文总述2、密集预测型FCOS正负样本分配的不足3、 Comparison of label assignment between different typical detectors.4、we transform the whole assignment step into two weight maps.5、公式6、Visualization of learned center weighting weights of different categories7、 Analysis of原创 2020-07-21 10:12:48 · 5122 阅读 · 5 评论 -
论文阅读:ATSS
文章目录1、论文总述2、three main differences between RetinaNet and FCOS3、RetinaNet and FCOS 的正负样本分配策略4、交换RetinaNet and FCOS 的正负样本分配策略之后?5、ATSS算法流程6、the necessity of tiling multiple anchors per location7、Detection results on MS COCO test-dev set1、论文总述论文全称:Bridging原创 2020-05-11 16:10:55 · 429 阅读 · 0 评论 -
CNN中的padding如何影响位置学习
最近在知乎上看到大家都在说CNN学习目标的位置时是根据padding来学习的,下面是利用C++实现的矩阵之间的卷积运算注: 有个假设就是,认为feature map中的1位背景,4567是前景1、feature map和卷积核都不带padding例1:feature map为4维矩阵,卷积核为3维目标在中心时:目标向左上角平移:目标向右下角平移:例2:feature map为6...原创 2020-03-27 01:15:56 · 786 阅读 · 0 评论 -
论文阅读:PolarMask: Single Shot Instance Segmentation with Polar Representation
文章目录1、论文总述 2、极坐标系相对于笛卡尔坐标系的优势 3、正样本的分配及其优势4、极坐标系的36个点到笛卡尔坐标系的转换5、Polar Centerness6、Polar IoU Loss的计算7、 Ablation Study8、 Comparison to state-of-the-art参考文献1、论文总述 这篇论文的作者在今年(2019)的10月10号将其挂在了arxiv网站上...原创 2019-11-25 17:01:11 · 903 阅读 · 0 评论 -
论文阅读:FCOS:Fully Convolutional One-Stage Object Detection
文章目录1、论文总述 2、正负样本的分配 3、FCOS比anchor方法好的可能原因之一 4、 Center-ness for FCOS5、COCO数据集的使用惯例6、Best Possible Recalls(BPR)7、与RetinaNet的两点小不同7、与CornerNet相比较8、与其他网络算法的性能比较参考文献1、论文总述 本文从FCN语义分割的思想出发,利用像素点的密集预测提出了...原创 2019-11-23 18:52:21 · 662 阅读 · 0 评论 -
论文阅读:FSAF:Feature Selective Anchor-Free Module for Single-Shot Object Detection
文章目录1、论文总述 2、Ground-truth和loss的设计3、Online Feature Selection4、与其他网络算法性能对比5、Visualization of online feature selection from anchor-free branches参考文献1、论文总述 这篇论文提出了一个anchor-free的模块FSAF,它也有分类分支和回归分支,并分配了...原创 2019-11-22 21:46:21 · 472 阅读 · 2 评论 -
论文阅读:RefineDet:Single-Shot Refinement Neural Network for Object Detection
文章目录1、论文总述 2、TCB模块的图示与功能 3、推理过程 4、与其他网络的算法性能对比 参考文献 1、论文总述 这个是RefineDet的检测框架。该框架由两个模块组成,即上面的Anchor Refinement Module(ARM)和下面的Object Detection Module(ODM),它俩是由中间的Transfer Connection Block(TCB)模块连接。...原创 2019-11-21 17:31:35 · 299 阅读 · 0 评论 -
论文阅读:Cascade R-CNN: Delving into High Quality Object Detection
文章目录1、论文总述 2、cascade RCNN与iterative BBox architecture的不同 3、与其他网络的性能比较 参考文献 1、论文总述 本文是CVPR2018通用目标检测的一篇Oral,在Faster R-CNN框架下,通过级联多个分类器,逐步提高目标定位的精度,向高精度的目标检测器迈出了坚实的一步,作者选用的级联结构共有4个stages(RPN算第一个), Io...原创 2019-11-19 20:05:05 · 227 阅读 · 0 评论 -
论文阅读:Fast R-CNN
文章目录1、论文总述 1、论文总述 这篇paper在RCNN的基础上进行改进,最主要的是参考SPPnet提出了ROIpooling,将原图送进特征提取层,而不是将将每个ROI送进特征提取层;还有一个重要的点就是,多任务loss,实现了除SS提proposal外的端到端训练,即将分类loss和box的回归loss合并到一个损失函数中,实验证明效果更好,分类直接上softmax,抛弃了SVM,并...原创 2019-11-05 21:19:13 · 271 阅读 · 0 评论 -
论文阅读:YOLOv3: An Incremental Improvement
文章目录1、论文总述 2、Bounding Box Prediction的逻辑回归 3、与其他网络性能比较 4、Things We Tried That Didn’t Work 5、参考文献 1、论文总述 【注】:上图的来源:https://blog.csdn.net/leviopku/article/details/82660381这篇论文不能说是一篇paper,它是一篇技术报告,文笔很...原创 2019-11-05 10:40:39 · 475 阅读 · 0 评论 -
论文阅读:YOLOv2:YOLO9000: Better, Faster, Stronger
文章目录1、论文总述 2、location prediction. 3、 尺寸26的feature map转到13 4、性能比较 5、Darknet-19 6、YOLO9000 Best and Worst Classes on ImageNet 7、YOLOv2的损失函数参考文献1、论文总述 YOLOv2是在YOLO基础上改进的版本,感觉焕然一新了,加了许多其他网络的比较好使的模块,如BN...原创 2019-11-04 22:10:46 · 187 阅读 · 0 评论 -
论文阅读:RCNN:Rich feature hierarchies for accurate object detection and semantic segmentation Tech repo
文章目录1、论文总述 2、2012年AlexNet的一个争议3、为啥没用sliding windows4、Run-time analysis.(测试时候的速度分析,作者觉得自己的方法比以前算法效率要高)5、为什么不用softmax直接分类,而是加了SVM6、Ablation studies7、 Relationship to OverFeat参考文献1、论文总述 首先感谢两位大神的文章,写的...原创 2019-11-01 21:21:56 · 339 阅读 · 0 评论 -
论文阅读:Revisiting RCNN: On Awakening the Classification Power of Faster RCNN
文章目录1、论文总述 2、two-stage与one-stage的两个注意点 3、Faster RCNN的失败案例及其失败原因4、three principals to design a better object detector.5、DCR的crop&resize与ROI pooling的resize&fix的不同参考文献1、论文总述 从DCNv2过来的,因为DCNv2里...原创 2019-10-24 21:22:19 · 599 阅读 · 0 评论 -
论文阅读:AlignDet:Revisiting Feature Alignment for One-stage Object Detection
文章目录1、论文总述 2、Feature Alignment in Object Detection 参考文献1、论文总述 这篇论文的出发点是one-stage检测器中anchor与feature的misalignment问题,two-stage中没有这个问题是因为它在第二阶段有ROI-Pooling或者ROI-Align操作,即将proposals与feature对齐之后再进行一次回归分类...原创 2019-10-23 22:21:44 · 1825 阅读 · 0 评论 -
论文阅读:GA-RPN: Region Proposal by Guided Anchoring
文章目录1、论文总述 2、anchor设计的两条准则 参考文献 1、论文总述 这篇论文有点结合centerNet、ROIalign、DCN的意思,它已经不是像RPN、SSD那样提前预定义好许多的anchor,而是根据目标的一些语义信息先将目标的中心点学出来,然后根据中心点附近的特征回归出ROI的w、h,这样就能在feature map的每个点得到一个对应的anchor,然后利用feature...原创 2019-10-23 21:25:59 · 283 阅读 · 0 评论 -
论文阅读:DCNv2:Deformable ConvNets v2: More Deformable, Better Results
文章目录1、论文总述 参考文献 1、论文总述 这篇paper是DCNv1的升级版,文章认为,对于positive的样本来说,采样的特征应该focus在roi内,如果特征中包含了过多超出roi的内容,那么结果会受到影响和干扰。而negative样本则恰恰相反,引入一些超出roi的特征有助于帮助网络判别这个区域是背景区域。看这篇anchor free目标检测论文 论文阅读:Objects as ...原创 2019-10-22 22:44:02 · 1099 阅读 · 0 评论 -
论文阅读:DCNv1:Deformable Convolutional Networks
文章目录1、论文总述 2、目标变形问题的先前的解决办法以及他们的缺点 3、CNN不能处理复杂的未知的形变的原因4、 Deformable Convolution的数学公式推导5、Deformable RoI Pooling的数学公式表达6、the adaptive receptive field in deformable convolution7、Details of Aligned-Ince...原创 2019-10-22 20:54:59 · 2893 阅读 · 0 评论 -
论文阅读:RepPoints: Point Set Representation for Object Detection
文章目录1、论文总述 2、Bounding boxes for the object detection流行的2个原因和它的缺点 3、为什么 the deformable convolution and deformable RoI pooling不能学到更精确的几何定位特征 4、Converting RepPoints to bounding box时的三种方式 5、关键点是自动学得的 6、 C...原创 2019-10-15 23:59:42 · 1600 阅读 · 5 评论 -
论文阅读:Objects as Points(也叫CenterNet)
文章目录1、论文总述 2、center point与Anchor-based的不同 3、Hourglass-104 resnet和DLA-34的网络结构4、中心点正负样本的标定以及改进的focal loss 5、宽高和总体的损失函数6、From points to bounding boxes7、不同basenet和augmentation下的网络性能8、State-of-the-art comp...原创 2019-10-14 00:29:49 · 1567 阅读 · 0 评论 -
论文阅读:CornerNet: Detecting Objects as Paired Keypoints
文章目录1、论文总述 2、two drawbacks of the use of anchor boxes. 3、two reasons why detecting corners would work better than bounding box centers or proposals4、corner pooling5、用于Grouping Corners的 embedding vect...原创 2019-10-12 22:45:53 · 263 阅读 · 0 评论 -
论文阅读:MaskRCNN
一、论文十个原句摘抄在阅读MaskRCNN时,论文中的几句话对自己不仅解惑,而且有启发,现在摘抄到这里做记录。1、A mask encodes an input object’s spatial layout.2、Arrows denote either conv, deconv, or fc layers as can be inferred from context (conv ...原创 2019-08-07 23:30:01 · 172 阅读 · 0 评论 -
关于One_stage检测网络的一些思考
1. 由分类到检测常见的分类网络如VGG,ResNet,GoogleNet等,这些网络的输出是单个的,只是对图像整体内容的一个类别预测,单输出为类别概率,然后挑选类别最大的即为对这张图像的分类结果。而One_Stage检测网络如SSD,YoLOv2等,是多任务学习,网络的输出不仅为对图中感兴趣的类别预测还要输出他们的位置,也许还有置信度。如果图中只有个1个物体也许还容易些,但如果一张图中有多个...原创 2019-07-11 21:17:24 · 360 阅读 · 0 评论 -
论文阅读:FPN
一、对网络的简单理解1、网络结构图(简记为:向上 、向右 、向下)2、得到的新的feature map P2 P3 P4 P5 ,既有高分辨率的信息,又有高级特征的语义信息,所以FPN在检测小目标方面效果很好且时间和计算量上没有特别多的额外花销,而且输入只是一个scale的图片,不像图像金字塔那样输入多个scale,耗时太长。3、其中P2 P3 P4 P5 P6的输出通道数相同,论文中...原创 2019-08-14 23:14:49 · 216 阅读 · 0 评论 -
论文阅读:R_FCN:Object Detection via Region-based Fully Convolutional Networks
文章目录1、论文总述 2、理解这篇论文的先验知识 3、position-sensitive RoI-pooling 4、standard (not naïve) Faster R-CNN 5、和Faster RCNN的性能比较 参考文献 1、论文总述 这篇论文的主要工作就是让原本对位置不敏感的分类操作变得对位置敏感,即目标的位置变化时,相应的分类得分也要变化,论文里作者的具体操作就是利用b...原创 2019-09-27 22:19:48 · 224 阅读 · 0 评论 -
论文阅读:DenseBox: UnifyingLandmarkLocalizationwith EndtoEndObjectDetection
文章目录1、论文总述 2、 CNN之前的目标检测的相关工作3、DenseBox In the test4、Ground Truth Generation5、Multi-Level Feature Fusion6、Loss with Mask.7、 Refine with Landmark Localization.8、与其他网络的比较9、关键点示意10、The Averate Presision...原创 2019-09-26 00:02:15 · 1160 阅读 · 0 评论 -
论文阅读:RetinaNet:Focal Loss for Dense Object Detection
1、网络总述 这篇paper看似只是提出了一个Focal loss损失函数,但是这是在深刻分析了one_stage和two_stage检测器的基础上,得出one-stage不如two_stage的本质原因是:anchors的类别不均衡,类别不平衡容易导致分类器训练失败,因为分类可以把所有的样本都分为负样本,照样准确率很高。【注】: 这里的类别不均衡既有正负样本的不均衡,也包括易分类负样本...原创 2019-09-18 23:22:01 · 458 阅读 · 0 评论 -
论文阅读:OHEM:Training Region-based Object Detectors with Online Hard Example Mining
1、OHEM算法总述 这篇论文针对基于region的目标检测网络中容易出现的正负样本不均衡问题,提出了一个在线困难样本挖掘的算法,这个算法比RCNN和Fast RCNN中的hard negative mining方法效果要好,论文中有数据对比,算法具体流程如下:先计算出feature map,然后上面的那个readonly ROI网络对选中的B个roi进行前向计算并且计算出每个Roi的损失...原创 2019-09-12 21:32:10 · 387 阅读 · 0 评论