论文笔记
文章平均质量分 93
Meringue_zz
感觉快要走上程序猿的不归路了。。。
展开
-
目标定位与检测系列(16):FCOS
文章目录摘要动机FCOS检测框架整体框架FPN用于FCOSCenter-ness用于FCOS实验结果总结总结摘要我们提出了一个全卷积一阶段目标检测框架,以类似于实例分割的逐像素预测方式来解决目标检测问题。目前几乎所有顶尖的目标检测框架(如RetinaNet,SSD,YOLOv3,Faster R-CNN等)都依赖于预定义的锚框。相反,我们提出的FCOS目标检测框架不需要锚框,当然也不需要候选框。由于移除了大量预定义的锚框,FCOS避免了大量关于锚框的复杂运算,如训练过程中计算框的重叠程度。更重要的是,F原创 2021-01-19 22:39:25 · 532 阅读 · 0 评论 -
论文笔记:再看ResNet——ResNet典型网络结构
前言第一次看ResNet论文的时候,由于刚接触深度学习不久,对ResNet的理解仅仅停留在论文中阐述的一些基本思想。加上当时实验室的硬件条件很有限,用的模型基本上以AlexNet和VGG为主,并没有在学习中使用过ResNet。因此忽略了论文中提出的几种典型ResNet网络。一直到工作后,才发现ResNet的几种典型结构在诸多计算机视觉任务中都充当着非常重要的角色,因此很有必要更细致地了解一下ResNet的经典网络。若是刚接触ResNet,还是建议从最论文开始看起,我自己也写过一遍对于ResNet原理的简单原创 2020-06-11 15:17:04 · 8531 阅读 · 3 评论 -
目标定位与检测系列(15):目标检测常用损失函数
文章目录类别损失Cross Entropy LossFocal Loss位置损失L1 LossL2 LossSmooth L1 LossIoU LossGIoU LossDIoU LossCIoU Loss一般的目标检测模型包含两类损失函数,一类是类别损失(分类),另一类是位置损失(回归)。这两类损失函数往往用于检测模型最后一部分,根据模型输出(类别和位置)和实际标注框(类别和位置)分别计算类别...原创 2020-03-27 14:51:52 · 2871 阅读 · 3 评论 -
目标定位与检测系列(14):Libra R-CNN
论文地址:https://arxiv.org/pdf/1904.02701.pdf摘要相比于模型框架,模型的训练过程对于检测器是否成功也同样重要。在本文工作中,我们重新研究了标准的训练过程,发现检测的性能经常受限于模型训练过程中的不平衡。这种不平衡包括以下3个层面:采样层面、特征层面和目标层面。为了缓和着中国不平嗯带来的不利影响,我们提出了一种简单有效的面向目标检测中的不平衡学习的框架,即Li...原创 2019-12-09 22:40:19 · 928 阅读 · 0 评论 -
目标定位与检测系列(13):TridentNet
摘要尺度变化是目标检测领域中的重要挑战之一。在本文工作中,我们做实验研究了目标检测中感受野对于尺度变化的影响。基于这些实验结论,我们提出了一种新颖的三叉戟网络(TridentNet),旨在生成特定大小的特征图。我们构建了一个多支路并行的网络结构,每个分支共享参数但感受野不同。之后对于每一条分支,我们将目标采样到合适的尺寸用于训练。我们还提出了一个快速版的TridentNet(置用一条支路进行推理...原创 2019-11-03 22:59:17 · 631 阅读 · 0 评论 -
目标定位与检测系列(12):RetinaNet
摘要目前目标检测任务中精度最高的模型是基于主流的R-CNN框架的二阶段模型,该类方法在一些列目标候选框上进行分类。相对的,一阶段模型直接在大量的可能包含目标的区域进行检测,这样做速度更快但相比于两阶段模型也牺牲了精度,我们在本文工作中分析了这个问题的原因。我们发现训练过程中正负样本(指前景和背景)之间严重的不平衡是主要原因。我们通过修改标准的交叉信息熵损失函数来解决类别之间的不平衡,使得那些被很...原创 2019-10-22 22:42:35 · 1241 阅读 · 0 评论 -
目标定位与检测系列(11):Cascade R-CNN
摘要在目标检测中,使用IOU来定义正负样本。用比较低的IOU阈值(如0.5)训练得到的模型在检测时往往包含噪声。相反地,如果增加IOU阈值,检测性能会下降。产生这种现象的原因有两个:(1)训练过程中正样本的迅速减少导致的过拟合;(2)训练和推理阶段IOU阈值的不匹配。本文提出一个多阶段检测模型Cascade R-CNN来解决上述问题。这个模型由一系列用递增的IOU阈值训练的模型组成,因此对于困难...原创 2019-10-19 14:34:55 · 657 阅读 · 0 评论 -
目标定位与检测系列(10):YOLOv3
论文原文地址:YOLOv3摘要我们针对YOLO提供了一些改进。我们在设计上做出了一些改变让它效果更好。我们也训练了这个相当好的网络。它比之前的网络大一点但是准确率更高。不用担心,它的速度依然很快。在320*320的图片上,YOLOv3可以达到单张图片检测速度22ms、28.2的mAP,和SSD准确率一样但速度是它的3倍。在使用以前的IOU mAP标准上,YOLOv3表现非常好。在一个Titan...原创 2019-05-28 19:38:03 · 2740 阅读 · 0 评论 -
目标定位与检测系列(9):YOLOv2 (YOLO9000)
本文主要介绍YOLOv2部分,最后一部分的YOLO9000看的不是太明白,有兴趣的可以直接看论文原文 。摘要我们在本文介绍YOLO9000,它是目前最好的实时的目标检测系统,可以检测超过9000种目标。首先我们提出一些对YOLO检测方法的改进措施,这些方法都很新颖,是基于前人的工作总结出来的。改进的YOLOv2模型在PASCAL VOC和COCO等标准的检测任务中取得了最好的结果。采用新颖的多...原创 2019-05-28 19:37:52 · 1602 阅读 · 0 评论 -
Faster R-CNN TensorFlow代码笔记(1)--模型测试
本文主要记录在看Faster R-CNNT的TensorFlow实现代码(模型测试部分),源码链接是:Faster-RCNN_TF,为了便于做笔记,我fork过来并添加了自己的注释和一些测试代码(目前只看了测试部分代码)。链接在:https://github.com/ZhouJiaHuan/Faster-RCNN_TF。 后期会不定期更新。本文的思路是从demo.py开始的,它的功能是依次读取本...原创 2018-12-31 12:54:32 · 1973 阅读 · 0 评论 -
目标定位与检测系列(8):You Only Look Once (YOLO)
论文原文链接:摘要我们提出了YOLO网络,它是一种新的目标检测方法。之前方法将目标检测问题转化成分类问题来处理。在这篇文章中,我们把边界框回归和对应的目标分类统一成一个回归问题,即用一个单一的网络直接从一整张图片中预测出边界框和类别概率信息。由于整个检测流程是一个单一网络,它可以在检测任务上端到端地训练。我们的检测框架非常快。我们的基本YOLO模型处理图片的速度可以达到每秒45帧的实时...原创 2019-05-28 19:37:39 · 1159 阅读 · 0 评论 -
目标定位和检测系列(7):Faster R-CNN
论文原文链接:https://arxiv.org/abs/1506.01497虽然网上已经有一大堆优秀的博客介绍了Faster R-CNN,但还是希望自己也写一遍,加深理解。摘要最先进的目标检测网络基于候选区域算法来生成候选目标位置。像SPP-net和Fast R–CNN这样先进的模型已经减少了目标检测网络的运行时间,也暴露出候选区域的计算(速度)是一个瓶颈。本文介绍一种候选区域网...原创 2019-05-28 19:37:25 · 1351 阅读 · 0 评论 -
目标定位和检测系列(6):Fast R-CNN
论文原文:Fast R-CNNFast R-CNN是在R-CNN的基础上借鉴了SPP-net的一些优点改进得到的。整体的框架和R-CNN相似。摘要本文提出了R-CNN的一个快速版本(Fast R-CNN)用于目标检测。Fast R-CNN建立在之前工作的基础上,用深层卷积网络对目标区域快速分类。和之前的工作相比,Fast R-CNN采用了一些创新,使得在提高检测精度的同时也提高了训...原创 2019-05-28 19:37:08 · 1141 阅读 · 0 评论 -
目标定位和检测系列(5):综述性文章汇总
从RCNN到SSD,这应该是最全的一份目标检测算法盘点深度学习目标检测模型全面综述:Faster R-CNN、R-FCN和SSD深度学习目标检测概览干货 | 物体检测算法全概述:从传统检测方法到深度神经网络框架基于深度学习的「目标检测」算法综述综述:深度学习时代的目标检测算法...原创 2019-05-28 19:36:54 · 1475 阅读 · 0 评论 -
目标定位和检测系列(4): 金字塔池化 (SPP-net)
论文原文链接:Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition虽然这篇文章的标题说是将金字塔池化用在目标识别上的。但是文章最后将它进一步用在了目标检测任务上,很好地解决了R-CNN方法在目标检测上的部分问题,最终也取得了不错的效果。所以也很有必要好好学习一下这篇论文。摘要现有...原创 2019-05-28 19:36:39 · 1334 阅读 · 0 评论 -
论文笔记:Spatial Transformer Networks中的仿射变换和双线性插值
最近在看Google的Spatial Transformer Networks,脑洞又一次 大开,故打算将学的一点东西记录在这里,本篇博文是学习Spatial Transformer Networks (STN)的基础,主要介绍仿射变换和双线性插值。内容主要参考了Kevin Zakka的博客。原创 2017-07-14 16:48:23 · 4427 阅读 · 4 评论 -
论文笔记:Spatial Transformer Networks(空间变换网络)
上一篇博客 Spatial Transformer Networks论文笔记(一)——仿射变换和双线性插值介绍了仿射变换和双线性插值,为更好地理解STN打基础。本篇博客是记录的是阅读原文Spatial Transformer Networks的一些笔记。原创 2017-07-17 21:18:23 · 11491 阅读 · 5 评论 -
论文笔记:AlexNet模型
基于LeNet模型简单介绍了ConNet的基本构成(卷积层、池化层、全连接层等),该模型对手写数字的识别具有较高的准确率,但对于大规模的图像分类还远远不够。而本文即将介绍的AlexNet模型,,由Alex Krizhevsky等人设计,在ILSVRC-2012中以15.3%的top-5错误率获得第一名,比第二名的错误率要低10.9%。原创 2017-03-31 14:37:40 · 2999 阅读 · 0 评论 -
论文笔记:GoogLenet
论文原文链接:https://arxiv.org/abs/1409.4842摘要本文提出了一种叫做Inception的深度卷积神经网络结构,并在ILSVRC14比赛中的分类和检测任务中取得了最好的成绩。这种结构的主要特点是能够更好地利用网络中的计算资源。通过仔细地设计,我们在增加网络深度和宽度的同时仍然保证了计算成本不变。原创 2017-08-10 14:13:43 · 2788 阅读 · 0 评论 -
论文笔记:Notes on Convolutional Neural Networks
最近开始接触深度学习(deep learning),看了一些卷积神经网络(CNN: convolutional neural network)的文献,并在LINUX系统下配置好了Caffe平台,在此整理一下对卷积神经网络的一些初步理解。原创 2017-02-23 14:24:50 · 3109 阅读 · 0 评论 -
论文笔记:Batch Normalization
论文原文链接:https://arxiv.org/abs/1502.03167深度神经网络训练过程中前面层参数的变化会导致每一层输入分布发生改变,这使得网络训练变得复杂。这个问题还使得网络需要以较低的学习率和仔细的参数初始化,从而降低了训练速度,同时当采用饱和非线性激活函数时网络训练变得异常复杂。我们将这种现象叫做internal convariate shift,并且通过标准化每一原创 2017-09-05 21:07:14 · 959 阅读 · 0 评论 -
论文笔记:Deep Residual Network
越深的网络越难训练。我们提供了一个残差学习框架来简化网络训练过程,这个网络比之前所用的网络要深得多。该网络能够根据输入学习残差函数而不是原始函数。本文提供了全面的实例来表明这些残差网络更容易优化并且可以从更深的网络中获得更高的准确率。原创 2018-01-02 15:20:01 · 2501 阅读 · 0 评论 -
BP神经网络:误差反向传播公式的简单推导
最近看了一下BP神经网络(Backpropagation Neural Networks),发现很多资料对于BP神经网络的讲解注重原理,而对于反向传播公式的推导介绍的比较简略,故自己根据《PATTERN RECOGNITION AND MACHINE LEARNING》这本书的思路推导了一下反向传播的过程,记录在这里,以便以后看。原创 2017-01-07 17:43:55 · 25309 阅读 · 14 评论 -
目标定位和检测系列(1):一些基本概念
最近开始学习深度学习中的定位和检测任务。本来打算直接看论文,却发现文章中的的很多基本概念都搞不清楚,于是就自己先梳理了一些定位和检测任务的基本概念。(内容主要来自斯坦福大学的CS231课程、吴恩达的deeplearning.ai卷积部分,这两门课程都可以在网易云课堂里找到汉化版)识别、定位、检测和分割识别和定位:针对单个目标的任务,识别就是给定一张图片,要让计算机告诉你图片中是什么。而原创 2018-01-23 16:16:48 · 11912 阅读 · 0 评论 -
目标定位和检测系列(3):交并比(IOU)和非极大值抑制(NMS)的python实现
交并比(Intersection over Union)和非极大值抑制是(Non-Maximum Suppression)是目标检测任务中非常重要的两个概念。例如在用训练好的模型进行测试时,网络会预测出一系列的候选框。这时候我们会用NMS来移除一些多余的候选框。即移除一些IOU值大于某个阈值的框。然后在剩下的候选框中,分别计算与ground truth的IOU值,通常会规定当候选框和ground ...原创 2019-05-28 19:36:24 · 28860 阅读 · 16 评论 -
目标定位和检测系列(2):Region-Based Convolutional Network (R-CNN)
论文原文链接: https://www.ncbi.nlm.nih.gov/pubmed/26656583 R-CNN作为把深度学习用在目标检测任务上的开篇之作,于2014年被CVPR接收。虽然现在看来R-CNN的精度和速度已经略显不足,但文中提出的很多思想,包括后续提出的Fast R-CNN和Faster R-CNN,一直被目标检测领域的论文沿用。摘要目标检测在权威的PASCAL V...原创 2019-05-28 19:36:07 · 4302 阅读 · 0 评论 -
论文笔记:VGG模型
本篇博文主要是阅读Karen Simonyan的论文《VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION》的一些笔记,博文中的图表也均来自论文原文。详细的内容还是看论文的好。。。原创 2017-06-06 23:59:46 · 5954 阅读 · 1 评论