论文阅读
zjjszj
Custom
展开
-
Faster-RCNN
1 过程之前看过该篇论文但是理解不太深刻,如今结合代码看理解的更深一层。急忙做下记录以备日后复习。分为七个部分:Backbone、RPNHead、RPNOutput、RPNTopProposals、RoiHead、PostProcess_Detection。Backbone用于抽取图像特征,如Resnet50-FPN。PRNHead将抽取的特征图分别经过两个卷积用于二分类和回归,形状分别为:(N,1∗num_anchors,H,W)(N, 1*num\_anchors, H, W )(N,1∗原创 2020-08-13 21:39:12 · 131 阅读 · 0 评论 -
YOLOV4
这篇论文的创新点很少,目的是在提高准确率的同时保证运行速度,同时为了每个人都可以运行出相同的结果,试验条件选用的是单GPU(1080Ti、V100GPU等)。论文使用各种技术以提高试验结果,是在YOLOV3上的改进。论文列出了在数据增强、激活函数等方面的各种技术然后做实验做对比。技术如下:分类:backbone CSPResNeXt-50()、 CSPDarknet-53 ()。数据增强:MixUp()、CutMix()、Mosaic()、Bluring()。正则化:label smoothing原创 2020-06-24 22:54:42 · 314 阅读 · 0 评论 -
何凯明初权重始化
本文为Xavier的姊妹篇,论文名称:Delving deep into rectifiers: Surpassing human-level performance on ImageNet classification,2015年一篇期刊。论文的贡献有两个:因为Xavier限制激活函数为线性的,因此并不适用Relu激活函数,因为提出一种新的初始化方式。提出基于LRelu的激活函数,PRelu。1 初始化参照了Xavier论文的思想,该论文的思想是前向传播时保证每层激活函数的输入的方差相等,反向原创 2020-05-26 22:59:24 · 1181 阅读 · 0 评论 -
Xavier
正确的权重初始化有利于网络收敛,权重初始化的目的是防止激活值饱导致梯度不能传播。本篇文章介绍两种权重初始化方式:Xavier和hekaiming。1 Xavier初始化Xavier初始化是2010年由Xavier提出来的,论文名称是Understanding the difficulty of training deep feedforward neural networks。这篇文章假设激活函数有如下性质:当激活函数是线性激活函数。满足f′(0)=1f'(0)=1f′(0)=1。激活函数关于原原创 2020-05-26 18:28:51 · 760 阅读 · 0 评论 -
YOLO1-3
0 引言Yolov1(You Only Look Once: Unified, Real-Time Object Detection)是2015年。Yolov2(YOLO9000: Better, Faster, Stronger)是2016年文章。Yolov3(YOLOv3: An Incremental Improvement)是2018年文章。Yolo是一个集其他网络优点于一身的检测...原创 2020-04-25 18:29:42 · 553 阅读 · 0 评论 -
Spatial Transformer Networks论文
0 引言该论文是2015年发表在nips会议上的一篇文章,提出spatial transformer结构,可以改变输入特征图中某一对象的大小、形状。可用于基于注意力机制的网络。可以在CNN中的任意位置插入任意多个spatial transformer。1 背景卷积神经网络中最大池化支持对象发生微小变动的空间不变性(平移、旋转等),然而当对象发生比较大的变换时,就不支持空间不变性,因此作者提出...原创 2020-04-19 17:45:50 · 226 阅读 · 0 评论 -
DropBlock: A regularization method for convolutional networks论文
1、引言该篇论文是谷歌大脑2018年发表于NIPS的一篇防止过拟合并提高精度的论文。借鉴了dropout思想,dropout在全连接层随机drop一些神经元,论文认为使用同样方法用于卷积层效果并不会好因为卷积层的神经元在空间上和附近的神经元相关联,因此丢失的信息仍会传到下层当中,网络仍会发生拟合。论文提出一种结构化的drop块(dropblock)来解决该问题。2、DropBlock构造方法...原创 2020-04-06 22:16:11 · 326 阅读 · 0 评论 -
RetinaNet论文
1、引入摘要:本文是2017年何凯明 ICCV最佳学生论文奖。论文认为单阶段目标检测低于两阶段的原因是正负样本不均衡,为了降低影响,提出focal loss损失函以及检测网络结构,提升了性能。优点:无论是精度还是速度都是全面超越。创新点:提出focal loss损失函苏。提出目标检测网络结构。可以用于多标签分类(损失函数使用的是binary_cross_entropy_with_lo...原创 2020-04-04 18:47:06 · 473 阅读 · 0 评论 -
AlignedReID论文
一、引入介绍: 2017年的一篇行人重识别的论文。提出一种基于动态规划算法的行人对齐方法再使用其他技巧(三元组损失函数联合交叉熵损失函数、相互学习方式、重排序)取得了当前最佳,测试时只需要使用全局分支特征。创新点: 提出基于动态规划算法对齐行人。优点: 动态规划算法不需要训练不用调参。缺点: 算局部距离时,未对齐的距离值也计算在内。二、网络结构分为两个分支:全局和局部分支。三、损失函...原创 2020-03-15 00:11:29 · 303 阅读 · 0 评论 -
CornerNet论文
一、引入cornernet思想来源于人体姿态评估,与前人研究不同,不使用anchor,而是使用关键点检测(左上角和右下角),是单阶段检测器。1创新点(2)1.1第一个使用关键点作为检测的方法。1.2提出corner pooling layers因为有的图像的边框角附近的局部信息太少,使用cornerpoolinglayers能更好的定位。2优点2.1 使用修...原创 2020-03-11 20:15:21 · 204 阅读 · 0 评论