论文笔记系列
文章平均质量分 88
凯明大神的论文笔记有些没有包含在这个专栏
BlackBack_
随缘更新,随缘看私信,谢谢支持;如有急事,发邮件至[email protected]
展开
-
Rethinking ImageNet Pre-training
COCO上进行随机初始化(从零开始)训练,无需任何预训练,就可以达到竞争性目标检测和实例分割的准确性如果:(i)我们使用适当的归一化技术进行优化,(ii)我们对模型进行了足够长的训练,以弥补前训练的不足,没有根本的障碍阻止我们从头开始训练可以从零开始训练大型模型——比ResNet101大4倍——而不会过度拟合(i) ImageNet预训练的加速收敛,特别是在培训(ii) ImageNet预训练不会自动提供更好的正则化(iii)当目标任务/指标对精确定位的空间预测更敏感时,ImageNet的预训练。原创 2024-03-18 21:23:39 · 742 阅读 · 1 评论 -
AlignDet
论文下载https://arxiv.org/pdf/1908.01570.pdf论文代码:代码未开源论文摘要:在所有的单阶段检测器中都存在一个基本问题,即锚盒与卷积特征之间的不对齐,这严重影响了单阶段检测器的性能。在这项工作中,作者揭示了广泛使用的im2col运算符和RolAlign运算符之间的深层联系。在观察两者发挥的作用后,我们提出了一个RolConv算子,在单阶段检测中对齐特征及其相应的锚点。然后,作者设计了一个完全卷积的AlignDet体系结构,它结合了学习锚点的灵活性和对齐..原创 2021-03-07 21:37:11 · 707 阅读 · 1 评论 -
论文笔记——Yolov4
论文下载:https://arxiv.org/pdf/2004.10934v1.pdf论文代码:https://github.com/AlexeyAB/darknet论文摘要:从以往的工作中表明大量的特征可以提高卷积神经网络(CNN)的精度。需要在大数据集上对这些特征组合进行实际测试,并对结果进行理论论证。某些特征只对特定模型和特定问题仅对小规模数据集有效。而一些特征,如批量标准化(batch-normalizetion)和残差连接(residual-connections),适用于..原创 2021-02-27 17:18:37 · 214 阅读 · 0 评论 -
论文笔记——Efficientdet
论文下载:https://arxiv.org/pdf/1911.09070.pdf论文代码:https://github.com/zylo117/Yet-Another-EfficientDet-Pytorch论文摘要:作者提出了一种加权双向特征金字塔网络(BiFPN),该网络能够实现简单、快速的多尺度特征融合;其次,提出了一种复合尺度方法,对所有骨干网、特征网络和盒/类预测网络同时统一尺度分辨率、深度和宽度。基于这些优化和更好的骨干,作者开发了一个新的对象检测器系列,称为Effic..原创 2021-02-22 15:56:16 · 364 阅读 · 0 评论 -
Mask RCNN
论文下载:https://arxiv.org/pdf/1703.06870.pdf论文代码:https://github.com/facebookresearch/Detectron论文摘要:本文提出了一个概念简单、灵活和通用的对象实例分割框架,有效地检测图像中的对象,同时为每个实例生成高质量的分割掩码。这个框架称为Mask R-CNN,由Faster R-CNN扩展,通过增加一个分支来预测一个对象掩模,并与现有的分支来识别边框。Mask R-CNN很容易训练,并且只在Faster ..原创 2021-02-18 21:01:38 · 423 阅读 · 0 评论 -
Faster R-CNN
论文下载:https://arxiv.org/pdf/1506.01497.pdf论文代码:https://github.com/rbgirshick/py-faster-rcnn论文摘要:目前最先进的目标检测网络依赖于区域建议算法(region proposal algorithms)假设目标位置。该论文研究中,引入一种区域建议网络(RPN),RPN与检测网络共享图像的卷积特征。并且RPN是一个全卷积网络,同时预测每个位置的目标框(objects bounds)和目标分数(objec.原创 2021-01-19 15:57:40 · 202 阅读 · 0 评论 -
论文笔记——Sparse R-CNN
论文下载:https://msc.berkeley.edu/research/autonomous-vehicle/sparse_rcnn.pdf论文代码:https://github.com/PeizeSun/SparseR-CNN论文摘要:提出一种纯稀疏(purely sparse)的图像目标检测方法,从图像中提取总长度为N的建议框,用来分类和回归位置,Sparse-RCNN避免对象建议设计(object candidates design)和多到一的标签分配(many-to-o..原创 2020-12-13 10:47:24 · 6520 阅读 · 3 评论 -
论文笔记——CPN(Corner-Proposal-Network)Det
论文下载:https://arxiv.org/pdf/2007.13816.pdf论文代码:https://github.com/Duankaiwen/CPNDet论文摘要:该论文提出一种新型的anchor free两阶段框架,该框架首先通过anchor free方法检测出目标的角关键点(corner keypoint )进行目标建议的组合,然后通过单独的分类阶段(两阶段思想,第一步简单的筛选正负样本,第二步进行每个正样本的类分类)给每个建议分配一个类标签。论文的方法被称为角建议网络..原创 2020-12-06 12:04:12 · 828 阅读 · 0 评论 -
ResNet
作者提到,更深层次的神经网络更难训练,提出一个残差学习框架(residual learning framework)能从大幅度增加的深度获得准确性,且这些残差网络(residual networks)更容易优化。作者在ImageNet数据集上评估高达152层的残差网络复杂性依然很低,尽管它比VGG网深8倍。该网络在2015年的ILSVRC和COCO 竞赛的各项目中均获得第一名。原创 2020-11-13 17:06:25 · 205 阅读 · 0 评论 -
论文笔记——Densely Connected Convolutional Networks(DenseNet)
论文下载:https://arxiv.org/pdf/1608.06993.pdf论文代码:https://github.com/liuzhuang13/DenseNet论文摘要:作者提到,卷积网络在靠近输入的层和靠近输出的层之间包含较短的连接(即输入卷积层的特征和卷积层输出的特征进行整合连接),那么这个网络的训练就可以更深入、更准确、更有效。作者基于这一观察,引入DenseNet(Dense Convolutional Network),以向前传递特征的方式连接每一层和其他的层(a..原创 2020-11-03 16:33:52 · 372 阅读 · 1 评论 -
论文笔记——Comparing to Learn
论文下载:https://arxiv.org/pdf/2007.07423.pdf论文代码:https://github.com/funnyzhou/C2L_MICCAI2020论文摘要:在深度学习时代,预训练模型在医学图像分析中发挥着重要作用,其中ImageNet预训练作为最佳方法被广泛采用。作者也提到,自然图像和医学图像存在着明显的领域差距,比如CT图像和一般的RGB图像。所以作者提出了一种新的预训练方法,称为“比较学习(Comparing to Learn)”,顾名思义它通过比..原创 2020-10-30 15:04:52 · 577 阅读 · 3 评论 -
论文笔记——EfficientNet Rethinking Model Scaling for Convolutional Neural Networks
论文下载:https://arxiv.org/pdf/1905.11946.pdf论文代码:https://github.com/tensorflow/tpu/tree/master/models/official/efficientnet论文摘要:该论文系统地研究了模型缩放,认为细致地平衡网络的深度、宽度和分辨率可以得到更好的性能。在此基础上,作者提出了一种新的尺度划分方法,即利用简单而高效的复合系数(compound coefficient)来均匀地划分深度、宽度、分辨率这三个维..原创 2020-10-25 20:00:07 · 262 阅读 · 0 评论 -
Aggregated Residual Transformations for Deep Neural Networks(ResNeXt)
该论文提出了一个简单、高度模块化的图像分类网络结构。该网络结构是通过重复一个构建块(buildng block)搭建的,这个构建块聚合了一组具有相同拓扑结构(same topology)的转换。这种策略提出了一个新的维度概念,作者称为“基数(cardinality)”,定义为转换维度的大小(the size of the set of transformations),并且是作为一个除了深度和宽度对神经网络必不可少的因素。在ImageNet-IK数据集上,实验表明,即使在维持复杂性的限制条件下,原创 2020-10-24 16:44:24 · 406 阅读 · 0 评论 -
论文笔记——Dilated Residual Networks(DRN)
论文下载:https://arxiv.org/pdf/1705.09914.pdf论文代码:http://vladlen.info/publications/dilated-residual-networks/论文摘要:用于图像分类的卷积网络会逐渐降低图像的分辨率,图像以微小的特征图表现出来,其中原图像场景的空间结构不再可见。这些问题可以通过设置空洞卷积参数(dilation)来缓解,空洞卷积提高了输出特征图的分辨率,而不降低单个卷积核的感受野。作者表明,在不增加模型深度或复杂性的..原创 2020-10-14 21:50:05 · 1026 阅读 · 2 评论 -
论文笔记——Deep Layer Aggregation(DLA)
论文下载:https://arxiv.org/pdf/1707.06484.pdf论文代码:https://github.com/ucbdrive/dla论文摘要:视觉识别需要丰富的表示,跨级别从低到高,范围从小型到大型,分辨率从细到粗。架构方面的工作在网络骨干维度的方面上逐渐有突破,人们都倾向于设计更深或更广的网络架构。但是作者认为如何在网络中最好地聚合层和块值得进一步的探索。在这个思路上,作者提出深层聚合方案(Deep Layer Aggregation),通过更深层次的聚合来增..原创 2020-10-12 20:40:06 · 1288 阅读 · 0 评论 -
论文笔记——ResNeSt :Split-Attention Networks
论文下载:https://arxiv.org/pdf/2004.08955.pdf论文源码:https://github.com/zhanghang1989/ResNeSt论文摘要:一些目标检测和语义分割算法已让使用ResNet(残差网络)的改进架构作为骨干网络(backbone),因为它们的简单和模块化结构。作者展示了一个模块化的分散注意力模块(Split-Attention block),通过堆叠这些模块,构建了新的ResNet改进架构–ResNeSt。作者保留了整个ResNet..原创 2020-10-11 22:19:18 · 650 阅读 · 0 评论 -
论文笔记——Squeeze-and-Excitation Networks(SE-Net)
论文下载:https://arxiv.org/pdf/1709.01507.pdf论文源码:https://github.com/hujie-frank/SENet论文摘要:卷积神经网络(CNNs)的核心构造是卷积操作器(convolution operator),它使网络能够通过在每一层的局部接受域内融合空间和信道信息来构建信息特征。作者通过大量的研究发现,大部分改进的重点是提高整个特征层次的空间编码质量来增强CNN的表征能力。在这项工作中,作者关注的是通道关系,并提出了一个新的结..原创 2020-10-11 16:52:29 · 476 阅读 · 0 评论 -
论文笔记——Stitcher:Feedback-driven Data Provider for Object Detection
论文笔记——Stitcher: Feedback-driven Data Provider for Object Detection论文下载:https://arxiv.org/pdf/2004.12432.pdf论文摘要:代码暂未开源该论文摘要概括:目标检测器的效果是根据物体尺度的不同而不同,在小对象性能上是最不令人满意的。作者通过研究发现,在大多数的训练迭代中,小对象对总损失的贡献很小,导致大小对象优化不平衡,从而导致性能不佳。该论文名充分表达了作者改进的思想,Feedback-dr原创 2020-10-11 09:59:50 · 640 阅读 · 1 评论