论文阅读
文章平均质量分 93
海南1506
这个作者很懒,什么都没留下…
展开
-
E2EC:An End-to-End Contour-based Method for High-quality High-Speed Instance Segmentation CVPR2022解读
文章目录引言引言实例分割目前的流行方法:先检测,在对检测框进行分割:Mask RCNN;PANet优点:精度高缺点:效率低下单阶段Mask方法:YOLACT;BlendMask;TensorMask;CenterMask优点:单阶段检测器,效率比之前两种稍高缺点:消耗大量存储,需要昂贵的后处理,很难实时执行,边界质量差基于轮廓的方法:Curve GCN;Deep Snake;Point-Set Anchors;DANCE;PolarMask;LSNet优点:基于轮廓的方法原创 2022-03-23 16:07:17 · 1388 阅读 · 1 评论 -
Few-Shot Object Detection with Attention-RPN and Multi-Relation Detector论文解读
文章目录摘要介绍相关工作FSOD-一个高度多样化的小样本目标检测数据集摘要提出注意力RPN,多关系检测器和对比训练策略提出新的数据集,包含1000个类,数据集链接https://github.com/fanq15/Few-Shot-Object-Detection-Dataset.介绍作者认为在新颖类上检测效果不好主要是由于在RPN分类中可能会错过新颖类的实例框(我的理解是新颖类的框置信度偏低,容易识别为背景类导致删除)另外,最近的工作需要在新颖类上进行微调,不能直接用于新颖类。作者的第原创 2022-03-23 15:07:54 · 286 阅读 · 0 评论 -
Swin Transformer: Hierarchical Vision Transformer using Shifted Windows论文解读
文章目录引言方法总体架构基于移动窗口的自我注意机制结构变化实验本篇博客参考外部链接目前在计算机视觉领域能够通用的Transformer骨干网络,而且在分类,检测,分割上都有着不俗的表现引言作者的目的:就网络结构而言,CNN在计算机视觉上处于统治地位,Transformer在NLP上处于统治地位,作者想扩展Transformer在计算机视觉上比肩CNN,使其能够作为计算机视觉各种任务通用的骨干。两个挑战:规模(scale):与word token在transformer中作为基本处理元素不同原创 2022-03-17 17:35:17 · 276 阅读 · 0 评论 -
Scaling Up Your Kernels to 31x31: Revisiting Large Kernel Design in CNNs
文章目录摘要介绍使用大卷积的指南在深度卷积中使用大核shotcut的使用用小内核重新参数化[29]有助于弥补优化问题对比提升ImageNet分类效果,大型卷积更能提升下游任务的效果大型内核(eg.,13×13)即使是在小的特征地图(eg.,7×7)RepLKNet:一个大型内核体系结构体系结构规范使大的内核甚至更大ImageNet分类语义分割目标检测讨论大核cnn比深度小核模型大核模型更类似于人类的形状偏差密集的卷积vs稀释的卷积限制结论前言:只是粗读,仅作记录用,大段都是全文翻译来的,挺不准确的,但大原创 2022-03-15 17:14:22 · 4690 阅读 · 0 评论 -
Bag of Tricks for Image Classification with Convolutional Neural Networks论文阅读--ResNet-D
Bag of Tricks for Image Classification with Convolutional Neural Networks论文下载目录Bag of Tricks for Image Classification with Convolutional Neural Networks1.介绍2.训练过程baseline 训练过程baseline 验证过程baseline 其他说明baseline 实验结果3.有效训练方法大batch 训练低精度训练实验结果4.模型调整ResNet 架原创 2021-08-16 17:28:01 · 343 阅读 · 1 评论 -
Cross-domain Object Detection through Coarse-to-Fine Feature Adaptation-CVPR2020代码阅读
继论文之后,开始读代码本文主要集中于两个模块的代码推荐先阅读论文,否则这篇文章理解起来可能有些困难Cross-domain Object Detection through Coarse-to-Fine Feature Adaptation-CVPR2020论文阅读代码阅读ART模块在train.py中的train方法中调用了source_forward和target_forward,两个方法都有类似如下的代码:gt_pooled_feat, gt_labels, rois, cls_pr原创 2021-07-29 21:15:52 · 345 阅读 · 2 评论 -
Cross-domain Object Detection through Coarse-to-Fine Feature Adaptation-CVPR2020论文阅读
域迁移论文阅读Cross-domain Object Detection through Coarse-to-Fine Feature Adaptation(CVPR2020)两段对齐粗粒度的ART对齐(注意力,对抗)细粒度的PSA对齐(原型)简介在目标检测中,有很多不同类型的目标物,每种目标物都有它自己的分布,但是目前的方法都把不同物体的分布当作一个整体来进行域适应,留下了改进空间前景类在不同域中有着更多的共同特征,所以用注意力来凸显前景类,也就是ART,ART一一种类别不可知的粗糙原创 2021-07-27 20:29:36 · 479 阅读 · 0 评论