![](https://img-blog.csdnimg.cn/20201014180756738.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
实例分割论文笔记
文章平均质量分 89
Tianchao龙虾
这个作者很懒,什么都没留下…
展开
-
TopFormer: Token Pyramid Transformer for Mobile Semantic Segmentation 论文笔记
TopFormer: Token Pyramid Transformer for Mobile Semantic Segmentation论文链接: https://arxiv.org/abs/2204.05525一、 Problem Statement是否能够设计出一个mobile-friendly Vision-Transformer的网络,能够比mobileNets有更低的延迟性,但能有更好的性能。二、 Direction结合MobileNet和vision transformer。三、原创 2022-04-23 17:28:17 · 3674 阅读 · 0 评论 -
K-Net 论文笔记
K-Net: Towards Unified Image Segmentation K-Net NeurIPS2021论文链接: https://arxiv.org/abs/2106.14855一、 Problem Statement目前的语义分割方法直接学习一系列的预定好类别的卷积核(semantic kernels),然后使用这些卷积核进行像素分类。然而,鉴于图像中实例数量的变化,将这一概念扩展到实例分割并非易事。在语义分割中,每个卷积核负责查找图像中相似类别的所有像素。而在实例分割中,每个像原创 2021-11-16 16:01:06 · 5204 阅读 · 0 评论 -
UPSNet 论文笔记
UPSNet: A Unified Panoptic Segmentation Network UPSNet CVPR2019 论文链接: https://arxiv.org/abs/1901.03784一、 Problem Statement目前很多网络都是利用实例分割和语义分割,进行后处理后得到全景分割的效果,因此作者提出一个统一的网络解决全景分割问题。Motivation: Since both tasks aim at understanding the visual scene at t原创 2021-11-12 09:37:22 · 631 阅读 · 0 评论 -
Panoptic Feature Pyramid Networks 论文笔记
Panoptic Feature Pyramid Networks CVPR 2019 论文链接: https://arxiv.org/abs/1901.02446一、 Problem Statement提出一个Panoptic Segmentation的baseline。目前的全景分割都是使用不同的网络进行实例分割和语义分割,并不够高效。二、 Direction使用一个统一的网络结构去实现两个任务,实例分割和语义分割,进一步实现全景分割。因此作者在基于FPN和Mask R-CNN,添加了一原创 2021-11-02 09:29:48 · 210 阅读 · 0 评论 -
Panoptic SegFormer 论文笔记
Panoptic SegFormer Panoptic SegFormer 论文链接: https://arxiv.org/abs/2109.03814一、 Problem Statement拓展Deformable DETR,用于全景分割。二、 Direction全景分割的目标有两种: things 和 stuff。Things是可数的,比如说人、车、单车等;Stuff是无固定形状的和不可数的,比如天空,绿化带等。这两种的区别会导致使用不同的方法去进行预测。因此作者作出了以下设计:设计统原创 2021-10-23 17:01:03 · 995 阅读 · 0 评论 -
YOLOP 论文笔记
YOLOP: You Only Look Once for Panoptic Driving Perception YOLOP 论文链接: https://arxiv.org/abs/2108.11250v5一、 Problem Statement自动驾驶中,如果使用一个接一个模型来进行图像分析,比如目标检测,语义分割和车道线检测,会增大消耗资源,也有可能无法达到实时性能。二、 Direction提出一个通用范式: one encoder backbone + three prediction原创 2021-10-18 10:30:58 · 767 阅读 · 0 评论 -
Segformer 论文笔记
SegFormer: Simple and Efficient Design for Semantic Segmentation with Transformers SegFormer 论文链接: https://arxiv.org/abs/2105.15203代码链接: https://github.com/NVlabs/SegFormerDemo链接: https://www.bilibili.com/video/BV1MV41147Ko/一、 Problem StatementSETR原创 2021-09-22 13:32:56 · 4490 阅读 · 3 评论 -
SETR 论文笔记
Rethinking Semantic Segmentation from a Sequence-to-Sequence Perspective with Transformers SETR 论文链接: https://arxiv.org/abs/2012.15840一、 Problem Statement传统的CNN网络在语义分割方面通常是encoder-decoder结构,通过encoder逐渐降低分辨率的大小,增大感知域来获取特征信息。而decoder用于对encoder生成的特征表示进行像素原创 2021-09-08 16:54:18 · 1398 阅读 · 0 评论 -
U-Net 论文笔记
U-Net: Convolutional Networks for Biomedical Image Segmentation U-net 论文链接: https://arxiv.org/abs/1505.04597一、 Problem Statement主要是医疗图像分割。二、 Direction构建一个收缩路径和扩张路径的网络----U-net。三、 Method网络结构图如下:整个网络拥有23个网络层,分别由两个部分组成:Contracting path: 两个3x3 conv原创 2021-08-20 14:35:37 · 148 阅读 · 0 评论 -
DeepLab V3++ 论文笔记
Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmentation DeepLab v3++ 论文链接: https://arxiv.org/abs/1802.02611DeepLab v1 论文笔记DeepLab v2 论文笔记DeepLab v3 论文笔记一、 Problem Statement作者认为SPP结构可以有效的提取multi-scale contextual information,原创 2021-08-17 15:04:19 · 435 阅读 · 0 评论 -
DeepLab V3 论文笔记
Rethinking Atrous Convolution for Semantic Image SegmentationDeeplab v3论文链接: https://arxiv.org/abs/1706.05587一、 Problem Statement图像语义分割有三个挑战:下降的分辨率目标的多尺度localization的精度对Deeplab V2进行改进。提出了cascade和paralle的多尺度特征提取方法消除了条件随机场CRF二、 DirectionCasc原创 2021-08-16 16:24:52 · 264 阅读 · 0 评论 -
DeepLab V2 论文笔记
DeepLab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFsDeeplab v2论文链接: https://arxiv.org/abs/1606.00915一、 Problem Statement图像语义分割有三个挑战:下降的分辨率目标的多尺度localization的精度对Deeplab V1 进行改进。把VGG-16改为原创 2021-08-13 14:59:41 · 297 阅读 · 0 评论 -
DeepLab V1 论文笔记
SEMANTIC IMAGE SEGMENTATION WITH DEEP CONVOLUTIONAL NETS AND FULLY CONNECTED CRFSDeeplab V1论文链接: https://arxiv.org/abs/1709.01507一、 Problem StatementCNN能够很好的处理图像分类的问题,因为具有很好的平移不变性(invariance)。但是对于处理目标分割问题,定位的能力就比较差,它们更需要准确的位置信息。主要是由两个问题所造成的:signal d原创 2021-08-11 16:25:53 · 182 阅读 · 0 评论 -
SOLOv2: Dynamic and Fast Instance Segmentation 论文笔记
SOLOv2: Dynamic and Fast Instance Segmentation论文链接: https://arxiv.org/abs/2003.10152一、 Problem StatementSOLO v1 有三个bottlenecks限制了其性能:inefficient mask representation and learning。not high enough resolution for finer mask prediction。slow mask NMS。详细原创 2021-07-28 20:16:07 · 1052 阅读 · 0 评论 -
SOLO: Segmenting Objects by Locations 论文笔记
SOLO: Segmenting Objects by Locations论文链接: https://arxiv.org/abs/1912.04488 (ECCV 2020)一、 Problem StatementTop-down (detect-then-segment) 和 bottom-up 范式进行的实例分割并不是很直接简单。作者认为语义分割,其实就是逐像素的语义类别分类:预测每个像素所在的物体的语义类别。类比下来,是不是可以进行逐像素的实例类别分类:预测每个像素所在的物体的实例类别。 因此原创 2021-07-28 19:41:03 · 407 阅读 · 0 评论 -
Path Aggregation Network for Instance Segmentation 论文笔记
Path Aggregation Network for Instance Segmentation论文链接: https://arxiv.org/abs/1803.01534一、Problem StatementCOCO2017实例分割挑战赛的冠军。作者认为Mask-RCNN的信息传递可以更进一步,特别是低层次的特征有助于大实例的识别。但是,对于低层次的特征传递有很长的一个路径,增加了精确定位信息的难度。还有一个问题就是,每一个proposal是基于特定的特征层级预测出来的,从其他层级丢弃的信原创 2021-05-07 08:05:04 · 272 阅读 · 0 评论 -
ConInst: Conditional Convolutions for Instance Segmentation 论文笔记
Conditional Convolutions for Instance Segmentation论文链接: https://arxiv.org/abs/2003.05664一、 Problem Statement目前主流的实例分割算法是Mask-RCNN,依赖于ROI(ROI Pool或者ROI Align)获取最后的masks。然而,ROI-based的方法有以下缺点:ROIs 通常都是 axis-aligned的包围框,对于不规则形状的目标,它们可能包含大量不相关的图像内容,如背景或者其他原创 2021-04-28 08:06:35 · 867 阅读 · 0 评论 -
BoxInst: High-Performance Instance Segmentation with Box Annotations 论文笔记
BoxInst: High-Performance Instance Segmentation with Box Annotations论文链接: https://arxiv.org/abs/2012.02310一、 Problem Statement实例分割是像素级的标注,耗时耗力。能否只使用Bounding box的标注来进行实例分割呢?二、 Direction重新设计mask的loss function,不修改网络框架。新的一个projection loss来最小化预测的mask和gro原创 2021-04-26 08:09:03 · 471 阅读 · 0 评论 -
Mask-RCNN 论文笔记
Mask R-CNN论文链接: https://arxiv.org/abs/1703.06870一、Problem Statement一个同时可以做目标检测和实例分割的简单,灵活,快速的模型。二、Direction基于Faster R-CNN进行改进,添加多了一个分支用于对每个RoI进行掩膜分割,同时仍然包含bounding box的回归分类。也就是网络结构包含两个分支:mask branchmask branch 主要是对每一个RoI使用一个小型的FCN。regression/class原创 2021-04-23 08:14:40 · 131 阅读 · 0 评论 -
YOLACT++ Better Real-time Instance Segmentation 论文笔记
YOLACT++ Better Real-time Instance Segmentation论文链接: https://arxiv.org/abs/1912.06218一、 Problem Statement提升YOLACT性能的方法。可以从下图看到提升了不少。二、 Directionbackbone加入了deformable convolutions更好地anchor scales 和 aspect ratios添加多了一个fast mask re-scoring 分支三、 Met原创 2021-04-20 08:09:33 · 378 阅读 · 0 评论 -
YOLACT: Real-time Instance Segmentation 论文笔记
YOLACT: Real-time Instance Segmentation论文链接: https://arxiv.org/abs/1904.02689一、 Problem Statement大多数实例分割模型主要关注的是性能,比较少关注速度。发布在[ICCV 2019]二、 Direction提出一个新的one-stage的实例分割模型 YOLACT。YOLACT把实例分割分成了两个平行的任务产生一系列的prototype masks。预测 每个实例的 mask coefficient原创 2021-04-19 08:19:07 · 286 阅读 · 0 评论