![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
语义分割
文章平均质量分 64
计算机视觉领域文章阅读,挖掘论文中的创新点,再起启航。
浪子私房菜
这个作者很懒,什么都没留下…
展开
-
语义分割之模型预测(inference)
小尺寸图像输入一般的图像无需裁剪,便可输入模型,进行端到端的训练。它的预测过程也是比较简单的,以二分类为例,将模型输出的概率图通过一定的方法转化为二值图。有两种方法可实现上述过程,其一,若类别数包括背景类,利用argmax输出各维度相同位置处最大值,其二,若类别数不包括背景类,则利用sigmoid压缩其值至0-1之间,利用阈值法,一般为0.5,大于0.5为正类,小于0.5为背景类。net = torch.load('./model.pth', map_location=lambda storage, l原创 2021-08-02 14:15:14 · 1544 阅读 · 0 评论 -
Datawhale 语义分割城市建筑识别(二)
针对比赛中用到的图像预处理方法和模型损失函数进行总结。数据扩增,评价与损失函数Part 1 数据读取与数据扩增Pillow只提供最基础的数字图像处理,功能有限,但很方便轻巧Scikit-image是基于scipy的一款图像处理包,功能也很强大OpenCV是一个非常全面的图像处理、计算机视觉库,功能全面强大Pillow读入的图片是img类,其他库读进来的图片都是numpy 矩阵OpenCV读入的彩色图像通道顺序是BGR,其他图像库读入彩色图像都是RGB顺序存储数据扩增是一种有效的正则化方原创 2021-04-16 15:18:54 · 496 阅读 · 1 评论 -
Datawhale 语义分割地标建筑物识别(一)
本人对前段时间的比赛做个小总结,方便后续回顾学习一、赛题介绍赛题分享安排:Task1:赛题理解及baselineTask2:数据增广方法Task3:网络模型结构发展Task4:评价函数及损失函数Task5:模型训练与验证Task6:分割模型模型集成竞赛主题:以计算机视觉为背景,要求选手使用给定的航拍图像训练模型并完成地表建筑物识别任务,是一个典型的语义分割问题。竞赛目标:通过对本次竞赛内容的学习和练习,掌握计算机视觉中语义分割基本技能,提高数据建模能力赛题数据:本赛题使用航原创 2021-04-16 14:42:29 · 762 阅读 · 0 评论 -
LovaszSoftmax损失函数(pytorch版)
转载:https://blog.csdn.net/gbz3300255/article/details/108140850原创 2021-04-12 08:35:58 · 1654 阅读 · 0 评论 -
语义分割中类别信息不平衡处理策略
原创 2021-04-08 15:21:45 · 886 阅读 · 0 评论 -
目标检测:AugFPN--->FPN
[论文名字] AugFPN: Improving Multi-scale Feature Learning for Object Detection论文中提出了AugFPN,用于解决FPN中存在的一些缺陷1. 摘要1.1 现存问题目前大多数的目标检测器都使用了特征金字塔模式,去检测多种尺度的目标,其中,FPN就是一个代表性的结构。但是,FPN中存在很多的一些缺陷,限制了多尺度特征的充分利用。1.2 解决方法这篇paper中,提出了一个新的特征金字塔结构,命名为AugFPN,用来解决FPN存原创 2021-03-19 08:36:39 · 830 阅读 · 0 评论 -
分割--语义与实例
目前的分割任务主要有两种:(1)像素级别的语义分割(2)实例分割顾名思义,像素级别的语义分割,对图像中的每个像素都划分出对应的类别,即实现像素级别的分类;而类的具体对象,即为实例,那么实例分割不但要进行像素级别的分类,还需在具体的类别基础上区别开不同的实例。...原创 2021-03-16 19:43:34 · 115 阅读 · 0 评论 -
语义分割评价指标mIOU的计算
语义分割评价指标mIOU的计算## 注意事项这是针对重构了的语义分割网络,而不是之前的那个,所以不要询问原来的网络计算miou要怎么做,因为整个文件构架差距过大,建议使用新构架。学习前言算一下语义分割的miou,做好生态链。什么是mIOUMean Intersection over Union(MIoU,均交并比):其是语义分割的标准度量。在了解mIOU之前,首先先了解一下IOU是什么,IOU的英文全称为Intersection over Union,中文简称为交并比,也就是交和并的比值。原创 2021-03-15 16:20:59 · 10636 阅读 · 3 评论 -
语义分割精度提高技巧
借鉴Adaboost的思想,用不同概率分布的训练数据训练一系列弱分类器,并通过投票融合得到强分类器。Adaboost弱分类器1、基本原理Adaboost算法基本原理就是将多个弱分类器进行合理的结合,使其成为一个强分类器。Adaboost采用迭代的思想,每次迭代只训练一个弱分类器,训练好的弱分类器将用于下一次的迭代使用。也就是说,在第N次迭代中,一共就有N个弱分类器,其中N-1个是以前训练好的,其各种参数都不再改变,本次训练第N个分类器。其中弱分类器的关系是第N个弱分类器更可能分对前N-1个弱分类器没原创 2021-03-08 17:31:26 · 2337 阅读 · 0 评论 -
模型中的featuremap增强模块
图像空间金字塔思想在图像处理中被广泛应用,本文主要针对具体的 SPP ,PPM,ASPP和 FPN 结构,以及传统图像处理的SIFT等进行简单的介绍和总结。欢迎各位进行交流学习。【人肉整理,转载请注明出处】1、SPP结构(Spatial Pyramid Pooling)在何恺明2015年《Spatial Pyramid Pooling in Deep ConvolutionalNetworks for Visual Recognition》被提出,改论文主要改进两点:解决了CNN需要输入固定尺寸的图原创 2021-03-06 10:29:54 · 1558 阅读 · 0 评论 -
【论文笔记】Coarse-to-Fine Semantic Segmentation From Image-Level Labels
1、摘要基于深度卷积神经网络的语义分割通常需要很大成本的注释来进行训练,以此来活得很好的性能。 在这篇文章中,研究人员使用对象级标签或者图像级标签进行标注。 文中提出了一种新的递归由粗到细的语义分割框架,该框架仅基于图像级别的类别标签。首先由基于卷积神经网络的无监督前景分割模型生成初始掩码,然后由图模型进行增强。 增强粗掩码被馈送到一个全卷积神经网络中,递归的进行细化。现有的基于图像级别标签的语义分割需要对图像中的每个类别进行标注,但是我们的框架只需要对一副图像进行标签一个,并且可以处理包含多个类别的图原创 2021-03-02 15:42:56 · 1698 阅读 · 0 评论 -
RefineNet: Multi-Path Refinement Networks for High-Resolution Semantic Segmentation
涉及加密,后期整理原创 2020-12-26 15:50:31 · 87 阅读 · 0 评论 -
基于深度敏感空间金字塔池化的 RGBD 语义分割
论文题目:基于深度敏感空间金字塔池化的RGBD语义分割摘要标准的2D卷积核的RGBD语义分割模型多是将深度图作为一个单独的通道,这种特性无法充分挖掘深度信息带来的几何结构信息。 针对这一缺陷,提出了构建深度敏感卷积核和池化层来实现对深度信息的充分挖掘; 并使用深度敏感空间金字塔模块对多尺度信息提取,从而实现对不同尺度物体分割的效果。 采用的数据集为NYU v2 和 SUN RGB-D。正文之前基于传统卷积神经网络的RGBD语义分割对深度信息的利用方式大致可以分为两类:第一类为将深度信息编码为HHA原创 2020-12-25 15:45:47 · 910 阅读 · 1 评论 -
【论文翻译】SSNet: A Simple Dilated Semantic Segmentation Network for Hyperspectral Imagery Classification
【论文题目】SSNet: A Simple Dilated Semantic Segmentation Network for Hyperspectral Imagery Classification摘要基于深度学习的方法在高光谱图像任务中表现出了良好的 性能。然而最近的 方法通常认为HSIC是一个补丁是的图像分类问题, 并通过给像素周围的补丁一个标签来解决它。 再次提出了一个新的分割网络结构, 它可以以端到端的结构直接标记每一个像素。该方法显著提高了训练的效率,较少了一些人工参数。HSIC面临的另一个原创 2020-12-14 17:49:02 · 937 阅读 · 0 评论 -
基于 DeeplabV3+与超像素优化的语义分割
前言针对目前在检测物体边缘部分信息分割效果不佳的问题,使用了基于DeeplabV3+与超像素优化的语义分割算法。本人在先前实践阶段使用的DeepLab ,其使用扩张卷积代替了池化层的来增大感受野,并使用了空间金字塔池化来模型解决了多尺度问题,后面通过阅读文献进一步使用DeepLabV3+分割模型进行实践, 其模型思想通过加入了解码模块解决了在DeepLabV3模型中由特征图直接进行上采样恢复图像原始分辨率问题导致图像边缘信息丢失的问题,并取得了更好的分割结果。思路首先使用DeeplabV3+模型提取原创 2020-12-03 15:51:16 · 2595 阅读 · 11 评论 -
采用双注意力机制的Deeplabv3+算法的遥感影像语义分割(论文)
摘要针对 DeepLabv3+网络在遥感影像上呈现出拟合速度慢,边缘目标分割不精确,大尺度目标分割类内不一致、存在孔洞等缺陷,提出在该网络中引入双注意力机制模块 (Dual Attention Mechanism Module,DAMM),设计并实现了将DAMM结构与ASPP (Atous Spatial Pyramid Pooling) 层串联或并联的2种不同连接方式网络模型 ,串联连接方式中先将特征图送入 DAMM 后,再经过 ASPP结构;并联连接方式中将双注意力机制层与 ASPP层并行连接,网络并原创 2020-11-26 17:08:34 · 10913 阅读 · 102 评论 -
遥感图像中细弱目标分割方法
论文读后感摘要针对现在遥感图像细弱目标分割任务所存在的分割精度低, 收到背景噪声干扰明显等问题, 提出了一种基于Dense-Unet网络和继承学习的改进语义分割的方法, 实现高分辨率遥感图像中细弱目标的分割方法。基本思想首先融合DenseNet思想和U-Net网络结构,提出一种新的Dense-Unet的网络结构,从而可以提取场景中的细小目标,其次为了增强学习能力,使用代价敏感重向量方法, 改进训练时的目标函数, 提升模型在训练过程中的收敛速度和在测试数据上的泛化能力; 最后采用bagging继承学原创 2020-11-26 10:28:25 · 1980 阅读 · 3 评论 -
分割算法DeepLabV3+论文理解及代码分析
前言之前讲了DeepLabV1,V2,V3三个算法,DeepLab系列语义分割还剩下最后一个DeepLabV3+,以后有没有++,+++现在还不清楚,我们先来解读一下这篇论文并分析一下源码吧。论文地址:https://arxiv.org/pdf/1802.02611.pdf背景语义分割主要面临两个问题,第一是物体的多尺度问题,第二是DCNN的多次下采样会造成特征图分辨率变小,导致预测精度降低,边界信息丢失。DeepLab V3设计的ASPP模块较好的解决了第一个问题,而这里要介绍的DeepLabv3+原创 2020-11-24 11:22:59 · 3578 阅读 · 0 评论 -
项目实战 DeepLabV1,V2,V3 Google三大语义分割算法源码解析
前言算法和工程是算法工程师不可缺少的两种能力,之前我介绍了DeepLab V1,V2, V3,但总是感觉少了点什么?只有Paper,没有源码那不相当于是纸上谈兵了,所以今天尝试结合论文的源码来进行仔细的分析这三个算法。等我们分析清楚这三个算法之后,有机会再解析一下DeepLabV3。DeepLab V1源码分析DeepLab V1的算法原理可以看我之前的推文,今天我们解析的DeepLab系列网络模型是在ResNet残差网络模块的基础上结合空洞卷积实现的。对于DeepLab V1, 第一层为普通卷积,s原创 2020-11-24 10:40:26 · 856 阅读 · 1 评论 -
语义分割丨DeepLab系列总结「v1、v2、v3、v3+」
花了点时间梳理了一下DeepLab系列的工作,主要关注每篇工作的背景和贡献,理清它们之间的联系,而实验和部分细节并没有过多介绍,请见谅。DeepLabv1Semantic image segmentation with deep convolutional nets and fully connected CRFs引言DCNN在像素标记存在两个问题:信号下采用和空间不变性(invariance)第一个问题是由于DCNN中重复的最大池化和下采样造成分辨率下降,DeepLabv1通过带孔(atrous原创 2020-11-23 21:54:51 · 928 阅读 · 0 评论 -
U-Net语义分割网络之论文笔记
U-Net: Convolutional Networks for Biomedical Image Segmentation前言U-Net是比较早的使用全卷积网络进行语义分割的算法之一,论文中使用包含压缩路径和扩展路径的对称U形结构在当时非常具有创新性,且一定程度上影响了后面若干个分割网络的设计,该网络的名字也是取自其U形形状。U-Net的实验是一个比较简单的ISBI cell tracking数据集,由于本身的任务比较简单,U-Net紧紧通过30张图片并辅以数据扩充策略便达到非常低的错误率,拿了当原创 2020-11-12 16:57:50 · 1348 阅读 · 1 评论 -
语义分割中的深度学习方法全解:从FCN、SegNet到各代DeepLab
图像语义分割就是机器自动从图像中分割出对象区域,并识别其中的内容。下面将从以下几个方面分别介绍:语义分割的概念、相关解决方法、相关研究的综述。语义分割是什么?语义分割方法在处理图像时,具体到像素级别,也就是说,该方法会将图像中每个像素分配到某个对象类别。下面是一个具体案例。左边为输入图像,右边为经过语义分割后的输出图像。该模型不仅要识别出摩托车和驾驶者,还要标出每个对象的边界。因此,与分类目的不同,相关模型要具有像素级的密集预测能力。目前用于语义分割研究的两个最重要数据集是VOC2012和M原创 2020-11-12 10:30:17 · 778 阅读 · 0 评论 -
GoogleNet 网络结构
GoogleNet 网络结构深度学习模型常常通过增加模型的深度或者宽度来获得更高的性能。本文将就深度学习常见的网络结构进行介绍。GoogLeNet是2014年Christian Szegedy提出的一种全新的深度学习结构,在这之前的AlexNet、VGG等结构都是通过增大网络的深度来获得更好的训练效果,但层数的增加会带来很多负作用,比如overfit、梯度消失、梯度爆炸等。在介绍GoogLeNet之前,先介绍一下两种卷积模型,即 Inception 模型和 Residual (残差)模型是卷积神经网络原创 2020-10-13 10:30:14 · 2041 阅读 · 0 评论 -
SegNet-论文笔记-理解
Segnet: 一种用于图像分割的深度卷积编码-解码架构摘要我们展示了一种新奇的有实践意义的深度全卷积神经网络结构,用于逐个像素的语义分割,并命名为SegNet.核心的可训练的分割引擎包含一个编码网络,和一个对应的解码网络,并跟随着一个像素级别的分类层.编码器网络的架构在拓扑上与VGG16网络中的13个卷积层相同.解码网络的角色是映射低分辨率的编码后的特征图到输入分辨率的特征图.具体地,解码器使用在相应编码器的最大合并步骤中计算的池化索引来执行非线性上采样.这消除了上采样的学习需要.上采样后的图是稀疏的原创 2020-11-01 16:31:53 · 1966 阅读 · 0 评论 -
论文解析AletNet网络
AlexNet论文:《ImageNet Classification with Deep Convolutional Neural Networks》第一个典型的CNN是LeNet5网络结构,但是第一个引起大家注意的网络却是AlexNet,也就是文章《ImageNet Classification with Deep Convolutional Neural Networks》介绍的网络结构。这篇文章的网络是在2012年的ImageNet竞赛中取得冠军的一个模型整理后发表的文章。作者是多伦多大学的Ale原创 2020-10-31 18:00:19 · 931 阅读 · 0 评论 -
VGGNet网络结构学习
前言VGG是Oxford的Visual Geometry Group的组提出的(大家应该能看出VGG名字的由来了)。该网络是在ILSVRC 2014上的相关工作,主要工作是证明了增加网络的深度能够在一定程度上影响网络最终的性能。VGG有两种结构,分别是VGG16和VGG19,两者并没有本质上的区别,只是网络深度不一样。VGGNet网络深度神经网络一般由卷积部分和全连接部分构成。卷积部分一般包含卷积(可以有多个不同尺寸的核级联组成)、池化、Dropout等,其中Dropout层必须放在池化之后。全连接部原创 2020-10-29 15:53:40 · 3162 阅读 · 0 评论 -
语义分割(Semantic Segmentation)之Ways
语义分割(Semantic Segmentation)方法1. 什么是语义分割语义分割是当今计算机视觉领域的关键问题之一。从宏观上看,语义分割是一项高层次的任务,为实现场景的完整理解铺平了道路。场景理解作为一个核心的计算机视觉问题,其重要性在于越来越多的应用程序通过从图像中推断知识来提供营养。其中一些应用包括自动驾驶汽车、人机交互、虚拟现实等,近年来随着深度学习的普及,许多语义分割问题正在采用深层次的结构来解决,最常见的是卷积神经网络,在精度上大大超过了其他方法。以及效率。什么是语义分割?语义分割是原创 2020-10-27 23:08:26 · 3234 阅读 · 0 评论 -
论文解析FCN——Semantic Segmentation的开山之作
FCN——Semantic Segmentation的开山之作之论文解析今天介绍一篇图像语义分割的开山之作——FCN(全卷积网络)论文题目:Fully Convolutional Networks for Semantic Segmentation论文地址: https://arxiv.org/abs/1411.4038这是一篇发表在2015 CVPR上的一篇论文,拿到了当年的best paper honorable mention如果你会分类网络,那么分割网络你也就会很快明白了,因为分类网络是把原创 2020-10-27 09:43:08 · 833 阅读 · 1 评论 -
深度学习之图像分割
CNN图像语义分割基本上是这个套路:1、下采样+上采样 : Convolution + Deconvolution /Resize2、 多尺度特征融合: 特征逐点相加 /特征channel维度拼接3、 获得像素级别的segement map :每一个像素点进行判断类别即使是更复杂的DeepLab v3+ 依然也是这种思路Image Segementation (图像分割) 网络结构比较Image Segmentation(图像分割)族谱FCN DeepLab DeconvNet原创 2020-10-20 17:59:41 · 2292 阅读 · 0 评论