mmsegmentation学习
文章平均质量分 58
躺平小能手
这个作者很懒,什么都没留下…
展开
-
MMseg可视化结果分析工具
今天找了一下mmseg里面的结果分析功能,由于在官方文档没有找到所以只能找包含matplotlib的文件,是tools文件下面的analyze_logs.py这个文件,启动的话需要配置一下json_logs参数,即需要进行可视化分析的json文件路径,分析结果如图所示(我的结果太垃圾了)...原创 2022-04-07 21:21:16 · 1679 阅读 · 1 评论 -
MMSegmentation遇到的问题汇总(不断更新)
首先说明一下我的运行环境是在win10下的遇到的第一个问题就是在训练的时候不知道在哪里能运行模型,后来参考mmsegmentation文档才明白该在哪里进行train,具体的train文件是在tools下面的train文件为了方便起见我并没有在命令行配置参数,而是直接修改train文件config我默认的default是我自己根据数据集对原模型进行修改而得到的,当然也可以直接用config里面的模型文件,workdir是输出的log文件路径同时数据集文件里面我用的直接路径,并原创 2022-04-06 12:06:58 · 3000 阅读 · 1 评论 -
DeepLab一家
DeepLab是谷歌为了语义分割又做的一系列工作,在多个开源数据集中都取得了不错的成果,DeepLabv1发表于2014年,后于2016、2017、2018分别提出了V2,V3以及V3+的版本,在mmsegmentation里面主要集成了V3以及V3+的版本,应该也是DeepLab这一家里面效果最好的两个了。作为当前工业以及学术上都用的比较广泛的模型,DeepLab这一家究竟优势在哪里呢,参考mmLab官方的讲解视频,可以发现DeepLab有三宝,分别是:1、使用空洞卷积解决网络下采样的问题原创 2022-04-04 16:37:39 · 4491 阅读 · 0 评论 -
BackBone—Resnet
在介绍之前首先理解一下BackBone的含义。backbone这个单词原意指的是人的脊梁骨,后来引申为支柱,核心的意思。在CV领域,一般先对图像进行特征提取(常见的有vggnet,resnet,因为这些网络对于特征提取的效果比较好),这一部分是整个CV任务的根基,在通过BackBone生成的featmap的基础上再进行语义分割任务,本人觉得可以简单将BackBone理解为encode,对于图像进行特征编码,后面接上不同的encode进行所需任务,简单看了一下目前mmsegmentation里面的Ba原创 2022-04-01 14:19:37 · 5329 阅读 · 0 评论 -
每日二学——Unet
今天总结了一下Unet网络,作为语义分割非常火爆的一篇论文,本文是作者写于2015年,论文链接https://arxiv.org/abs/1505.04597Unet最初提出的初衷是为了解决医学图像分割问题,在模型结构上采用了U型设计这个结构就是先对图片进行卷积和池化,在Unet论文中是池化4次,比方说一开始的图片是224x224的,然后下采样形成112x112,56x56,28x28,14x14四个不同尺寸的特征。然后我们对14x14的特征图做上采样,得到28x28的特征图,这个28x28的特征图原创 2022-03-31 22:01:39 · 1354 阅读 · 0 评论 -
每日一学——FCN
在最近的学习过程中,发现了一个比较好的框架MMCV,在该框架下对于模型参数等进行调整比较方便,由于我目前的主要学习内容是图像语义分割,因此接下来几天我会对于MMSegmentation里面的每一个模型进行学习并且自己尝试手写模型。首先第一个就是语义分割的开山鼻祖——FCN,这是第一个在进行下采样后又上采样的模型,开启了传统的编码器解码器模式,下面是FCN的模型图可以看出FCN对于图像进行下采样到最后, 在上采样的过程中有比较明显的跳跃链接结构,如下图所示其中:FCN32s:从原创 2022-03-31 14:41:45 · 3385 阅读 · 0 评论