![](https://img-blog.csdnimg.cn/20190927151026427.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
语义分割
文章平均质量分 52
主要是语义分割相关的论文以及笔记内容
CUHK-SZ-relu
一只小程序员
展开
-
FCN全连接卷积网络(1)--CNN卷积网络的知识储备
FCN全连接卷积网络 什么是全连接卷积网络 全连接神经网络,是和语义分割相关的,所以我们先要明白什么是语义分割? 语义分割:大定义我们在说语义时都是和文字相关的问题,但是实际上在模式识别当中语义识别主要应用是:让机器实识别出面图像中的不同内容 这里主要是对图中每个内守每一个小部分打一个标签,之后再通过训练让机器帮我们完成这个任务。 为什么使用卷积网络 想要明白全连接卷积网络,我们首先的明白卷积网络 我们首先要理解卷积网络的设计思路: 1.粗略的讲,一个图像中的信息提取,某一块的特征是集中在一部分的。所以应该原创 2021-05-15 23:22:24 · 200 阅读 · 0 评论 -
FCN全连接卷积网络(3)--Fully Convolutional Networks for Semantic Segmentation阅读(摘要部分)
1.摘要 1.1逐句理解一下: Convolutional networks are powerful visual models that yield hierarchies of features. 卷积网络是十分有力的在获得层次特征的图像模型当中。 We show that convolutional networks by themselves, trained end-to-end, pixels-to-pixels, exceed the state-of-the-art in semantic原创 2021-05-17 16:16:51 · 180 阅读 · 0 评论 -
FCN全连接卷积网络(2)--读论文的过程理解
阅读论文的步骤: 首先,理解论文的各部分组成 1.摘要 对论文的高度概括,是论文的门面,在上网找论文的时候大家一般是先看摘要部分。所以,我们写论文的时候,摘要部分也要反复推敲。 2.引言 主要是大方向的研究背景和现状,主要是说明自己模型和别人不一样的地方,也就是创新点。 3.相关工作 介绍的是这个论文当中用到的模块和方法。 4.模型结构 这里是整个文章的核心点,要详细解释自己的模型,要达到的效果就是,让别人拿到之后,看完就可以直接使用代码将其进行复现。并且别人复现的结果要和你论文所说的内容是相一致的,才能说原创 2021-05-17 11:37:38 · 210 阅读 · 0 评论 -
FCN全连接卷积网络(4)--Fully Convolutional Networks for Semantic Segmentation阅读(引言部分)
引言 引言部分翻译 总结 1.卷积网络推动了视觉识别的发展。 2.早前的卷积网络运用当中,将每个像素标记为封闭对象或一个某个类别,这样的做法存在缺点。也就是传统的卷积网络存在缺点。 3.实验证明,端到端的FCN网络在语义分割任务当中超过了现有水平,这是第一个在像素级别且在监督式预训练完成的网络模型。 解释一下语义分割一般在业界会将其和像素级别的学习等同起来,对于每一个像素点判断一下他是什么东西,概率是多少。例如,判断某个像素点是什么,判断其大概率是个门,那么我们就将其归类到门当中。这样,我们可以看到,语义分原创 2021-05-17 16:59:57 · 172 阅读 · 0 评论 -
FCN全连接卷积网络(5)--Fully Convolutional Networks for Semantic Segmentation阅读(相关工作部分)
相关工作 相关工作 1.重新设计和微调现有的分类模型来指导语义分割的密集预测内容。 2.虽然进去已有研究团队将卷积网络应用到密集预测任务当中,但是这些方面存在着一些不足,入感知范围有限、需要传统方法进行后处理等。 3.与现有网络不同,FCN使用图像分类作为监督式预训练来调整和扩展深度分类结构,并通过全卷积网络进行微调,目的是从整个输入图像和标签中简单高效的学习特征。 4.FCN将各层的特征融合在一起,旨在将全局特征和局部特征相结合,达到让网络自发微调的效果。 ...原创 2021-05-17 17:29:57 · 109 阅读 · 0 评论 -
全卷积网络的理解——理解论文Fully Convolutional Networks for Semantic Segmentation
目录和VGG网络的对比 和VGG网络的对比 我们清楚在VGG网络当中,我们最后需要使用三个全连接层开始对原有图像进行处理,最后得到的是一个1×1000的向量,表示的是1000种识别种类的概率。VGG当中最后的全连接是整个模型中的较大败笔 我们可以粗略的理解一下这个事情,1.我们使用一维向量进行计算的过程中,会丢失大量的二维信息。这是十分不好的。 ...原创 2021-05-21 19:00:24 · 385 阅读 · 0 评论