自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

原创 注意力机制

https://zhuanlan.zhihu.com/p/146130215

2021-08-14 21:29:02 123

原创 swiftnet

In Defense of Pre-trained ImageNet Architectures for Real-time Semantic Segmentation of Road-driving Images代码:https://github.com/orsic/swiftnet0摘要对于实时语义分割,许多以前的网络通过自定义轻量化网络解决计算复杂度问题,这种体系结构通过减少相对于通用体系结构的深度、宽度和层容量来降低计算复杂度。本文:1.借助一个轻量级的通用架构作为主要的 recogniti

2021-06-06 20:49:42 681

原创 Deep Dual-resolution Networks for Real-time and Accurate Semantic Segmentation of Road Scenes

DDRNet:Deep Dual-resolution Networks for Real-time and Accurate Semantic Segmentation of Road Scenes作者:Y uanduo Hong, Huihui Pan, Weichao Sun, Senior Member , IEEE, Yisong Jia时间:2021摘要 对于实时语义分割,用推理速度置换精度是不可取的。一些方法使用轻量级架构(编解码器或双通道)或在低分辨率图像上进行推理,达到了不错的效果

2021-05-23 21:02:31 990 3

原创 CGNet: A Light-weight Context Guided Network for Semantic Segmentation

CGNet: A Light-weight Context Guided Network for Semantic Segmentation0.摘要移动设备中语义分割模型应用增加,然大部分网络的参数量过大,而内存占用较小的网络基本上是根据分类网络设计的。这一设计呐忽视了分割网络的特点our,提出了CGNet,轻量化、高效的语义分割网络,1 CG模块,将局部特征和周围特征进行联合 2 用全局特征改善联合特征 3 基于CG模块构建CGNet1.引言图1对于Fig1的描述:本图是在cityscap

2021-05-20 11:59:36 2184

原创 Rethinking BiSeNet For Real-time Semantic Segmentation

Rethinking BiSeNet For Real-time Semantic Segmentation摘要BiSeNet已经被证明是一种流行的实时分割的双流网络。然而,其增加额外路径来编码空间信息的原理是耗时的,并且从预训练的任务(例如图像分类)中借用的骨干网可能由于特定任务设计的不足而不能有效地用于图像分割。为此,提出Short-Term Dense Concatenatenetwork(STDC Network)。具体地说,我们逐步降低了特征图的维数,并将特征图的聚合用于图像表示,构成了STD

2021-05-19 16:22:20 1357 2

原创 BiSeNet: Bilateral Segmentation Network for Real-time Semantic Segmentation

BiSeNet: Bilateral Segmentation Network for Real-time Semantic Segmentation在这里插入摘要语义分割既需要丰富的空间信息,又需要相当大的感受野。然而,现代方法通常会牺牲空间分辨率来实现实时推理速度,这导致了较差的性能。本文提出双分支网络-BiSeNet。首先设计了一个小步长的Spatial Path,来保存空间信息并生成高分辨率的特征。同时,采用具有快速下采样策略的上下文路径Context Path 来获得足够的感受野。在这两分

2021-05-14 15:37:27 612

原创 关于attention机制中Q,K,V

attention机制中,V,Q,Khttps://blog.csdn.net/strawqqhat/article/details/104990628?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522160514243819195264749016%2522%252C%2522scm%2522%253A%252220140713.130102334.pc%255Fall.%2522%257D&request_id=160514243

2021-05-13 16:07:35 312

原创 deeplab v1

摘要深层卷积网络+概率图形方法------语义分割We show that responses at the final layer of DCNNs are not sufficiently localized for accurate object segmentation.我们通过将最终DCNN层的响应与全连接的条件随机场(CRF)相结合来克服深层网络的这种较差的局部化特性1.引言2.相关工作3.用于密集图像标注的卷积神经网络3.1基于空洞算法的高效密集滑动窗口特征提取空洞算

2021-05-13 16:06:32 100

原创 RefineNet

RefineNet: Multi-Path Refinement Networksfor High-Resolution Semantic Segmentation摘要RefineNet, a generic multi-path refinement network that explicitly exploits all the information available along the down-sampling process to enable high-resolution pred.

2020-10-19 17:00:16 248

原创 FCN

卷积化,上采样,skip摘要Our key insight is to build “fully convolutional” networks that take input of arbitrary size and produce correspondingly-sized output with efficient inference and learning.(建立“完全卷积”网络,这种网络接受任意大小的输入,并通过有效的推理和学习产生相应大小的输出。)We adapt contempo

2020-09-13 21:12:38 110

原创 SegNet

摘要This core trainable segmentation engine consists of an encoder network, a corresponding decoder network followed by a pixel-wise classification layer.(由编码器网络、相应的解码器网络和随后的像素分类层组成)The architecture of the encoder network is topologically identical to the

2020-09-13 11:49:45 177

原创 ICNet

摘要propose an image cascade network (ICNet) that incorporates multi-resolution branches提出了一种融合多分辨率分支的图像级联网络(ICNet))introduce the cascade feature fusion unit to quickly achieve high-quality segmentation.引入级联特征融合单元,快速实现高质量分割)1.引言快速语义分割的研究现状高质量切分研究居多

2020-09-12 20:59:34 606

转载 全连接层转化为卷积层

原文链接:https://zhuanlan.zhihu.com/p/82739829侵权请联系博主删除全连接和卷积的关系全连接层和卷积层只要设置好了对应的参数,可以在达到相同输入输出的效果,在这个意义上,在数学上可以认为它们是可以相互替换的。下面我们以输入10 x 10 x 3的特征图,输出10 x 10 x 1的特征图来证明。全连接层是一种核很大的卷积层全连接层怎么做?全连接层输入10 x 10 x 3的特征图,首先将其reshape成一维的300个输入神经元,然后每个输出神经元的值都是这30

2020-07-23 18:03:32 657

原创 VGG的阅读及翻译

1.3个3*3相较于1个7*7---非线性,参数量2.3*3和1*1---上下文捕捉很重要3.分类 - 训练时S=256,S=384 S属于[256,384] - 测试1.深度 - 2.测试时用固定尺寸,训练时用尺寸抖动的效果优于训练时用固定尺寸 - 3.网络融和效果更佳 4.定位 - SCR,共享回归函数 - PCR,每一类用一个回归函数 - 训练1.损失函数换成欧式距离 - 2.S=256,S=384 - 3.微调所有层还是微调前两

2020-07-23 16:51:31 310

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除