![](https://img-blog.csdnimg.cn/20201014180756930.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
深度学习
文章平均质量分 89
不会算命的赵半仙
这个作者很懒,什么都没留下…
展开
-
论文阅读-主干网络(2022)-ConvNext:下一代卷积网络
论文重新对传统卷积网络的设计空间以及其他局限进行测试,逐步将ViTs中的一些Tricks应用到标注的ResNet中,发现了一些能够提升网络性能的关键因素,最终输出的网络命名为ConvNext原创 2022-04-20 09:39:39 · 2220 阅读 · 0 评论 -
论文阅读-语义分割(2021)-BiSeNetV3:重新思考用于实时语义分割的BiSeNet模型
主干网络为STDCNet,Stage3、4、5输出的特征图下采样率分别为8、16、32,然后对大感受野的特征图应用全局平均池化,并应用ARM模块将两个不同阶段的特征图融合后,再与来自Stage3的特征图进行融合,输出8x下采样的特征图,最终分割头使用3×3CBR模块、1×1卷积和一个8x上采样来获得最终分割结果。原创 2022-04-18 11:30:56 · 1888 阅读 · 0 评论 -
论文阅读-目标检测(2019)-CenterNet:目标检测转化为关键点检测及其属性回归
CenterNet将目标检测问题转换为一个标准的关键点估计问题,首先将图像喂给一个全卷积网络产生热点图,图上的峰值点对应目标的中心,每个峰值点附近的图像特征来预测目标的宽高,模型训练的方法使用的是标准的密集任务有监督学习,推断则是完全端到端没有nms后处理的方法。原创 2022-04-14 15:27:44 · 750 阅读 · 0 评论 -
论文阅读-语义分割(2021)-DDRNet:用于实时道路场景精准分割的深度冗余分辨率网络
DDRNet用于道路场景的实时分割模型,模型基本流程如下图所示,网络经过一个主干模块后分为两个具有不同分辨率的平行分支,一个分支保持较高的分辨率另一个分支则通过多阶段下采样操作获得丰富的语义信息,两个分支的信息融合则通过双向桥接模块完成,模型最后还添加了一个DAPPM模块增加感受野以提取更丰富的语义信息。原创 2022-04-11 10:16:01 · 1432 阅读 · 0 评论 -
ML/DL-复习笔记【十】- 分组卷积和深度可分离卷积的区别
> 本节为ML/DL-复习笔记【十】- 分组卷积和深度可分离卷积的区别,主要内容包括:分组卷积与深度可分离卷积的参数量分析。原创 2021-07-19 21:56:33 · 813 阅读 · 0 评论 -
ML/DL-复习笔记【九】- 神经网络中各层的计算量与参数量
本节为ML/DL-复习笔记【九】- 神经网络中各层的计算量与参数量,主要内容包括:标准卷积、空洞卷积、转置卷积、深度可分离卷积以及全连接层的计算量、参数量与输出特征图尺寸计算。原创 2021-05-11 07:05:14 · 989 阅读 · 2 评论 -
ML/DL-复习笔记【八】- 信息熵与相对熵(KL散度)
本节为ML/DL-复习笔记【八】信息熵与相对熵(KL散度)。原创 2021-05-08 20:02:55 · 299 阅读 · 3 评论 -
ML/DL-复习笔记【六】- 理解反向传播算法
后向传播的推导和C++与pytorch实现。原创 2021-04-27 22:37:42 · 153 阅读 · 0 评论 -
ExtremeC3Net: 使用高级C3模块的极轻量人像分割模型
人像分割任务作为许多任务的一个中间阶段,对实时性要求极高,并且当前缺乏大规模的人像分割数据集,为此论文提出ExtremeC3Net模型和用于进行数据扩充的简单方法。ExtremeC3Net基于改进的C3模块,能够实现精度较高速度极快的人像分割,并且这种极轻量化的分割网络也在其他任务中给了我们应用的启发。论文地址工程地址1. 改进的C3模块 之前的文章提到过C3模块,即Concentrated-Comprehensive Convolution Module,其指出了轻量化语义分割网络中常用.原创 2021-01-16 13:31:25 · 1326 阅读 · 1 评论 -
StyleGAN v2:对StyleGAN v1的思考与改进
StyleGAN v2在v1的基础上进行了改进,着重处理的伪影问题,被CVPR2020收录,能够生成质量更好的图像数据。其在style mixing策略,progressive growing生成方式、插值方式等方面对v1进行了改进。StyleGAN v2论文地址工程地址 StyleGAN v1 一步一步地生成人工的图像,从非常低的分辨率4×44×44×4开始,一直到高分辨率1024×10241024×10241024×1024。通过分别地修改网络中每个级别的输入,它可以控制在该级别中所表示的视.原创 2021-01-14 11:20:04 · 2035 阅读 · 0 评论 -
CVPR 2020-FaceShifter:能够应对脸部遮挡的高保真换脸方法
Face Shifter是CVPR202的一篇文章,是一个两阶段的,可用于任意两张人脸图像换脸的模型,由AEI-Net和HEAR-Net两部分组成,经过合适的训练,AEI-Net本身就已经可以得到不错的换脸效果,在此基础上,可以再训练一个HEAR-Net,着重解决目标图像脸部遮挡问题,并进一步对换脸效果进行优化。模型推理速度不俗,并且能够生成质量较高的换脸结果。论文地址工程地址1工程地址21. AEI-Net:Adaptive Embedding Integration Network AE.原创 2021-01-08 15:50:23 · 1319 阅读 · 0 评论 -
语义分割模型架构演进与相关论文阅读
本文总结分析了主流语义分割模型架构演进过程,涉及FCN、DeepLab系列、RefineNet、PSPNet、BiSeNet、FastFCN、ConvCRFs、DUpsampling、DFANet、DANet、FickleNet、LedNet、ACNet等在内的20多个模型,本来是2019年一次组会的分享,这里重新总结,就当复习一下了。原创 2020-06-24 09:22:52 · 725 阅读 · 0 评论 -
目标检测(8):CenterNet-Objects as Points-将目标建模为边界框中心点的方法
论文《Objects as Points》在CornerNet之后提出了又一种全新的思路CenterNet,即将目标建模为其边界框的中心点,方法通过关键点估计来寻找目标的中心点然后对目标所有其他的属性例如尺寸、三维位置、方向和姿态进行回归。在COCO数据集上取得了速度-精度的较好的均衡[142FPS-28.1%AP、52FPS-37.4%AP,1.4FPS-45.1%AP],并且通过微调,CenterNet还可以用于三维目标检测与人体姿态估计。原创 2019-11-26 14:58:51 · 1911 阅读 · 1 评论 -
(CVPR2019)图像语义分割(17)-DFANet:用于实时语义分割的深层特征聚合网络
论文提出了一种极其高效的用于实时语义分割的网络框架DFANet,从一个轻量级的主干网络开始,通过一些列的附属阶段来聚合有判别力的特征,减少模型参数的同时保持了良好的感受野并且增强了模型的学习能力,取得了实时语义分割上的SOTA效果原创 2019-05-14 12:51:34 · 4625 阅读 · 0 评论 -
论文阅读-可变形卷积v2: More Deformable, Better Results
论文提出可变形卷积神经网络v2(DCNv2),规避了采样区域增加从而引入无关区域的问题,通过更多的可变形卷积层的堆叠,可调节的可变形卷积核RoI池化模块与R-CNN特征融合训练进一步提升了训练精度。原创 2019-05-13 18:17:10 · 4046 阅读 · 0 评论 -
(CVPR2019)图像语义分割(18) DANet-集成双路注意力机制的场景分割网络
该论文提出新型的场景分割网络DANet,利用自注意力机制进行丰富语义信息的捕获,在带有空洞卷积的FCN架构的尾部添加两个并行的注意力模块:位置注意力模块和通道注意力模块,论文在Cityscapes,PASCAL Context和COCO数据集上都取得了SOTA效果。原创 2019-05-16 08:29:53 · 15485 阅读 · 6 评论 -
CVPR2018论文阅读-Faster MPN-COV:迭代计算矩阵平方根以快速训练全局协方差池化
Towards Faster Training of Global Covariance Pooling Networks by Iterative Matrix Square Root Normalization通过迭代计算矩阵平方根加速训练全局协方差池化替代全局平均池化更好地利用协方差矩阵丰富的结构信息,提出的方法在几个细粒度的数据集上都SOTA效果。原创 2019-04-18 09:06:44 · 5528 阅读 · 1 评论 -
论文阅读-可变形卷积网络:Deformable Convolutional Networks
可变形卷积网络:Deformable Convolutional Networks卷积神经网络对位置变化的建模存在天然缺陷,这是由于网络固定的位置结构。该论文提出两个新的模块来增强CNNs的这种建模能力,称为deformable convolution和deformable RoI pooling,实验表明这两个模块对于目标检测任务和语义分割任务的精度都有一定的提原创 2019-05-13 09:20:50 · 5514 阅读 · 1 评论 -
(ICIP2019)图像语义分割(23) LEDNet-用于实时语义分割的轻量级编解码网络
论文提出用于实时语义分割的轻量级网络分割LEDNet,采用非对称编解码结构,编码模块采用带有通道分离和混洗的残差层,解码模块设计了APN模块减少计算开支,整个网络可以端到端训练。实验结果表明LEDNet在CityScapes上缺德了最好的速度与精度的权衡。原创 2019-09-10 19:24:47 · 2641 阅读 · 0 评论 -
图像语义分割(16)-DUpsampling-新型上采样模块:能够聚合丰富特征的数据相关型解码方式(CVPR2019)
Decoders Matter for Semantic Segmentation: Data-Dependent Decoding Enables Flexible Feature AggregationDUpsampling-新型上采样模块:能够聚合丰富特征的数据相关型解码方式(CVPR2019)该论文提出新型上采样方法DUpsampling来替代双线性插值。实验表明,基于DUpsampling的解码器在多个通用数据集上取得了STOA效果,并且计算量仅有原有模型的20%~30%。原创 2019-04-16 08:56:31 · 9392 阅读 · 3 评论 -
交叉熵损失的来源、说明、求导与pytorch实现
交叉熵损失~原创 2019-06-02 08:30:40 · 2156 阅读 · 0 评论 -
一阶段目标检测(7)-FCOS 全卷积anchor-free目标检测方法
论文提出了一个不需要预定义锚框的一阶段全卷积目标检测方法—FCOS原创 2019-06-24 21:32:03 · 2428 阅读 · 0 评论 -
2019最新论文阅读-BlazeFace:面向移动设备的实时人脸检测
本文提出了一种高效的轻量级人脸检测框架BlazeFace应用于移动端实时人脸检测,在旗舰设备上FPS达到了200~1000,这种亚毫秒级别的检测方法能够应用在诸多需要快速准确的识别出人脸区域的任务中,例如2D/3D面部关键点识别与几何评估,面部特征和表情分类以及面部区域分割等。原创 2019-07-14 17:27:34 · 1007 阅读 · 2 评论 -
图像语义分割(20) 通过图像合成方法检测训练中未出现的类别未知的物体
该论文通过图像合成方法检测训练中未出现的类别未知的物体,首先语义分割网络给类别未知物体的区域打上一个可信度较低的标签,这样根据语义分割结果重新生成原始输入时就会在该区域与真实的输入图像产生较大的差别,检测类别位置物体的任务变为检测合成图像与原始图像差别较大的区域。原创 2019-08-15 10:22:10 · 1377 阅读 · 0 评论 -
(CVPR2019)视频-图像语义分割(21) 联合传播数据增广+标签松弛提升边界精度=语义分割效果提升
该论文提出了一种基于视频帧预测的方法合成训练样本来对训练数据集进行增广以获得精度更高的语义分割网络。具体地,论文利用视频帧预测模型的能力同时获得更多的图像和标注,并且使用联合传播策略来消除合成样本中的误差,另外还设计了新颖的边界标签松弛技术使得训练过程对于合成样本数据和注释的偏差更加鲁棒。原创 2019-09-08 19:44:30 · 3100 阅读 · 4 评论 -
(ICIP2019)图像语义分割(24) ACNet-使用注意力网络的RGBD图像语义分割方法
论文提出了一种全新的方法,基于时下流行的注意力机制,用于室内场景下的RGBD图像语义分割——通过利用图像深度信息,获得更好的语义分割效果,在包含40个类别的复杂室内场景通用数据集NYUDv2上取得了SOTA效果,mIoU达到了48.3%,论文主要的贡献在于一个注意力辅助模块和三平行分支的网络架构。原创 2019-09-24 19:04:18 · 6434 阅读 · 4 评论 -
图像语义分割(6)-RefineNet:用于高分辨率图像语义分割的带有恒等映射的多路精细网络
RefineNet: Multi-Path Refinement Networks with Identity Mappings for High-Resolution Semantic Segmentation提出多路RefineNet,利用多个层级的特征,使得语义分割更加精确;利用Residual Connections(恒等映射),使得梯度更加容易长/短传,使端到端的训练更加高效;提出chained residual pooling,可以从较大的区域捕捉捕捉的上下文信息原创 2018-12-03 11:08:50 · 1695 阅读 · 0 评论 -
图像语义分割(14)-FastFCN: 重新思考语义分割模型主干网络中的扩张卷积
时下的语义分割模型通常在主干网络中使用扩展卷积来获得高分辨率的特征图,但是这样做会增加计算复杂度和内存占用。该论文提出了一种新型的联合上采样模块JPU(Joint Pyramid Upsampling)以取代扩张卷积,该方法有效降低了计算复杂度和内存占用,能够在多种已有模型中应用,并且不损失甚至会对最终精度有一定的提升。原创 2019-04-09 22:52:44 · 7039 阅读 · 1 评论 -
图像语义分割(15)-ConvCRFs:用于语义分割的卷积条件随机场
条件随机场(Conditional Random Fields, CRFs)因为具有对图像结构的建模能力可以作为一种有效的语义分割后处理方式,但是其缺点显著:一是训练和推断速度十分感人,二是其内部参数难以学习。该论文假设现有的全连接条件随机场框架具有条件独立性,从而提出以卷积的方式重新构建CRF,得到卷积条件随机场即ConvCRFs,使其参数能够利用反向传播算法进行优化,并且能够在GPU上高效实现以进行训练和推断过程的加速。原创 2019-04-11 14:38:51 · 4512 阅读 · 0 评论 -
图像语义分割(11)-BiSeNet:用于实时语义分割的双向分割网络
论文中提出了一种新的双向分割网络BiSeNet。首先,设计了一个带有小步长的空间路径来保留空间位置信息生成高分辨率的特征图;同时设计了一个带有快速下采样册率的语义路径来获取客观的感受野。在这两个模块之上引入一个新的特征融合模块将二者的特征图进行融合,实现速度和精度的平衡。原创 2018-12-10 19:36:20 · 4324 阅读 · 0 评论 -
图像语义分割(12)-重新思考空洞卷积: 为弱监督和半监督语义分割设计的简捷方法
论文中提出将已经表明的区域的知识推广到相邻的不确定的区域以产生密集的目标定位预测。为了实现这个目标,论文重新思考空洞卷积,发现空洞卷积在扩张感受野的同时不会增加过多的计算代价,这种特性对于将已判明区域的指示推广至未判明相邻区域非常适合,由此文章设计了多空洞率的卷积块来增强标准的分类模型.原创 2018-12-21 12:14:53 · 4449 阅读 · 3 评论 -
图像语义分割(10)-DeepLabV3+: 用于图像语义分割的带有空洞可分离卷积的编解码结构
论文地址 :Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmentation论文代码:Github链接1. 摘要 文章主要的工作是将空间金字塔池化和编解码模块结合,在DeepLabV3的基础上提出DeepLabV3+:使用DeepLabV3作为编码结构,再次基础上增加一个简单有效的解码模块来精...原创 2018-12-10 14:44:51 · 2778 阅读 · 0 评论 -
图像语义分割(9)-DeepLabV3: 再次思考用于图像语义分割的空洞卷积
论文地址 :Rethinking Atrous Convolution for Semantic Image Segmentation论文代码:Github链接1. 摘要 文章主要的工作:使用空洞卷积来调整滤波器的感受野并控制特征图分辨率使用不同空洞率的空洞卷积的串联或者并行操作来分割不同尺度的目标,捕获不同尺度的语义信息扩展的ASPP实现和训练的细节没有了DesneCRF的后...原创 2018-12-10 10:14:53 · 1521 阅读 · 0 评论 -
图像语义分割(7)-PSPNet:金字塔型场景解析网络
提出具有全局优先级并且包含不同子区域的不同尺度信息的pyramid pooling module,论文的另一个贡献是提出了基于深度监督损失的有效的ResNet的训练方法原创 2018-12-03 22:06:08 · 2152 阅读 · 0 评论 -
图像语义分割(8)-Large Kernel Matters:通过全局卷积网络改进语义分割
提出全局卷积网络。减缓定位任务和分类任务的矛盾,提出边界精细模块使得物体边界处的定位更加精细原创 2018-12-05 20:26:42 · 856 阅读 · 0 评论 -
图像语义分割(5)-DeepLabV2: 使用深度卷积网络、空洞卷积和全连接条件随机场进行图像语义分割
DeepLabV2是在[V1]基础上的优化,不同与V1,模型采用Resnet代替VGG-16,提出ASPP代替标准多尺度处理进行多尺度的特征的捕捉和融合,取得了更好的效果。原创 2018-11-27 10:22:07 · 1437 阅读 · 0 评论 -
图像语义分割(2)-DeepLabV1: 使用深度卷积网络和全连接条件随机场进行图像语义分割
普通下采样减小了图像的尺寸使得单个像素对应了更大的感受野,但是同时也使得分辨率下降,丢失了部分局部信息。此时自然想到需要一个不采用max pooling且仍能对应大感受野的采样方法,引入空洞卷积来解决下采样问题。传统的图像分析中,CRF主要用来做平滑处理,又因为short-range CRFs 可能会对我们恢复局部信息的目标起到反作用,所以使用全连接CRF,考虑全局信息。原创 2018-11-26 18:12:23 · 1627 阅读 · 0 评论 -
DeepLabv1补充:对全连接条件随机场(Fully Connected / Dense CRF)的理解
1. 随机场 (random field) 由若干位置组成的整体,每一个位置按某种分布随机地赋一个值,全体即组成一个随机场。2. 马尔科夫随机场(MRF) 马尔科夫随机场是随机场的特例,假设某一个位置的赋值只与和它相邻的位置相关。3. 条件随机场(CRF) 条件随机场是马尔科夫随机场的特例,假设马尔可夫随机场只有X和Y两个随机变量,一般情况下,X是给定的,Y是输出。 形式化定义...原创 2018-11-26 16:58:44 · 9360 阅读 · 2 评论 -
论文阅读-Rethinking ImageNet Pre-trainging
论文地址: Rethinking ImageNet Pre-trainging1. 简述 论文更像是一个实验报告,通过在二阶段的Mask RCNN上设计多个实验,得到了关于ImageNet Pre-Training的一些结论。Is ImageNet pre-training necessary? NoIs ImageNet helpful? YesShall we pursuit u...原创 2018-11-26 10:36:06 · 275 阅读 · 0 评论 -
图像语义分割(3)-Dilated Conv:使用空洞卷积进行多尺度语义聚合
传统分类网络通过连续的pooling或者其他下采样层来整合多尺度上下文信息,这种方式会损失一些分辨率。并且,分类网络与稠密预测不同,稠密预测需要多尺度上下文信息,同时还要求足够大的输出分辨率。论文针对图像语义分割中的像素级别的预测分类提出了一种新的卷积网络模块。通过空洞卷积进行多尺度上下文信息聚合而不降低特征图大小,空洞卷积支持感受野的指数增长。原创 2018-11-22 21:55:55 · 9436 阅读 · 5 评论