![](https://img-blog.csdnimg.cn/f91e5d18eaaf4940b560f35bf3ef84c2.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
论文阅读
文章平均质量分 95
阅读经典深度学习论文
陈嘿萌
骚年,你不是一个人在战斗!
展开
-
LightGlue: Local Feature Matching at Light Speed【文献阅读】
提出的LightGlue是一个深度神经网络用于学习图像间的局部特征匹配。我们回顾了SuperGlue的多种设计结构,它是稀疏匹配的sota模型,进行了简单以及高效的改进。让LightGlue变得更加的高效,在空间存储以及计算速度上,让模型能够更加精准,更容易训练。关键的是LightGlue模型能够自适应问题的难度,当视觉大面积重叠或者有限的外观差异时,推理可以更快而且更容易去匹配。具有令人期待的前景用于延迟敏感的深度匹配的3D重建中。代码和训练的模型已开源。原创 2024-07-07 14:29:23 · 701 阅读 · 0 评论 -
ADRNet: Affine and Deformable Registration Networks for Multimodal Remote Sensing Images【文献阅读】
多模态遥感图像的配准需要保证不同图像的空间位置一致性。它能够提供准确的几何信息以及多源图像的融合用于几何分析和应用。刚性配准的方法在处理较大尺度的变形中表现出较好的性能,但是它很难去实现高精度的配准。相反的,非刚性配准的方法适用于处理局部的差异,但它不能有效的处理较大尺度的变形。然后,结合刚性和非刚性配准方法成为一种必备的策略去处理这样的问题。本文,提出了ADRNet用于遥感图像配准。ADRNet包含三种主要的模块:仿射配准模块,变形场配准模块和空间变换模块用于整合仿射和弹性变换参数去获得最终对齐的图像。原创 2024-04-20 21:43:27 · 750 阅读 · 0 评论 -
Physical PerceptionNetwork and an All-weather Multi-modality Benchmark for Adverse Weather【文献阅读】
多模态图像融合从不同模态的图像中整合互补的信息,提供一个完整和客观的场景理解。现阶段的多模态图像融合难以在真实传感器下抵抗不同天气下的干扰,阻碍了在实际应用自动驾驶中发挥作用。为了解决这个研究空白,提出了一个各种天气条件下的多模态图像融合模型。由于深度学习是一个黑盒,因此限制了多任务的解决能力。deweathering模块,我们提出了一个物理感知的清晰特征感知模块,基于大气散射模型能够从不同的场景照明和深度中推理出透射率的变换。融合模型中,我们利用一个可学习的低秩表示模型来分解图像低秩和稀疏组成。原创 2024-03-25 10:01:56 · 894 阅读 · 0 评论 -
Image Fusion via Vision-Language Model【文献阅读】
图像融合从多源图像中整合必要信息成单张图像,强调显著性的结构和纹理,精炼不足的区域。现有的方法主要是识别像素级和语义视觉特征。然而在深度语义信息之外的文本信息探索不足。因此,我们定义了一个创新的范式佳作FILM(Fusion via vIsion-LanguageModel),首先利用提取不同原图像的文本信息去指导融合。输入的图像首先处理后去生成语义提示,然后喂到ChatGPT中去获得丰富的语义描述。原创 2024-03-02 15:23:28 · 1341 阅读 · 4 评论 -
CDDFuse: Correlation-Driven Dual-Branch Feature Decomposition for Multi-Modality Image Fusion【全文翻译】
【逐字逐句全文翻译 CVPR2023 图像融合论文】CDDFuse: Correlation-Driven Dual-Branch Feature Decomposition for Multi-Modality Image Fusion原创 2023-07-12 20:35:58 · 837 阅读 · 6 评论 -
Mask R-CNN全文翻译
Mask R-CNN按顺序的全文翻译。原创 2022-09-26 17:17:34 · 1253 阅读 · 2 评论 -
卷积神经网络经典论文集合(深度学习分类篇)
卷积神经网络2012-2022经典论文大集合。原创 2022-07-03 12:26:11 · 2870 阅读 · 1 评论 -
【U-Net】Pytorch实现
2021年11月06日11:16:25今天来完成U-Net原文链接:https://arxiv.org/abs/1505.04597论文题目:U-Net: Convolutional Networks for Biomedical Image Segmentation作者:Olaf Ronneberger, Philipp Fischer, and Thomas Brox原文插图:网络结构: 网络架构如上图1所示。它由收缩路径(左侧)和扩张路径(右侧)组成。收缩路径遵循卷积网络的典型结构原创 2021-11-06 17:03:11 · 4696 阅读 · 5 评论 -
【MobileNetV3】Pytorch实现(图像分类)
2021年11月09日20:40:53今天我们来完成MobileNetV3的Pytorch代码 原文:Searching for MobileNetV3(2019)作者团队:Google AI,Google Brain原文链接:https://arxiv.org/abs/1905.02244v3 MobileNetV2+Squeeze-and-Excite上图为MobileNetV3的主要结构bneck块1×1卷积用于升维和降维NL代表使用非线性激活,包含Relu以及h-swi原创 2021-11-09 21:42:27 · 7010 阅读 · 1 评论 -
【CBAM Pytorch实现】注意力机制综述阅读推荐
注意力机制推荐阅读:(Attention Mechanism)(博客)Squeeze-and-Excitation Networks(2017)(知乎)CBAM: Convolutional Block Attention Module(知乎)综述:图像处理中的注意力机制(期刊)卷积神经网络中的注意力机制综述(2021 计算机工程与应用) 2021年11月20日15:54:26今天来实现CBAM模块 原文【CBAM: Convolutional Block Attention Mo.原创 2021-11-21 11:37:15 · 4461 阅读 · 2 评论 -
AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE——ViT全文翻译
ViT全文翻译,逐字精度Vision in Transformer题目:AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE期刊:Published as a conference paper at ICLR 2021博客推荐:ViT 快速理解 Vision Transformer包含(原文链接、代码实现、过程理解、Self-Attention自注意力机制、markdown全文翻译下载).....原创 2022-04-10 21:15:23 · 3660 阅读 · 2 评论 -
深入浅出一文图解Vision in Transformer(ViT)
Vision in Transformer2022年02月14日14:31:34学习完上述Vision Transformer教程,站在巨人的肩膀上可以让我们更快的前进。完成学习后对内容进行一个总结,以及对ViT模型进行一个简单介绍,让才接触的同学快速了解ViT模型。我们以原文中的一张图,来ViT这个模型,我们把整体结构分成:将图像分成的patch(小方块),每个patch块可以看做是一个token(词向量),共有(224/16=14)个token,每个token的维度为。patch块大小是,每个patch原创 2022-02-15 15:14:07 · 11114 阅读 · 51 评论 -
【Effective Soil Type Classification Using Convolutional Neural Network】阅读笔记
题目:Effective Soil Type Classification Using Convolutional Neural Network使用卷积神经网络的有效土壤类型分类(2021)摘要土壤分类在如今是一个兴新的研究领域。许多研究都已经提出了不同的技术去解决这个问题,包含规则的,统计学的及传统方法。但是,这些方法很难保持一个较好的分类准确率。因此我们提出了一个新的技术去处理土壤分类问题,通过应用深度学习算法去构建一个有效的模型。基于实验结果表明,提出的模型能够在分类结果上达到97%的准确率.原创 2022-01-11 21:21:04 · 611 阅读 · 0 评论