自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(322)
  • 资源 (1)
  • 收藏
  • 关注

原创 xiongxyowo的个人简介

xiongxyowo的个人简介

2023-02-24 14:11:45 643 2

原创 每日Attention学习6——Context Aggregation Module

为了将多层次的融合特征整合到伪装物体预测中,我们设计了一个上下文聚合模块(CAM)来挖掘上下文语义,以增强物体检测,如图5所示。不同于BBSNet中的全局上下文模块不考虑各分支之间的语义关联,CAM考虑到跨尺度交互作用以增强特征表示。

2024-05-09 20:01:13 232

原创 每日Attention学习5——Multi-Scale Channel Attention Module

MS-CAM的核心思想在于,通过改变空间池化的大小,可以在多个尺度上实现通道注意力。为了尽可能保持轻量级,我们只是在注意力模块内将局部上下文添加到全局上下文中。我们选择点卷积(PointWise Conv)作为局部通道上下文融合器,它只利用每个空间位置的点级通道交互。

2024-05-09 19:58:00 456

原创 每日Attention学习4——Spatial Attention Module

我们设计了空间注意力模块 (SAM),以有效地完善特征(见图 3)。我们首先沿通道轴使用平均和最大运算,分别生成两个不同的单通道空间图$S_{avg}$和$S_{max}$。然后,我们将它们连接起来,通过3×3卷积和sigmoid函数计算出空间注意力图。空间注意力图$M_{sa}$可以通过元素级相乘从空间维度对特征重新加权。最后,细化后的特征被送入3×3卷积层,将通道压缩至64。

2024-05-09 19:53:18 379

原创 每日Attention学习3——Cross-level Feature Fusion

利用特征提取网络可以获得不同分辨率的多级特征。因此,有效整合多级特征非常重要,这可以提高不同尺度特征的表示能力。因此,我们提出了一个 CFF模块来融合相邻的两个特征,然后将其输入分割网络。

2024-05-09 19:47:39 328

原创 每日Attention学习2——Multi-Scale Convolutional Attention

MSCA包含三个部分:一个深度卷积以汇总局部信息;一个多分支深度条带卷积以获取多尺度上下文;一个1×1卷积以建模不同通道之间的信息。该1×1卷积的输出将直接作为注意力以对MSCA的输出结果进行后处理加权。

2024-05-09 19:42:34 190

原创 每日Attention学习1——Parallel Aggregation Pyramid Pooling Module

为了更好地构建全局场景先验,PSPNet引入了金字塔池化模块(PPM),在卷积层之前串联多尺度池化映射,形成局部和全局上下文表示。文献[20]提出的深度聚合PPM(DAPPM)进一步提高了PPM的上下文嵌入能力,并显示出卓越的性能。然而,DAPPM的计算过程无法就其深度进行并行化,耗时较长,而且DAPPM每个尺度包含的通道过多,可能会超出轻量级模型的表示能力。因此,我们修改了DAPPM中的连接,使其可并行化,如图6所示,并将每个尺度的通道数从128个减少到96个。这种新的上下文采集模块被称为并行聚合PPM

2024-05-08 23:41:38 301

原创 MMSegmentation ImportError: Failed to import custom modules from {‘allow_failed_imports‘: False

在configs的配置文件中,加入了自定义的导入包,例如:而custom_pack文件夹已经正确置于mmsegmentation目录下。此时使用该配置文件进行训练,报错信息如下按照报错字面意思,是包的位置不正确,没有放在系统路径或当前路径下。然而实际上,包内代码本身存在错误也会引发该问题。例如,我们在mmsegmentation/custom_pack/init.py文件中加入以下一行代码:这里的abcde包是乱编的,也就是在import custom_pack这个包的同时,包内的代码逻辑存在impo

2024-04-10 19:37:49 310

原创 视觉参数高效微调(Visual Parameter Efficient Tuning)部分论文汇总

视觉参数高效微调(Visual Parameter Efficient Tuning)部分论文汇总

2024-01-11 21:36:02 1253

原创 [论文阅读] Convolution Meets LoRA: Parameter Efficient Finetuning for Segment Anything Model

Segment-Anything Model (SAM) 是图像分割的基础框架。 虽然它在典型场景中表现出显着的零样本泛化能力,但当应用于医学图像和遥感等专业领域时,其优势就会减弱。 为了解决这一限制,本文引入了 Conv-LoRA,这是一种简单而有效的参数高效微调方法。 通过将超轻量级卷积参数集成到 LoRA 中,Conv-LoRA 可以将与图像相关的归纳偏差注入到普通 ViT 编码器中,进一步强化 SAM 的局部先验假设。 值得注意的是,Conv-LoRA 不仅保留了 SAM 广泛的分割知识,而且还恢复

2024-01-10 17:47:18 1058

原创 [论文阅读] Joint learning of foreground, background and edge for salient object detection

尽管在显著性检测方面取得了重大进展,但当场景复杂时,特别是当显着性和非显着性区域相似或显着性对象具有复杂的轮廓时,预测显着性仍然具有挑战性。 以前的先进方法很少探索图像背景下的学习。事实上,图像的背景和前景包含互补信息。 在这项工作中,我们建议将显着性检测任务分解为三个子任务:前景感知、背景抑制和边缘细化。更具体地说,我们的解码器由三个分支组成:前景感知分支、背景抑制分支和边缘细化分支。每个分支的目标是学习特定的特征来进行预测。同时,我们设计了具有可控调节因子的区域焦点损失函数来监督训练阶段每个分支的学习。

2024-01-08 22:22:54 754 3

原创 [论文阅读] Revisiting Feature Propagation and Aggregation in Polyp Segmentation

息肉的准确分割是筛查过程中有效诊断结直肠癌的关键步骤。 由于能够有效捕获多尺度上下文信息,普遍采用类似UNet 的编码器-解码器框架。 然而,两个主要限制阻碍了网络实现有效的特征传播和聚合。 首先,跳跃连接仅将单个尺度特征传输到解码器,这可能导致特征表示有限。 其次,特征在没有任何信息过滤器的情况下被传输,这对于在解码器处执行特征融合来说效率低下。 为了解决这些限制,我们提出了一种新颖的特征增强网络,它利用特征传播增强和特征聚合增强模块来实现更有效的特征融合和多尺度特征传播。 具体来说,特征传播增强模块将所

2024-01-07 22:46:33 1072

原创 ISBI 2023部分半监督学习论文汇总

ISBI 2023部分半监督学习论文汇总

2023-09-26 15:38:36 1055 1

原创 简单理解Python中的深拷贝与浅拷贝

简单来说就是两者都对原对象进行了复制,因此使用is运算符来比较新旧对象时,返回的都是False(都开辟了新的内存);两者区别在于对嵌套对象有没有进行递归的复制。浅拷贝没有给嵌套对象复制并分配新内存,用is来比较嵌套对象时返回的是True;而深拷贝对嵌套对象开辟了进行了复制并分配新内存,用is来比较嵌套对象时返回的是False。

2023-08-15 14:44:52 1443

原创 Pytorch基于VGG cosine similarity实现简单的以图搜图(图像检索)

Pytorch基于VGG cosine similarity实现简单的以图搜图(图像检索)

2023-08-10 16:15:46 1523

原创 简单理解大模型参数高效微调中的LoRA(Low-Rank Adaptation)

简单理解大模型参数高效微调中的LoRA(Low-Rank Adaptation)

2023-07-29 00:29:17 5965 3

原创 简单理解Python列表推导式

简单理解Python列表推导式

2023-06-25 10:24:57 288

原创 Diffusion语义图像合成(Semantic Image Synthesis)部分论文汇总

Diffusion语义图像合成(Semantic Image Synthesis)部分论文汇总

2023-06-12 16:22:08 964

原创 [论文阅读] Explicit Visual Prompting for Low-Level Structure Segmentations

我们考虑了检测图像中低层次结构的通用问题,其中包括分割被操纵的部分,识别失焦像素,分离阴影区域,以及检测隐藏的物体。每个问题通常都有一个特定领域的解决方案,我们表明,一个统一的方法在所有这些问题上都表现良好。我们从NLP中广泛使用的预训练和提示调整协议中得到启发,并提出了一个新的视觉提示模型,即显式视觉提示(EVP)。与以往的视觉提示不同的是,我们的视觉提示是典型的数据集级别的隐性嵌入,我们的关键见解是强制执行可调整的参数,专注于每个单独图像的显性视觉内容,即来自冻结补丁嵌入和输入的高频成分的特征。在相同数

2023-05-26 16:21:15 1351

原创 Segment Anything Model (SAM) 部分报告汇总

Segment Anything Model (SAM) 部分报告汇总

2023-04-25 11:51:26 2578 1

原创 半监督动作识别(Semi-Supervised Action Detection)部分论文汇总

半监督动作识别(Semi-Supervised Action Detection)部分论文汇总

2023-04-10 10:16:08 493

原创 半监督视频分割(Semi-Supervised Video Segmentation)部分论文汇总

半监督视频分割(Semi-Supervised Video Segmentation)部分论文汇总

2023-04-08 17:57:57 831

原创 视频显著性检测(Video Salient Object Detection)部分论文汇总

视频显著性检测(Video Salient Object Detection)部分论文汇总

2023-04-02 16:30:54 665

原创 Python 绘制二分割预测结果的熵(不确定性)并可视化

Python 绘制二分割预测结果的熵(不确定性)并可视化

2023-03-31 13:51:59 322

原创 放射图表征学习(Radiograph Representation Learning)部分论文汇总

放射图表征学习(Radiograph Representation Learning)部分论文汇总

2023-03-27 14:30:24 486

原创 VSCode出现“ModuleNotFoundError: No module named XXX“的一种解决方法

出现这种错误的一种可能原因是vscode的默认python解释器路径有问题,导致无法搜索到用户工作路径下的自定义模块包。这里考虑的情况只针对用户"自定义的"python包,而非可以通过pip安装的(如numpy之类)

2023-03-15 10:17:57 5546

原创 简单入门理解半监督中的Mean Teacher

简单入门理解半监督中的Mean Teacher

2023-02-16 21:22:10 5625 10

原创 简单理解反向注意力(Reverse Attention)机制

简单理解反向注意力(Reverse Attention)机制

2023-02-13 19:17:38 3652

原创 [论文阅读] Semi-supervised Semantic Segmentation via Strong-Weak Dual-Branch Network

虽然现有的工作已经探索了各种技术来推动弱监督语义分割的发展,但与监督方法相比仍有很大差距。在现实世界的应用中,除了大量的弱监督数据外,通常还有一些可用的像素级注释,在此基础上,半监督跟踪成为一种有前途的语义分割方式。目前的方法只是将这两组不同的注释捆绑在一起,训练一个分割网络。然而,我们发现这样的处理方式是有问题的,所取得的结果甚至比仅仅使用强标签还要糟糕,这表明对弱标签的误用。为了充分挖掘弱标签的潜力,我们建议通过一个强弱双分支网络对强注释和弱注释进行单独处理,将大量不准确的弱监督与强监督区分开来。我们设

2023-02-13 11:55:22 556 2

原创 简单理解小目标分割中的weighted BCE Loss与weighted IoU Loss

简单理解小目标分割中的weighted BCE Loss与weighted IoU Loss

2023-02-12 21:40:51 2931 1

原创 [论文阅读] DAE-GCN: Identifying Disease-Related Features for Disease Prediction

学习与疾病相关的表征在基于图像的癌症诊断中起着至关重要的作用,因为它具有可信、可解释和良好的概括能力。一个好的表征不仅应该与疾病无关的特征相分离,而且还应该包含病变的属性信息(如形状、边缘),这些信息在临床诊断癌症时经常被首先识别。为了学习这样的表征,我们提出了一个带有图卷积网络的分解自动编码器(Disentangle Auto-Encoder withGraph Convolutional Network,DAE-GCN),它在基于AE的框架中采用了GCN模型指导下的分解机制。具体来说,我们明确地将编码的

2023-02-11 21:31:11 959 1

原创 简单理解opencv中的坐标系,x,y,h,w

简单理解opencv中的坐标系,x,y,h,w

2023-01-03 19:03:48 6921

原创 伪装目标检测(Camouflage Object Detection)部分经典论文汇总

伪装目标检测(Camouflage Object Detection)部分经典论文汇总

2022-12-16 18:08:43 5379 1

原创 [论文阅读] Curriculum Semi-supervised Segmentation

本研究调查了半监督CNN分割的课程式策略,它设计了一个回归网络来学习图像级信息,如目标区域的大小。这些回归被用来有效地规范分割网络,约束未标记图像的softmax预测,使其与推断的标签分布相匹配。我们的框架基于不等式约束,可以容忍推断出的知识中的不确定性,例如,回归的区域大小。它可以用于大量的区域属性。我们评估了我们的方法在磁共振图像(MRI)中的左心室分割,并将其与标准的基于建议的半监督策略相比较。我们的方法取得了有竞争力的结果,以更有效的方式利用了未标记的数据,并接近完全监督的性能。

2022-11-30 16:37:39 1067 1

原创 Python all()的简单用法

Python all()的简单用法

2022-11-26 11:26:57 1143

原创 Python Counter的简单用法

Python Counter的简单用法

2022-11-25 23:07:39 1171

翻译 [论文翻译] Learning with Limited Annotations: A Survey on Deep Semi-Supervised Learning for Medical

医学图像分割是许多图像引导的临床方法中的基本和关键步骤。最近基于深度学习的分割方法的成功通常依赖于大量的标记数据,特别是在医学成像领域,只有专家才能提供可靠和准确的注释,这一点特别困难和昂贵。 半监督学习已经成为一种有吸引力的策略,并被广泛地应用于医学图像分割任务中,在有限的注释下训练深度模型。在本文中,我们全面回顾了最近提出的用于医学图像分割的半监督学习方法,并总结了技术上的创新和经验上的结果。此外,我们还分析和讨论了现有方法的局限性和几个未解决的问题。我们希望这篇综述能够激励研究界探索解决这一挑战的方法

2022-11-25 15:12:12 1543

原创 [论文阅读] Collaborative and Adversarial Learning of Focused and Dispersive Representation

从结肠镜图像中自动分割息肉是计算机辅助诊断结直肠癌的一个重要步骤。近年来报道的大多数息肉分割方法都是基于完全监督的深度学习。然而,医生在诊断过程中对息肉图像的注释是非常耗时和昂贵的。在本文中,我们提出了一种新的半监督的息肉分割方法,通过协作和对抗学习的集中和分散表征学习模型,其中集中和分散提取模块被用来处理息肉位置和形状的多样性。此外,在对抗性训练框架中由鉴别器产生的置信图显示了利用未标记数据和提高分割网络性能的有效性。进一步采用一致的正则化来优化分割网络,以加强重点和分散提取模块的输出的代表性。我们还提出

2022-11-24 15:25:15 961 1

原创 [论文阅读] Adversarial Learning for Semi-Supervised Semantic Segmentation

我们提出了一种使用对抗性网络进行半监督性语义分割的方法。虽然大多数现有的判别器都是在图像层面上对输入图像进行真假分类的训练,但我们以完全卷积的方式设计了一个判别器,以区分预测的概率图和考虑到空间分辨率的地面真实分割分布。我们表明,通过将对抗性损失与拟议模型的标准交叉熵损失相结合,所提出的判别器可用于提高语义分割的准确性。此外,全卷积判别器通过发现未标记图像的预测结果中值得信赖的区域,从而提供额外的监督信号,实现半监督学习。与现有的利用弱标记图像的方法相比,我们的方法利用未标记的图像来增强分割模型。在PASC

2022-11-24 15:10:15 1669

原创 [论文阅读] Generative Adversarial Networks for Video-to-Video Domain Adaptation

来自多中心的内窥镜视频通常有不同的成像条件,如颜色和光照,这使得在一个领域训练的模型通常不能很好地推广到另一个领域。领域适应是解决这一问题的潜在方案之一。然而,现有的工作很少关注基于视频的数据的转换。在这项工作中,我们提出了一个新的生成对抗网络(GAN),即VideoGAN,以跨越不同领域转移基于视频的数据。由于视频中的帧可能具有相似的内容和成像条件,所提出的VideoGAN有一个X型生成器,以在翻译过程中保持视频内的一致性。此外,还提出了一个损失函数,即颜色直方图损失,以调整每个翻译帧的颜色分布。两个来自

2022-11-15 19:11:00 1316 1

WindowsApp1.zip

WindowsApp1.zip

2021-05-24

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除