zzzyzh-CSDN博客

原创 Loss【1】：Focal Loss

类别不平衡是一个在目标检测领域被广泛讨论的问题，因为目标数量的多少在数据集中能很直观的体现。同时，在分割中这也是一个值得关注的问题，毕竟分割的本质是对像素进行分类。而处理类别不平衡一个非差常用的方法就是通过Focal Loss来引导模型更关注困难的类。Focal Loss是在标准交叉熵损失基础上修改得到的。相比它增加了容易和难分样本的权重，对于难分的样本增加权重，增加 loss 的贡献度；减少易分类样本的权重，使得模型在训练时更专注于难分类的样本。Focal Loss。

2024-04-02 15:44:55 958 1

原创深度学习环境指南【1】：Nvidia 驱动

本文作为深度学习环境指南系列的第一篇文章，主要讲解当你第一次拿到显卡完成装机后需要做的步骤，或者是显卡驱动不合适需要升级更新时需要执行的步骤。方法不完全，需要大家自己多尝试。Good Luck！

2024-02-03 21:14:05 500 1

原创 FS【2】：CAT-Net

本文来自港科陈浩老师组发表在 MICCAI23 上的一篇有关 few-shot 在医学图像上的应用。方法简洁高效，可供参考。插一句题外话，医学图像做 few-shot 主要基于腹部器官的 3 个数据集，期待后续可以见到一些在更多数据集上更通用更有效的方法。本文提出了一种基于交叉掩码注意力的少样本医学图像分割新框架CAT-Net通过挖掘support和query图像之间的相关性，并限制模型仅关注有用的前景信息，来提高support和query特征的表达能力。

2024-02-03 12:00:00 865

原创 MSA【5】：SAM-Med2D

由于医学图像和自然图像之间存在较大差异，以及缺少大规模医学图像基准数据集，这是导致AI在医学领域进展缓慢的原因之一。构建大规模基准数据集和可靠的基线模型，能够推动AI在医疗领域的快速发展，加速医疗向更通用的方向转变。上海 AI-Lab 提出了 SAM-Med2D，标志着大模型在医学图像分割的里程碑。SAM-Med2DSAM-Med2D：打破自然图像与医学图像的领域鸿沟，医疗版 SAM 开源了！SAM-Med2D构建了一个涵盖各种模式和对象的大规模医学图像分割数据集。

2024-01-26 11:47:35 1064 1

原创 FS【1】：SSP

这是一篇发表在 ECCV 2022 上的论文，对后续的许多 few-shot 方法都有着一定的启发作用。ECCV 2022 | SSP: 自支持匹配的小样本任务新思想现有的 few-shot 分割方法严重受限于所提供的少数几张照片支持对类内变化的覆盖范围。为此，本文提出了一种新颖的自支持匹配策略来缓解这一问题，该策略使用查询原型来匹配查询特征，其中查询原型是从高置信度查询预测中收集的。这种策略能有效捕捉查询对象一致的基本特征，从而恰当地匹配查询特征。

2024-01-10 17:39:35 941 2

原创 MSA【4】：DeSAM

基于深度学习的自动医学图像分割模型经常会出现领域偏移的问题，即在源领域训练的模型不能很好地泛化到其他未见领域。为此本文提出 DeSAM，通过解耦 image embedding 和 prompt token 来提高 SAM 的效果基于深度学习的自动医学图像分割模型经常会出现领域偏移的问题，即在源领域训练的模型不能很好地泛化到其他未见领域Segment Anything Model（SAM）在提高医学图像分割的跨域鲁棒性方面展现出了潜力。然而，与人工提示相比，SAM。

2023-12-21 20:35:15 940 2

原创 MSA【3】：SAMed

SAMed是基于大规模图像分割模型 Segment Anything Model (SAM) 构建的，旨在探索将大规模模型定制化应用于医学图像分割的新研究范式本文提出了医学图像分割的通用解决方案SAMed对SAM图像编码器采用基于低秩的微调策略（LoRA），并在标注的医学图像分割数据集上对其与提示编码器和掩码解码器一起进行微调Warmup微调策略和AdamW优化器使SAMed成功收敛并降低了损失与SAM不同，SAMed可以对医学图像进行语义分割。

2023-12-19 16:40:57 1007 1

原创 SAM【2】：Personalize-SAM

PerSAM作为一种无需训练的的个性化方法，仅使用一次性数据，即用户提供的图像和粗略的掩码来高效地定制SAM。但同时，PerSAM更像是一种对高效选择 prompt 的尝试，而并非对SAM进行微调，如果想要将PerSAM应用在自然图像以外的数据集中，可能不会是一个好的选择。尽管SAM具有通用性，但针对特定视觉概念定制SAM而无需人工提示的问题仍有待探索。本文为SAM提出了一种无需训练的个性化方法，称为PerSAM。在只给定一张带有参考掩码的图像的情况下，PerSAM首先通过位置先验（

2023-07-24 11:00:00 458 1

原创 MSA【2】：Medical SAM Adapter

随着研究的深入，SAM被拓展到医学图像分割领域。但研究表明，直接将SAM用于医学图像分割，效果非常差。但医疗数据难以获取以及高昂的注释成本迫切的需要一个基础模型来打卡局面，不仅仅在图像分割层面，更是在数据注释方面。本文介绍了第一个将Adaption微调方法用于SAM的模型，该模型在 19 个数据集上都取得了惊人的效果。这为后续SAM的研究和 fine-tune 工作，提供了一个有效的参考和指导。最近的许多评测任务表明，SAM一个自然的问题是，如何将SAM。

2023-07-21 12:00:00 845 1

原创 MSA【1】：Segment Anything Model for Medical Image Analysis: an Experimental Study

本文主要介绍了 Segment Anything Model 在自然图像分割领域取得显著成就后，较早的将 SAM 在医学图像领域做评测的工作。是一个在超过 10 亿个注释（主要是自然图像）上训练的基础模型，旨在以交互方式分割用户定义的感兴趣对象。尽管该模型在自然图像上的表现令人印象深刻，但目前尚不清楚该模型在转向医学图像领域时会受到怎样的影响。本文对SAM分割医学图像的能力进行了广泛的评估，评估对象包括来自不同模式和解剖学的 11 个医学影像数据集。研究表明，SAM。

2023-07-17 19:24:36 677 2

原创 SAM【1】：Segment Anything

Segment Anthing 是 Meta 开源的第一个分割大模型，最近在 CV 领域掀起了一阵大模型热潮。短短几天时间内，各种二创、测评层出不穷。同时，Meta 公布了模型的Demo，让研究人员可以抢先体验SAM的神奇和强大之处。视觉大模型与自然语言大模型类似，它的主要目的是通过一个模型来解决用户的所有问题。受制于图像数据更广泛的图片类型和任务，目前 SAM 主要解决的是最传统也是应用最广泛的分割任务。SAM。

2023-06-25 08:59:49 635 2

原创图像预处理 Tricks【1】：Contours

轮廓可以简单地理解为连接所有连续点（沿物体边界）的曲线，这些点通常具有相同的颜色或强度。轮廓在图像分析中具有重要意义，是物体形状分析和对象检测和识别的有用工具，是理解图像语义信息的重要依据。本文主要介绍了在 opencv 中，一些重要的用于处理物体轮廓的方法。函数是 OpenCV 库的一部分，它被广泛用于计算机视觉任务。这个函数用于检测和寻找图像中的轮廓（边界）。通常，为了提高物体轮廓检测的准确率，首先要将彩色图像或者灰度图像处理成二值图像（灰度图）或者使用Canny。

2023-06-24 00:52:26 869 1

原创 Parser 使用方法

本文主要记录了在深度学习中，使用别人写的代码时，用来接收用户在命令行里指定传入模型参数的重要方法parser同时，本文也给出了简易的示例，方便读者快速开始（只想了解如何使用的话可以直接跳到3. 使用方法和4. 示例一份简单的使用说明参考文档参考博客。

2023-05-01 15:48:25 3594 1

原创 Tossim 教程

本文主要用于记录在 WSN 课程中，配置大作业所需使用的 Tossim 仿真工具是TinyOS自带的一个仿真工具，可以支持大规模的网络仿真。由于TOSSIM运行和传感器硬件相同的代码，所以仿真编译器能直接从TinyOS应用的组件表编译仿真程序。通过替换TinyOS下层部分硬件相关的组件，TOSSIM把硬件中断换成离散仿真事件，由仿真器事件抛出的中断来驱动上层应用，其他的TinyOS组件尤其是上层的应用组件都无须更改。Tossim是一个库，你必须写程序配置仿真运行，TOSSIMPython和C++

2023-04-23 14:34:10 1241 1

原创 TinyOS 配置教程

本文主要用于记录在 WSN 课程中，配置大作业所需使用的TinyOS仿真环境一份简单的配置指南。

2023-04-21 19:25:00 1241 1

原创 ML【3】：FPGroth Tree 算法

在Apriori算法原理总结中，我们对Apriori算法的原理做了总结。作为一个挖掘频繁项集的算法，Apriori算法需要多次扫描数据，I/O 是很大的瓶颈。为了解决这个问题，FP Tree算法（也称FP Growth算法）采用了一些技巧，无论多少数据，只需要扫描两次数据集，因此提高了算法运行的效率有关AprioriML【2】：Apriori 算法FP-growth算法的优点是它不需要生成候选项集，因此可以避免Apriori算法中的大量重复计算。另外，由于FP树的压缩性质，FP-growth。

2023-03-31 19:50:05 376

原创 ML【2】：Apriori 算法

频繁模式挖掘是一种数据挖掘技术，旨在发现数据集中出现频率较高的模式。这些模式可能是项目集中的频繁项集，或者是序列数据中的频繁子序列。常见的频繁模式挖掘算法包括Apriori算法、FP-growth算法等。这些算法可以在大规模数据集中高效地发现频繁模式，并提供支持度、置信度等指标来评估模式的重要性和可靠性。本文主要介绍了什么是频繁模式，和频繁模式常见的第一个算法Apriori算法。频繁模式指在一个数据集中频繁出现的模式（如一组项目、子序列、子结构等）

2023-03-31 16:27:50 279 1

原创 CV【5】：Layer normalization

对于早前的 CNN 模型来说，大多使用进行归一化，随着在计算机视觉领域掀起的热潮，开始被用于提升传统的 CNN 的性能，在许多工作中展现了不错的提升本文主要是对用法的总结参考资料1参考资料2。

2023-02-09 09:54:01 1048 1

原创 CV【4】：Batch normalization

对于早前的 CNN 模型来说，大多使用进行归一化，随着在计算机视觉领域掀起的热潮，开始被用于提升传统的 CNN 的性能，在许多工作中展现了不错的提升本文主要是对用法的总结和比较参考资料1参考资料2参考资料3。

2023-02-07 15:26:52 456

原创 CV-Model【8】：ConvNeXt

随着ViT在计算机视觉领域大放异彩，越来越多的研究人员将工作重心放在上，在计算机视觉领域上CNN难道真的要被完全取代吗？本文长篇分析并设计 CNN 架构的若干技巧，对照的设计理念，渐进式“现代化”改造ResNet，取得了良好的效果，对深度网络的设计具有较大的参考价值分层变形器（如）重新引入了几个 ConvNet 先验，使得 Transformer作为通用视觉骨干实际上是可行的，并在各种视觉任务中表现出显著的性能。然而，这种混合方法的有效性仍然主要归功于的内在优势，而不是的内在归纳偏见。

2023-01-31 20:00:00 1119 1

原创 MS-Model【2】：nnFormer

本文在医学图像分割领域中的另一个十分常用的基线网络 nnUNet 的基础上修改得到，在多器官分割任务（十项全能数据集）上取得了十分不错的成绩目前的方法要么不采用，要么使用的效率不够高，无法捕捉医学成像中的长期依赖性nnFormer不仅利用交错卷积和自我注意操作的结合，而且还引入了基于局部和全局体积的自我注意机制来学习体积表示。此外，nnFormer提出使用跳过注意力来取代传统的类似U-Net架构中跳过连接的串联/求和操作这项任务是对三维计算机断层扫描（CT）中捕获的不同器官进行分割可以说，

2023-01-28 21:20:41 2049

原创 MS-Model【3】：Medical Transformer

本文是 2021 年发表在 MICCAI 上的一篇文章，在当年的多项医学图像分割任务挑战中都获得了不错的成绩。本文主要介绍了这篇论文提出的 Medical Transformer 的结构及相关内容。卷积架构存在着固有的归纳偏差（归纳偏差指的是神经网络模型会产生具有偏好的预测结果，也就是说归纳偏差会使得学习算法优先考虑具有某些特定属性的解），它们缺乏对图像中长程依赖性的理解。文章提出了用 transformer 来做医学图像分割。

2023-01-25 16:22:18 1214

原创 CV【3】：drop_out & drop_path

drop_out和drop_path。

2023-01-17 12:00:00 1604

原创 Python【4】：eval() & exec()

eval()和exec()这一对函数的作用大致相当，简单来说都可以执行字符串中的数学表达式且exec()函数的作用比eval()更大。

2023-01-16 16:00:00 725

原创 Python【3】：格式化输出

在做题与实际应用中，经常会出现需要格式化（输出）字符串的情况，本文主要介绍 Python 格式化字符串的方法。

2023-01-15 20:46:54 2219 2

原创 MS-Model【3】：SA

本文主要记载有关脑室内出血（IVH）情况下的脑室分割情况，是较早的提出了有关解决这个问题的工作，本文的创新点也主要集中在将深度学习应用脑室内出血分割的领域。目标：本文重点讨论存在脑室内出血（IVH）下对脑室进行的分割主要方法：具体来说，本文采用每个切片的原始切片和切片的水平翻转作为输入，除了它们的分割损失外，还要惩罚相应分割图之间的一致性损失。IVH所形成的闭塞现象脑室内出血，即脑室周围的血管破了，导致有血液涌入脑室内。

2023-01-13 15:15:36 257

原创 MS【1】：Metric

等主要总结了有关医学图像分割领域几种常用的模型评价标准，会根据在后续论文中遇到的指标进行补充和修改。

2023-01-11 16:38:03 882 2

原创 Python【2】：list

列表 (List) 是 Python 中最基本的数据结构之一，在诸多场景中有着广泛的应用，本文对列表 (List) 的用法做详细说明。

2023-01-05 10:12:12 481 1

原创 Python【1】：input()

input是从键盘获取用户输入的重要函数。

2023-01-04 20:35:14 136

原创 Deep Learning for Medical Image Segmentation: Tricks, Challenges and Future Directions

本文旨在分析一下作为医学图像分割入门的综述，可以比较直观和全面的了解一些用于医学图像分割领域的 tricks。最近的医学图像分割领域其主要贡献往往侧重于网络架构，训练策略和损失函数方面的提升，而无意中忽略了一些边缘细节（也被称作技巧）。在这篇文章中，我们收集了不同模型实现阶段（即预训练模型、数据预处理、数据增强、模型实现、模型推理和结果后处理）的一系列医学图像分割的技巧。博客参考。

2022-12-29 18:19:04 507

原创 MS-Train【1】：nnUNet

nnUNet是德国癌症研究中心的工程师编写的框架，迄今为止依旧在维护和更新。本文主要记载 nnUNet 从安装到训练再到推理的过程。按照上面的流程执行一遍后，就可以得到属于你自己的 nnUNet 了！训练参考推理参考。

2022-12-27 14:47:14 1388

原创 MS-Train【2】：nnFormer

本文主要记载 nnFormer 从安装到训练再到推理的过程。nnFormer 的环境十分难配，训练和推理都是 2 行代码搞定，要想成功训练 nnFormer，首先得确保自己的环境配置的没有问题。按照上面的流程执行一遍后，就可以得到属于你自己的 nnFormer 了！参考资料。

2022-12-26 18:48:47 2026 8

原创 tmux 非 root 用户安装 & 用法详解

本文主要记录了用于服务器训练时，进程守护的终端工具tmux的用法本文主要记载有关 tmux 的使用方法。

2022-12-25 22:42:11 524

原创 Pytorch 中使用 Tensorboard 的技巧

本文主要记录了如何在 pytorch 中利用 Tensorboard 可视化训练过程完整详细的 Tensorboard 可视化方法请看第 3 小节，精简版使用可直接看第 4 小节TensorBoard 是一组用于数据可视化的工具。它一开始包含在流行的开源机器学习库 Tensorflow 中，后来拓展到 Pytorch 库中。可视化模型的网络架构跟踪模型指标，如损失和准确性等检查机器学习工作流程中权重、偏差和其他组件的直方图显示非表格数据，包括图像、文本和音频将高维嵌入投影到低维空间。

2022-11-13 16:00:52 1716 1

原创 CV-Model【7】：Swin Transformer

是的一种类型。它通过合并深层的图像斑块（灰色显示）来建立分层的特征图，由于只在每个局部窗口（红色显示）内计算，所以计算复杂度与输入图像大小成线性关系。因此，它可以作为图像分类和密集识别任务的通用backbone。相比之下，以前的视觉变换器产生单一的低分辨率的特征图，并且由于全局的的计算，对输入图像的大小有二次计算的复杂性。本文介绍了一种称为的新视觉，它可以作为CV的通用主干。将从语言适应到视觉方面的挑战来自两个域之间的差异，例如视觉实体的规模以及相比于文本单词的高分辨率图像像素的巨大差异。

2022-10-13 23:23:37 1857 1

原创 CV-Model【6】：Vision Transformer

或称ViT，是一种用于图像分类的模型，在图像的补丁上采用了类似的结构。一幅图像被分割成固定大小的斑块，然后对每个斑块进行线性嵌入，添加位置嵌入，并将得到的向量序列送入一个标准的编码器。为了进行分类，使用了向序列添加额外的可学习"分类标记"的标准方法虽然架构已成为 NLP 任务的事实标准，但它在 CV 中的应用仍然有限。在视觉上，注意力要么与卷积网络结合使用，要么用于替换卷积网络的某些组件，同时保持其整体结构。

2022-10-08 16:04:04 2515 6

原创 CV-Model【5】：Transformer

是一种模型架构，它摒弃了递归，而是完全依靠注意力机制来得出输入和输出之间的全局依赖关系。在之前，主流的序列转换模型是基于复杂的递归或卷积神经网络，包括一个编码器和一个解码器。也采用了编码器和解码器，但去除递归而采用注意力机制，可以比RNN和CNN等方法明显地实现更多的并行化。原论文侧重于在NLP领域的贡献，所以本文主要针对其提出的和进行分析。

2022-10-05 23:26:46 1008

原创 MS-Model【1】：nnU-Net

本文提出的nnU-net（），是在 2D & 3D 经典 U-net 的基础上，稳健而又自适应的框架。nnU-net移去了冗余的部分，着重于剩下的对模型表现和泛化能力起作用的部分U-Net凭借其直接和成功的架构，迅速发展成为医学图像分割领域的一个常用基准。然而，U-Net对新问题的适应性包括关于确切的架构、预处理、训练和推理的几个自由度。这些选择并不是相互独立的，而是对整体性能有很大影响。本文介绍了nnU-Net（no-new-Net），它是指在二维和三维虚构U-Net。

2022-10-02 10:04:41 1697

原创 ML【1】：决策树

决策树是一种解决分类问题的算法在分类问题中，表示基于特征对实例进行分类的过程，可以认为是的集合，也可以认为是定义在特征空间与类空间上的条件概率分布本文基于北京邮电大学周芮西老师开设的公选课——统计机器学习及应用实践决策树是典型的分类方法相关概念决策树的特点决策树技术发现数据模式和规则的核心是归纳算法（Inductive algorithm）归纳（归纳推理）归纳学习由于依赖于检验数据，因此又称为检验学习决策树学习的算法通常是一个递归地选择最优特征，并根据该特征对训练数据进行分割，使得各个子数据集有一个最好

2022-09-30 01:29:07 736

原创 SS-Model【6】：U2-Net

U2Net 是基于 Unet 提出的一种新的网络结构，同样基于 encode-decode，作者参考 FPN 和 UNet，在此基础之上提出了一种新模块 RSU（ReSidual U-blocks)。经过测试，对于分割物体前、背景取得了惊人的效果。同样具有较好的实时性，经过测试在 P100 上前向时间仅为18ms（56fps）。在本文中，作者设计了一个简单而强大的深度网络架构 -- U-Net，用于显著性物体检测（SOD）。我们的 U-Net 的结构是一个两级嵌套的 U 型结构。由于我们提出的。

2022-09-25 15:39:34 1814

空空如也

空空如也