范特西z-CSDN博客

原创 [Python] CfgNode

在看别人代码的时候是不是经常看见这些个CN()yacs（Yet Another Configuration System）库中的CfgNode类，并将其别名为CNyacs是一个用于处理配置文件的 Python 库，特别是在机器学习和深度学习项目中非常有用。它提供了一个灵活的配置系统，可以使得管理和修改配置文件变得更加简单和高效。CfgNode。

2024-08-30 15:51:04 273

模块提供的一个类，用于处理命令行参数。它使得编写用户友好的命令行接口变得简单和直观。description : 描述所创建的ArgumentParser是干啥的用途。最近看代码这个类之前都是简单看过去了今早仔细看了一下做个记录。参数，则将帮助信息输出到该文件对象；否则，打印到标准输出。参数被指定，则解析该参数列表，否则解析。3> 使用parse_args解析参数。解析命令行参数，并返回一个包含参数值的。是 Python 标准库中的。对象添加一个命令行参数。

2024-08-30 11:18:32 353

原创【论文笔记】Bisenet 2

低层细节和高层语义对于语义分割任务都是至关重要的。然而，为了加速模型推理，当前的方法几乎总是牺牲低级细节，这导致准确性大幅下降。我们建议分别处理这些空间细节和分类语义，以实现实时语义分割的高精度和高效率。为此，我们提出了一种高效且有效的架构，在速度和准确性之间取得了良好的权衡，称为双边分割网络（BiSeNet V2）。该架构涉及：（i）一个细节分支，具有宽通道和浅层来捕获低级细节并生成高分辨率特征表示；(ii) 语义分支，具有狭窄的通道和深层，以获得高级语义上下文。

2024-08-28 18:12:00 862

原创【论文笔记】BiseNet 1

语义分割需要丰富的空间信息和相当大的感受野。然而，现代方法通常会牺牲空间分辨率来实现实时推理速度，从而导致性能不佳。在本文中，我们通过一种新颖的双边分割网络（BiSeNet）解决了这一困境。我们首先设计一个小步幅的空间路径，以保留空间信息（spatial information）并生成高分辨率特征（high-resolution feature）。同时，采用具有快速下采样策略的上下文路径（Context Path ）以获得足够的感受野（Sufficient receptive fiels）。

2024-08-28 11:34:42 746 1

原创 [论文笔记] SANET

目前，实时语义分割网络通常采用编码器-解码器架构或双路径架构。一般来说，编码器-解码器模型往往更快，而双路径模型则表现出更高的准确性。为了利用这两种优势，我们提出了空间辅助编码器-解码器网络（SANet）来融合这两种架构。在整体架构中，我们坚持编码器-解码器设计，同时保留编码器中间部分的特征图，并利用空洞卷积分支进行相同分辨率的特征提取。在编码器的末端，我们集成了非对称池金字塔池模块（APPPM）来优化特征图的语义提取。该模块包含非对称池化层，可以以多种分辨率提取特征。

2024-08-27 17:02:26 774

原创【论文笔记】 BSSNET

尽管语义分割方法迄今为止已经取得了显着的进步，但其较长的推理过程限制了其在实际应用中的使用。最近，已经提出了一些二分支和三分支实时分割网络，通过添加分支来提取空间或边界信息来提高分割精度。对于提取空间信息分支的设计，保留高分辨率特征或添加分割损失来引导空间分支是提取空间信息的常用方法。然而，这些方法并不是最有效的。为了解决这个问题，我们将空间信息提取分支设计AutoEncoder结构，它允许我们在AutoEncoder的编码和解码过程中提取图像的空间结构和特征。

2024-08-23 18:32:11 907

原创 Balancing the Details and Contexts

这个专题主要写各个论文中平衡细节和上下文信息的模块其设计初衷都是为了不让context path 和spatial path的信息相互淹没会持续更新。

2024-08-06 16:06:01 472

原创 [论文笔记] RDRNET

语义分割在自动驾驶、医学图像等应用中发挥关键作用。尽管现有的实时语义分割模型在准确性和速度之间取得了令人称道的平衡，但它们的多路径块仍然影响整体速度。为了解决这一问题，提出了一种用于实时语义切分的可重参数化双分辨率网络（RDRNet）RDRNet采用两分支结构，在训练过程中利用多路径块，在推理过程中将其重新参数化为单路径块，从而同时提高了推理精度和推理速度。在此基础上，提出了可重参数化的金字塔池模块（RPPM），在不增加推理时间的前提下，增强了金字塔池模块的特征表示能力。

2024-08-03 10:45:59 620 1

原创 [论文笔记]PP-LiteSeg

实际应用对语义切分方法有着很高的要求。尽管语义切分在深度学习中取得了显著的进步，但实时切分方法的性能并不令人满意。为此，本文首次提出了一种新的轻量级的实时语义切分模型PP-LiteSeg.作者主要设计了三个新的模块1: FLD 提出了一种灵活和轻量级的解码器（FLD），以减少以往解码器的计算开销2: 为了增强特征表示，提出了一种统一注意力融合模块（UAFM），该模块利用空间和通道注意力产生一个权值，然后将输入特征与权值进行融合。

2024-07-30 11:43:10 731 1

原创 Resnet中扩展因子expansion的作用

具体地说，假设输入特征图大小为H×W×C（高×宽×通道），经过步幅为2的卷积操作后输出特征图大小将变为H/2×W/2×C_new。（当步幅不为1时，由于卷积操作会缩小特征图尺寸，因此需要通过适当调整扩展因子来确保快捷连接和主路径上的特征图维度对齐，并且使它们的通道数一致，以便进行相加操作。总之，扩展因子在ResNet中用于控制残差块内部卷积层输出通道与输入通道之间的比例关系，并且当出现步幅不为1时需要根据步长变化来进行相应调整以确保主路径和快捷连接能够对齐。今天看了一下有了新的感受。

2024-07-12 21:43:29 302

原创 [论文笔记] PIDNET

作者首先肯定了双分支的作用然后说直接融合高分辨率细节特征图和low-frequency(通常指的是变化缓慢或频率较低的部分，也可以理解为图像中较大区域的整体信息或背景信息。这种低频率的内容通常包含了图像的整体结构、背景或环境，而不是细节性的高频率信息)上下文信息可能会出现overshoot现象(可能是两方信息不是很对等直接融合可能会淹没另一方的信息细节特征容易被周围上下文信息淹没)

2024-07-10 14:55:39 983 2

原创 [论文笔记] DDRNET

作者说尽管最近的实时语义分割方法已经很快了但是仍然比不过基于膨胀卷积的方法作者提出DDRNET 经典的two-branch 设计了一条新的上下文提取模块(DAPPM)能增大感受野并且能基于低分辨率特征图融合多尺度上下文信息。

2024-07-09 17:31:15 795

原创 [论文笔记]DSNET

作者首先肯定了空洞卷积的作用发现之前没将空洞卷积应用到模型的浅层(shallow layer)中并且作者验证使用大的卷积核来应用空洞卷积可能更加有效作者提出了DSNET 将空洞卷积用在了模型的浅层中并且将整个enconder都在imagenet上做了预训练作者说其实现了新sota作者从RepLKNet在这篇论文中得到的灵感说:感受野的有效范围比注意力还关键说在RepLKNet以及几篇论文中堆叠空洞卷积没啥用但是他们没在浅层中使用。

2024-07-08 21:22:47 975 2

原创 [论文笔记] STDC

作者说双分支网络很受欢迎但是多加了一条分支太耗时,并且借用的是分类任务的backbone,没有专门为语义分割设计的.作者提出了STDC网络,逐渐减少特征图的维度.这里没啥好说的,写论文的时候可以仿写,改改可以用. 主要是说分类任务的backbone不能很好适应分割任务.最后两段说了连接多个连续的特征图,为了加快速度,将层的卷积核个数逐渐减少相较于添加另外一条分支,作者使用细节指导来指导低层学习空间特征(这个后面有介绍)

2024-07-04 11:45:51 460 1

cheng_xuzhu的博客