寒叶秋枫-CSDN博客

原创考研数据结构（代码篇）

数据结构考研算法题

2022-07-10 11:14:05 7710 2

原创 Restore Anything with Masks: Leveraging Mask Image Modeling for Blind All-in-One Image Restoration

本文提出了一个用于一体化盲图像恢复的简单流程，即“基于掩码恢复一切”（RAM）。我们通过掩码图像建模来提取图像的固有信息，从而聚焦于图像内容，而非像其他方法那样去区分退化类型。我们的流程包括两个阶段：掩码图像预训练和带掩码属性传导的微调。我们设计了一种简单直接的掩码预训练方法，专门为一体化图像恢复量身定制。这种方法对网络进行了增强，使其能够优先从各种退化中提取图像内容先验，从而在不同的恢复任务中实现更均衡的性能，并取得更优异的整体结果。

2026-01-13 10:48:07 1041

原创 UltraLED: Learning to See Everything in Ultra-High Dynamic Range Scenes 【论文阅读】

超高动态范围（UHDR）场景在明亮区域和黑暗区域之间表现出显著的曝光差异。这种情况在有光源的夜间场景中很常见。即使使用标准曝光设置，也常常会出现具有边界峰值的双峰强度分布，这使得同时保留高光和阴影细节变得困难。基于RGB的包围曝光方法可以通过长短曝光对捕捉两端的细节，但容易出现错位和重影伪影。我们发现，短曝光图像已经保留了足够的高光细节。超高动态范围（UHDR）重建的主要挑战在于降噪和恢复暗部区域的信息。与RGB图像相比，RAW图像由于其更高的位深度和更可预测的噪声特性，在应对这一挑战方面具有更大的潜力。

2026-01-03 16:17:27 903

原创深度学习之优化器

之前的随机梯度下降法，对所有的参数，都是使用相同的、固定的学习率进行优化，但是不同的参数的梯度差异可能很大，使用相同的学习率，效果不会很好。把指数加权平均在初期“偏小”的问题修正掉，从而保证优化器在早期能稳定、合理地更新参数。思想：让参数的更新具有惯性，每一步更新都是由前面梯度的累积v和当前点梯度g组合而成。假设需要更新的参数为w,梯度为g，更新策略可以表示为。RMSProp在Adagrad的基础上，进一步在学习率的方向上优化。多元损失函数，梯度也是多元的，由d个偏导数组成。为动量参数，v为累计梯度，

2025-08-17 21:33:10 713

原创 UNIVERSAL IMAGE RESTORATION PRE-TRAINING VIA DEGRADATION CLASSIFICATION

本文提出了退化分类预训练（DCPT）方法，该方法使模型能够学习如何对输入图像的退化类型进行分类，以用于通用图像恢复预训练。与现有的自监督预训练方法不同，DCPT将输入图像的退化类型用作一种极其微弱的监督，这种监督很容易获得，甚至在所有图像恢复数据集中都是内在存在的。DCPT包括两个主要阶段。首先，从编码器中提取图像特征。随后，利用一个轻量级解码器（如ResNet18），仅根据第一阶段提取的特征对输入图像的退化类型进行分类，而不使用输入图像。

2025-08-10 20:52:40 977

原创 Perturbative Neural Networks

卷积神经网络在计算机视觉系统中得到广泛应用，在一系列视觉识别任务中有众多应用。这一进展在很大程度上得益于卷积神经网络架构和学习算法的进步，尽管卷积层的基本原理一直没有改变。在本文中，我们试图重新审视卷积层，该层一直是最先进的视觉识别模型的核心组成部分。我们引入了一个非常简单但有效的模块，称为扰动层，作为卷积层的替代方案。扰动层摒弃了传统意义上的卷积，而是将其响应计算为经过非线性激活的加性噪声扰动输入的加权线性组合。我们从理论和实证两方面证明，这种扰动层可以有效地替代标准卷积层。

2025-08-07 16:43:33 995

原创 FrePrompter: Frequency self-prompt for all-in-one image restoration

基于深度学习的模型在图像恢复方面取得了前所未有的成功。然而，现有的方法局限于特定任务的恢复，当退化类型发生变化时，模型性能并不理想。在本文中，我们提出了一种新颖的提示学习方法，称为频率自提示（FSP），专为图像恢复定制。受频率特性的启发，FSP利用输入图像的退化信息生成频率提示，动态引导恢复网络去除相应的损坏。一方面，频率表示可以分离图像退化和内容成分，这使得学习退化信息更加有效。另一方面，频域自然地编码了全局分布的特定退化信息。

2025-08-04 20:19:07 1269

原创 Gumbel-Softmax函数

Gumbel-Softmax是一种可微的离散分布采样方法，通过向logits添加Gumbel噪声并应用温度控制的softmax来近似argmax操作，实现端到端训练。该技术广泛应用于神经架构搜索和强化学习等需要离散决策的场景。Gumbel噪声来自极值分布，采样公式为g=-log(-log(U))。温度参数调节输出分布：高温使结果平滑，低温趋近one-hot。训练时通常采用退火策略，从高温逐渐降低。相比普通softmax，Gumbel-Softmax通过噪声扰动模拟了真实的采样行为，同时保持可微性。

2025-08-03 20:19:45 1170

原创 Beyond Degradation Redundancy: Contrastive Prompt Learning for All-in-One Image Restoration

一体化图像修复，即使用统一模型处理多种退化类型，在设计特定任务提示词方面面临重大挑战，这些提示词需能在多种退化场景下有效引导修复工作。虽然自适应提示学习能够实现端到端优化，但它往往会产生重叠或冗余的任务表征。相反，从预训练分类器得出的显式提示虽然增强了可辨别性，但可能会丢弃重建所需的关键视觉信息。为解决这些局限性，我们引入对比提示学习（CPL），这是一个全新的框架，通过两项互补创新从根本上提升提示与任务的一致性：一个稀疏提示模块（SPM），它能在尽量减少冗余的同时高效捕捉特定退化特征；

2025-07-11 20:36:55 1168

原创 Debiased All-in-one Image Restoration with Task Uncertainty Regularization

一体化图像恢复是一项基础的底层视觉任务，在现实世界中有重要应用。主要挑战在于在单个模型中处理多种退化情况。虽然当前方法主要利用任务先验信息来指导恢复模型，但它们通常采用统一的多任务学习，忽略了不同退化任务在模型优化中的异质性。为消除偏差，我们提出一种任务感知优化策略，为多任务图像恢复学习引入自适应的特定任务正则化。具体而言，我们的方法在训练过程中动态加权并平衡不同恢复任务的损失，促使实施最合理的优化路径。通过这种方式，我们能够实现更稳健且有效的模型训练。

2025-07-06 11:14:20 947

原创 Learning to Prompt for Continual Learning

持续学习背后的主流范式是使模型参数适应非平稳数据分布，其中灾难性遗忘是核心挑战。典型方法依赖于排练缓冲区或测试时已知的任务标识来检索已学知识并解决遗忘问题，而这项工作提出了一种持续学习的新范式，旨在训练一个更简洁的记忆系统，且在测试时无需访问任务标识。我们的方法学习动态提示（L2P）预训练模型，以便在不同任务转换下顺序学习任务。在我们提出的框架中，提示是可学习的小参数，保存在记忆空间中。目标是优化提示以指导模型预测，并在保持模型可塑性的同时，显式管理任务不变和特定于任务的知识。

2025-06-28 16:39:02 1292

原创 Prompt-Based Ingredient-Oriented All-in-One Image Restoration

图像恢复旨在从退化的观测中恢复高质量图像。由于大多数现有方法都致力于去除单一退化，它们在其他类型的退化上可能无法产生最佳结果，这无法满足现实场景中的应用需求。在本文中，我们提出了一种新颖的面向数据成分的方法，该方法利用基于提示的学习，使单个模型能够高效处理多种图像退化任务。具体来说，我们使用一个编码器来提取特征，并引入包含特定退化信息的提示，以指导解码器自适应地恢复受各种退化影响的图像。

2025-06-27 16:21:50 1149

原创 github使用指南

原理：Git会记录每次commit，并为每个版本打上唯一ID，可以随时回到任意一个版本。然后根据提示保存路径，设置密码。

2025-06-27 14:57:35 635

原创 Learning Dynamic Prompts for All-in-One Image Restoration

例如，AirNet [19] 采用自监督预训练来学习退化表示。PromptIR [20] 引入了一种自适应提示框架，其中提示直接进行参数化，并与恢复模型联合优化。这种端到端的方法利用模型自身的优化来捕捉数据和任务先验，提供了一种高效的解决方案。PromptIR 取得了显著的性能提升，并启发了众多后续研究 [22]、[23]。但是，这些提示学习缺乏明确的约束，可能导致表达和判别能力有限。端到端学习过程受数据集的影响很大，而提示学习缺乏约束可能会导致不同退化类型之间的混淆，无法实现任务感知的提示表示。

2025-06-24 15:06:13 983 1

原创 InstructIR: High-Quality Image Restoration Following Human Instructions

图像恢复是一个基本问题，涉及从退化的观测中恢复高质量的清晰图像。一体化图像恢复模型可以利用特定于退化的信息作为提示来指导恢复模型，从而有效地从各种类型和程度的退化中恢复图像。在这项工作中，我们提出了第一种使用人工编写的指令来指导图像恢复模型的方法。给定自然语言提示，我们的模型可以从退化的图像中恢复高质量图像，同时考虑多种退化类型。我们的方法InstructIR在包括图像去噪、去雨、去模糊、去雾和（低光照）图像增强在内的多项恢复任务上取得了最先进的结果。InstructIR比以前的一体化恢复方法提高了1dB。

2025-06-22 16:22:01 1056

原创 DECOUPLING REPRESENTATION AND CLASSIFIER FOR LONG-TAILED RECOGNITION

在本文中，我们将学习过程解耦为表征学习和分类，系统地探究不同的平衡策略如何对长尾识别产生影响。研究结果令人惊讶：（1）数据不平衡在学习高质量表征时可能并非问题；（2）通过最简单的实例平衡（自然）采样学习得到的表征，仅通过调整分类器也有可能实现强大的长尾识别能力。我们进行了大量实验，并在常见的长尾基准测试（如ImageNet-LT、Places-LT和iNaturalist）上创造了新的最先进性能，表明通过使用一种将表示与分类解耦的简单方法，有可能超越精心设计的损失函数、采样策略，甚至是带有记忆的复杂模块。

2025-06-17 21:43:40 939

原创深度学习踩坑实践

【代码】Cond环境配置。

2025-06-12 10:42:06 193

原创 TPSeNCE: Towards Artifact-Free Realistic Rain Generation for Deraining and Object Detection in Rain

雨天生成算法可能提高雨天场景的去雨算法泛化性和场景理解。但是，由于缺乏适当的约束，它们会产生伪影和失真，并难以控制产生的降雨量。在本文中，我们提出了一个 image-to-image translation framework 来生成真实的雨天图像。我们首先引入了一个Triangular Probability Similarity (TPS)约束来引导生成的图像朝向清晰和多雨的图像，从而最大限度地减少降雨生成过程中的伪影和失真。

2024-12-20 16:09:07 1249

原创基于深度估计的雾天模拟方法

按照式（1）对不同能见度的雾天图像进行模拟，其过程如图 2 所示：首先对无雾目标图像进行深度图估计和大气光值估计，再设定能见度计算大气消光系数估计透射率图，最后利用大气散射模型进行雾天图像模拟，得到设定能见度下的模拟雾天图像。我们可以从双边滤波出发来思考引导滤波，在双边滤波中权重 W 由空间域与色彩域共同决定，距离越近的像素点的贡献越大，色彩域的贡献与颜色的相似性正相关，其实引导滤波也同样如此。可以被不同的窗口中的线性系数求得，且不同窗口得到的输出值不同，因此对这些值求均值，最终得到的。

2024-12-11 21:17:13 1124

原创 Momentum Contrast for Unsupervised Visual Representation Learning

将对比学习看成字典查询任务队列里的样本不需要梯度回传，所以可以往队列里塞很多负样本，将字典变得很大移动平均编码器将字典里的特征尽量的保持一致在训练过程中发现，如果有一个很大且比较一致的字典对无监督的对比学习非常有好处。

2024-12-08 13:43:48 863

原创交叉熵损失

对于第i个样本，它的真实类别标签为yi，模型的输出logits为xi=(xi1,xi2,…有一个二分类问题，真实类别P={1，0} （即类别1的概率为1，类别0的概率为0），而模型预测Q给出了类别1和类别0的概率：Q={0.8，0.2}在分类问题中，最小化KL散度等价于最小化交叉熵损失，因为数据集的熵H（P）是个确定的值，即训练数据的分布是固定的。KL散度是不对称的，衡量的是如果我们用分布Q代替真实分布P，我们会额外损失多少信息，熵代表信息量，熵越高信息量越高，信息量高意味着这件事发生的概率低。

2024-11-27 11:08:26 1052

原创 Multistage Enhancement Network for Tiny Object Detection in Remote Sensing Images

小目标检测面临着两个挑战：1、Iou对微小物体位置偏差的高灵敏度2、微小物体低质量特征表示为了解决上述问题，我们提出了多阶段增强网络MENet，该网络完成了对检测器多个阶段微小物体的实例级和特征级增强，由于基于IoU的标签分配极大地恶化了微小物体的正样本，我们首先提出了一种基于中心区域（CR）的标签分配，以在区域建议网络（RPN）中替换它。CR标签分配将落入地面真值框CR中的锚点视为阳性样本，这为微小物体提供了更多的阳性样本。

2024-08-17 17:51:09 876 1

原创深度学习之参数初始化问题

如果输入不止3个，而是n个输入，y的离散程度将会被进一步放大，当不使用任何激活函数的时候，放大的y值将被累积在反向传播的过程里，这将造成梯度爆炸，如果使用tanh作为激活函数，也有可能因为y的值过大或者过小得到一个非常小或者非常大的梯度，造成梯度爆炸和梯度消失。当参数都初始化为0，两个神经元的梯度一样，初始值一样，最后会导致训练过程中的变化也一样，无法学习更复杂的特征，这种情况称为对称现象。2、方差的线性性质：对于两个随机变量X和Y，如果它们是独立的，那么Var(X+Y) = Var(X) +Var(Y)

2024-08-03 20:49:06 1193

原创 Sobel Operator

边缘是指图像中灰度或颜色强度发生显著变化的区域。Sobel算子是一种用于图像处理的边缘检测算子。它通过计算图像灰度值的梯度来检测图像中的边缘。

2024-07-30 20:25:10 410

原创 pytorch-广播机制

如果对应维度为1，则扩展到相同尺寸，如果对应没有维度，也扩展到相同尺寸，除此以外均无法扩展。B[8] = [0,0,5,0,0,0,0,0] => B[4, 32, 8] 给每一个学生的第三门课加5分。B[1] => B[4, 32, 8] 给每一个学生每一门课加5分。B[4] 无法广播自动扩展，因为维度对不上，产生歧义？A[4, 32 ,8] 4个班级32个学生八门课。什么时候需要使用broadcasting?为什么要使用broadcasting？

2024-07-30 14:35:00 483

原创 Feature Corrective Transfer Learning （2024CVPR）

特征相似性损失Lfs旨在有效地衡量在理想图像上训练的模型特征图与在非理想图像上训练的模型特征图在结构和内容上的差异。该机制确保了平衡的模型训练，优先考虑早期阶段的主要差异以获得整体性能，并随着特征图差异的减少，在后期阶段转向更精细的调整，促进细微的结构对齐，以提高目标检测精度。它评估由半径rL定义的扩展领域内梯度变化的一致性。时变衰减因子，引入了一种动态机制来调整整个训练期间损失函数的响应性，这一因素的实施促进了模型重点的方法转变，从纠正初始训练阶段的突出结构差异到在训练过程的后续阶段磨练更精细的细节。

2024-07-30 11:33:17 838

原创 Pytorch的基本数据类型

pytorch和python的数据类型不同。同一数据放在不同位置也是不一样的数据类型。怎么表示string？每个位置代表一个单词。

2024-07-28 16:15:46 236

原创 Pytorch-手写数字识别

以识别手写数字为例，手写数字从0-9preW3∗W2W1Xb1b2b3上述式子是一个很简单的线性模型，但是线性模型并不能应用到复杂任务上去，我们在每一次线性的后边加入一个激活函数，增强模型的非线性表达能力。H1reluXW1b1H2reluH1W2b2H3reluH2W3b3pre输出是one-hot向量。

2024-07-27 15:05:46 554

原创目标检测损失计算部分（YOLO）

标准化坐标的增益张量（gain tensor）用于将归一化的目标转换为特定特征层的网格尺度，以便进行匹配和计算。在目标检测模型中，输入图像被划分为多个网格，每个网格负责预测多个锚框。锚框的尺寸在不同特征层上有所不同，以便检测不同尺度的目标。1、增益张量将归一化的目标坐标转换为特征图的网格尺度增强张量的初始值是一个全1的张量，长度为 7，目标信息包括图像索引、类别、x、y，w，h和锚框索引2、更新增益张量以匹配当前特征图的尺度3、将归一化的目标乘以增益张量，以转换为特征图的尺度。

2024-07-26 20:06:09 467

原创 pytorch-梯度下降

在多变量中，梯度方向表示函数值增加最快的方向。1、学习率过大会使算法难以收敛，且波动很大。2、学习率过低可能导致算法收敛过慢。在单变量中，梯度就等于导数。

2024-07-25 20:24:56 1289 1

原创 R-YOLO

提出了一个框架，名为R-YOLO，不需要在恶劣天气下进行注释。考虑到正常天气图像和不利天气图像之间的分布差距，我们的框架由图像翻译网络（QTNet）和特征校准网络（FCNet）组成，用于逐步使正常天气域适应不利天气域。具体来说，我们使用简单而有效的QTNet来生成图像，这些图像继承了正常天气域中的注释，并对两个域之间的间隙进行插值。然后，在FCNet中，我们提出了两种基于对抗性学习的特征校准模块，以局部到全局的方式有效地对其两个领域中的特征表示。

2024-01-29 16:54:18 1314

原创 Domain Adaptive Object Detection for Autonomous Driving under Foggy Weather

大多数自动驾驶的物体检测方法通常假设训练和测试数据之间的特征分布一致，但当天气差异显著时，情况并非总是如此。在晴朗天气下训练的目标检测模型在大雾天气下可能由于域间隙而不够有效。本文提出了一种新的雾天自动驾驶领域自适应目标检测框架。我们的方法利用图像级别和对象级别的自适应来减少图像风格和对象外观的领域差异。我们的方法利用图像级别和对象级别的自适应来减少图像风格和对象外观的领域差异。为了进一步增强模型在具有挑战性的样本下的能力，我们还提出了一个新的对抗性梯度反转层，用于对困难样本进行对抗性挖掘和领域自适应。

2024-01-28 19:20:27 1599

基于VUE+axios实现的网抑云播放器.zip

空空如也