小王Jacky-CSDN博客

原创在Cursor中使用graphify

在Cursor中使用graphify

2026-04-22 16:33:25 478

原创 [特殊字符]️ 技术方案文档：下一代轻量化解码器设计 (MambaCD_light_v2)

下一代轻量化解码器MambaCD_light_v2技术方案提出三大创新改进：1）采用可重参数化的RepRectBlock，通过训练时1x3/3x1卷积和推理时3x3转换，高效捕捉建筑物矩形特征；2）设计StructureGatedFusion模块，利用边缘特征过滤skip connection中的背景噪声；3）引入多尺度特征聚合。方案在不增加推理参数量的前提下，预期将F1-score提升至90.0%，IoU提高2.75%，有效解决现有架构的形状失配、融合粗糙和边缘被动问题。

2026-02-18 20:48:59 44

原创 MambaCD_light_v0修改意见

aux_logits_list: List[[B, 2, H_i, W_i]] 辅助输出。- 修改 FrequencyAwareFusion.forward (第 450-467 行)✅ 建议 2: Mamba-CNN 桥接层 (Global Context Bridge)- 替换 PixelShuffle 为 DySample (建议 3, 第 470-543 行)🔥 建议 8: 类别平衡损失 (Class-Balanced Loss)- LEVIR-CD+ 数据集严重不平衡 (背景:变化 ≈ 7:1)

2026-02-14 22:41:17 47

原创核心模块详解：Rep-ERFB (Rep-Parameterizable Edge-Enhanced Receptive Field Block)

本文提出Rep-ERFB模块，通过重参数化机制和辅助监督思想改进RFB模块，解决遥感图像变化检测中全局语义与局部边缘难以兼顾的问题。该模块在训练时采用多分支RepConv和显式边缘监督，推理时合并为单分支并移除辅助头，实现零成本边界感知。实验表明，Rep-ERFB在保持高精度的同时显著提升推理速度，为Mamba架构提供了有效的局部特征补充。

2026-01-31 13:15:08 66

原创模块集成与使用指南 (Integration & Usage Guide)

本文详细介绍了如何在ChangeDecoder中集成BDGMAM和RFB模块。主要内容包括：1）整体改造逻辑，移除原有模块并新增BDGMAM和RFB；2）模块实例化与参数配置，分阶段说明各层通道数设置；3）前向传播流程，展示数据在各模块间的流动；4）关键注意事项，包括Stage4特殊处理、通道匹配和部署模式切换。通过重构解码器架构，实现了更高效的特征交互和融合，同时支持训练/推理模式的无缝切换。

2026-01-27 23:14:30 52

原创边缘感知型重参数化融合模块 (EP-RFB)

本文提出了一种轻量化的重参数化特征融合模块(Rep-FusionBlock, RFB)，用于变化检测任务的解码器设计。RFB采用"训练多路并行、推理单路折叠"的重参数化架构，包含多源特征聚合和层级级联融合两个核心功能。该模块整合了RepVGG的结构重参数化、Changer的特征交互理念和ACAHNet的层级融合策略，在保证性能的同时实现高效推理。针对解码器起始层(Stage1)的特殊情况，RFB-S1采用简化的"聚合-增强"结构，专注于底层特征处理。实验表明，RFB在

2026-01-27 23:08:52 57

原创改进版技术描述文档：双时相差异引导的掩码注意力模块 (BDGMAM)

摘要：本文提出双时相差异引导的掩码注意力模块(BDGMAM)，通过三个创新子模块实现鲁棒的特征融合：1)DAMG采用5×5深度卷积生成抗配准误差的差异掩码，并引入TemperatureSoftmax优化梯度；2)MG-DAU利用掩码引导双路注意力，增强变化区域特征；3)AFL通过重参数化卷积和全局残差连接确保信息保真。该模块显著提升了抗配准误差能力，优化了梯度传导，并实现了零信息丢失风险，为双时相图像分析提供了可靠的解决方案。

2026-01-27 22:06:38 60

原创轻量化遥感变化检测复现任务

本文汇总了多个遥感影像变化检测相关数据集与模型资源，主要包括LEVIR-CD、WHU-CD、SYSU-CD等常用数据集，以及RS-Mamba、ChangeMamba、Mobile-CDNet等深度学习模型。这些资源覆盖二分类变化检测、语义变化检测等任务，涉及城市、郊区等多种场景。各模型均提供开源代码和论文DOI链接，部分还包含轻量化版本。数据集获取方式包括GitHub、百度网盘等公开渠道，为遥感变化检测研究提供了全面的数据与算法支持。

2026-01-17 16:05:30 134

原创 changemamba模块修改

本文介绍了一种用于遥感图像变化检测的差异感知门控模块(DAG Module)及其相关技术组件。DAG Module作为RMG-Block的前置处理模块，通过空间注意力机制动态增强变化区域特征，抑制背景噪声。系统包含多个关键技术：1) RD-Gate模块利用重参数化技术捕捉双时相特征差异；2) Global Context Mamba模块进行全局时空建模；3) RepConv模块增强局部细节感知；4) Prediction Head生成最终变化检测图。这些组件协同工作，在保持轻量化的同时实现了高精度的变化检测

2026-01-17 15:54:28 131

原创 Mamba模型理解

《Mamba：基于选择性状态空间的线性时间序列建模》提出了一种新型神经网络架构Mamba（选择性状态空间模型），作为Transformer的高效替代方案。该模型通过动态选择机制（S6模块）实现输入依赖的参数调整，既能像RNN保持线性时间复杂度（O(L)），又能如Transformer灵活捕捉长程依赖。其核心创新在于：1）打破传统SSM的时不变限制，通过x→B/C/Δ函数实现内容感知记忆；2）设计硬件感知并行算法解决非LTI系统的计算瓶颈。实验表明，Mamba在长序列任务中兼具卓越性能与推理速度，结构上比Tr

2025-10-28 10:19:03 1023

原创什么是SSM（状态空间模型）

摘要：状态空间模型（SSM）源于控制理论，用于描述动态系统，近年来被改进为深度学习中处理长序列的革命性工具。经典SSM通过状态和输出方程描述系统演变，而深度学习中的SSM通过离散化和卷积模式适应序列处理。Mamba在此基础上引入选择性机制，使模型能动态调整参数，兼顾效率与表现力，成为Transformer的有力竞争者。SSM在深度学习中的双重计算模式（递归和卷积）使其高效处理长序列数据。

2025-10-28 08:23:48 1187

原创感受野是什么？以及全局感受野

摘要：CNN中感受野指输入图像影响特征图某单元的区域，随着网络加深而扩大。全局感受野是覆盖整个输入图像的理想情况，能捕获长程依赖关系（如关联猫的分散特征）。Transformer自注意力机制和Mamba模型都能实现全局上下文建模，前者通过全token交互，后者借助选择性扫描机制实现数据依赖的全局建模。（149字）

2025-10-27 19:57:59 411

原创传统变化检测CD方法

遥感图像变化检测方法主要包括四类：1）代数运算法（差值法、比值法、回归法），计算简便但易受干扰；2）变换法（主成分分析、缨帽变换、变化向量分析），通过特征转换提取变化信息；3）分类后比较法，先分类再对比，可识别变化类型但误差易累积；4）机器学习法（SVM、随机森林等），利用分类器直接识别变化区域。这些方法各有特点，适用于不同场景的变化检测需求。

2025-10-26 19:25:36 287

原创 S2Anet介绍

本文提出S²A-Net网络用于旋转目标检测，通过特征对齐模块(FAM)解决传统方法中特征与目标几何不匹配的问题。网络架构包含骨干网络、FPN特征金字塔、FAM模块和检测模块。FAM由锚点优化(ARN)生成高质量旋转Anchor，再通过对齐卷积(ACL)实现特征空间对齐，最终输出分类和回归结果。该设计有效提升了遥感图像中旋转目标（如飞机、建筑物）的检测精度，解决了特征错位和Anchor匹配差等关键问题。

2025-10-11 21:28:23 995

原创理解一下CNN以及卷积

CNN被比喻为"近视眼"，因其卷积核只能聚焦图像的局部区域（3×3像素等），擅长提取细节但缺乏全局视野。卷积过程如同用手电筒扫描图像：核矩阵与图像局部相乘求和，生成特征图（数值越大表示特征越明显）。通过多层堆叠，CNN实现从边缘→部件→整体的层次化理解：底层提取线条颜色，中层识别器官，高层组合成完整物体。这种"局部感受野+多层抽象"的机制，使CNN能间接获得全局信息，但也导致远距离特征关联困难。

2025-10-10 11:42:09 678

原创 MobaXterm的训练启动命令是什么？？关闭MobaXterm会不会影响训练进程？

【SSH训练中断原理与解决方案】使用SSH工具（如MobaXterm）直接运行训练脚本时，关闭终端会导致训练中断，因为SSH会话终止会发送SIGHUP信号终止所有子进程。解决方案： nohup方案：使用命令nohup python train.py > log 2>&1 &让程序脱离终端运行，输出重定向到日志文件，可通过tail -f log查看进度。 tmux方案（推荐）：创建会话：tmux new -s session_name 运行训练后按Ctrl+B D分离会话重连

2025-09-30 14:36:10 502

原创在RSAR项目中插入“CT扫描”和“复数神经网络”模块

本文介绍了如何将"CT扫描"数据增强模块和"复数神经网络"骨干网络封装为可插拔的Python模块，便于集成到MMDetection框架中。首先创建了SarCTScan类实现SAR图像的多通道分解，通过FFT将单通道图像转换为多通道特征图。然后构建了CV_CNN_V1_Backbone复数卷积神经网络，包含复数残差块结构，最后通过修改配置文件实现模块的动态加载。这两个独立模块既保持了算法创新性，又提供了标准接口，只需简单配置即可快速集成到现有目标检测系统中。

2025-09-27 12:47:05 448

原创远程服务器核心快捷指令清单

本文提供了远程服务器操作的核心指令大全，包含三大类常用命令：1. 连接与文件传输（SSH/SCP）；2. 文件目录操作（ls/cd/mkdir等Linux基础命令）；3. 进程监控与系统管理（重点介绍nvidia-smi、ps、kill等GPU/进程管理命令）。特别提供了"实战组合拳"操作指南，通过"GPU状态监控-进程确认-日志跟踪"三步法，帮助用户快速掌握远程训练项目的实时状态监测技巧。文章强调rm -rf等危险命令需谨慎使用，并详细解释了各命令参数的实际应用场景

2025-09-21 23:04:28 638

原创学习笔记：从“CT扫描”到“复数大脑”——SAR目标检测的终极进化

本文提出了一种创新的SAR目标检测方法，通过两项核心技术突破传统局限：1）"CT扫描"技术将单通道SAR图像分解为多频段、多角度的复数多通道图像，利用FFT/IFFT转换保留相位和频率信息；2）"复数大脑"神经网络直接处理复数数据，通过ComplexResNetBlock等复数运算模块提取特征，最后转换为实数预测。该方法突破了传统将SAR图像视为灰度图的局限，充分利用了相位、频率等物理特性信息，在复杂场景下展现出更强的识别能力。两个模块的协同工作为SAR目标检测提供了

2025-09-18 19:20:31 797

原创 U-Net的理解

U-Net采用"U型结构"实现图像分割，其工作流程包含三个关键环节：编码器像侦探提取核心特征，解码器如绘图员补充细节边界，跳跃连接则实现两者实时交互。这种架构先通过编码器压缩图像获取深层语义（如施工区的围挡、土块等核心特征），再由解码器结合浅层特征还原精确位置（如围挡边缘像素），最后通过跳跃连接融合高低层信息，确保分割边界清晰准确。整个过程模拟专业团队协作，最终实现像素级精准分割，满足施工区域识别等精细任务需求。

2025-09-16 12:24:48 115

原创学习笔记：从弱监督到完美约束——SAR有向目标检测模型的演进之路

本文系统梳理了SAR图像有向目标检测模型的演进历程，聚焦如何从仅有水平框标注的弱监督数据中学习旋转框检测。三阶段演进：1）HBox-to-Rbox-v1通过双分支结构，利用外接矩形约束和旋转等变性自监督学习，实现从无到有的角度预测；2）HBox-to-Rbox-v2引入物体对称性先验，通过翻转一致性约束提升角度预测鲁棒性；3）HBox-to-Rbox-v2+UCR采用二维向量表示角度，通过单位圆约束和无效区域策略，从根本上解决角度边界不连续问题。该系列工作逐步解决了弱监督学习、几何先验利用和数值稳定性等核心

2025-09-15 09:17:23 843

原创 P10720 [GESP202406 五级] 小杨的幸运数字

本文介绍了如何通过预处理方法高效判断一个数是否为"幸运数字"（恰好有两种不同质因子）。首先使用埃氏筛法标记质数，然后遍历每个质数的倍数，统计每个数的不同质因子数量。预处理完成后，查询时只需检查计数是否为2即可。该方法预处理复杂度为O(mxloglogmx)，查询复杂度为O(1)，适用于a_i≤1e6、n≤1e4的数据范围。文中包含代码实现、复杂度分析和样例验证，并强调了注意"不同质因子"的含义和处理细节。

2025-09-09 18:15:52 835

原创 P10719 [GESP202406 五级] 黑白格

【摘要】本文介绍了一种解决黑白格子问题的二维滑窗算法。给定n×m的01网格，要求找到包含至少k个黑格子的最小面积子矩形。核心思路是将二维问题转化为一维子段和问题：枚举上下边界确定高度H，维护每列的黑格数数组col，用滑动窗口在col中寻找和≥k的最短连续列段。算法时间复杂度O(n²·m)，空间复杂度O(n·m)，适用于n,m≤100的情况。文章详细解析了算法步骤、易错点，并提供了优化技巧和完整代码实现，最后通过测试案例验证了算法的正确性。

2025-09-09 17:50:13 1059

原创 B4361 [GESP202506 四级] 排序

本文解析了GESP四级考试中的排序与最少相邻交换次数问题。题目要求将队伍按身高降序、体重降序排列，每次只能交换相邻同学，求最少交换次数。解题关键在于理解相邻交换的最少次数等于冒泡排序中的交换次数，即序列中的逆序对总数。文章详细分析了排序规则转化为代码逻辑的过程，包括定义比较条件和冒泡排序实现。代码解析部分说明了使用二维vector存储数据的原因，以及冒泡排序函数中的关键细节。时间复杂度分析表明该解法在题目限制下完全可行。最后总结了易错点及核心收获，强调掌握多关键字排序条件和相邻交换计数的实际应用价值。

2025-09-07 12:15:17 1060

原创 B4360 [GESP202506 四级] 画布裁剪

本文解析了GESP四级真题中的画布裁剪问题。题目要求将一个h行w列的字符矩阵按给定的1-based行列范围(x1-x2,y1-y2)进行裁剪输出。解题关键在于正确将1-based行列编号转换为0-based数组索引，通过遍历指定范围逐字符输出或使用substr函数截取子串。核心易错点是行列索引转换和循环边界处理，需特别注意x1-1到x2-1的转换。文章提供了完整的C++代码实现，分析了O(h*w)的时间复杂度，并讨论了空间优化可能。题目考察基础编程能力，重点在于精确实现需求转换。

2025-09-07 10:04:26 1113

原创 B4264 [GESP202503 四级] 二阶矩阵

本文解析了GESP四级考试中的"好子矩阵"计数问题。题目要求统计给定n×m整数矩阵中所有满足条件的2×2子矩阵数量，条件为子矩阵左上×右下=右上×左下。解题采用暴力枚举法：遍历所有可能的2×2子矩阵，逐个验证条件并计数。由于数据范围较小（n,m≤500），该方法时间复杂度为O(nm)，完全可行。文章详细讲解了代码实现，包括矩阵存储、边界处理、条件判断等关键点，并提醒注意循环边界和元素位置等易错问题。最终强调对于小数据量问题，暴力法是最直接可靠的解决方案。

2025-09-07 08:14:49 1039

原创被导师夸爆的文献工具！Connected Papers 帮我告别 “文献迷宫”

科研文献梳理神器ConnectedPapers：一键可视化学术脉络这款工具通过智能图谱直观展示文献关联，节点大小反映引用量，连线粗细体现关联度，帮助研究者快速定位核心文献与关键演进路径。其筛选功能支持按时间、引用量、开放获取等维度精准检索，而"相关论文"推荐能挖掘隐藏的重要文献。虽然对冷门领域和中文文献覆盖有限，但能显著提升英文文献调研效率，尤其适合撰写综述或开题时理清学术脉络，让科研新手也能快速把握领域全貌。（149字）

2025-09-06 17:36:30 1254

原创洛谷B4263 [GESP202503 四级] 荒地开垦

本文针对网格类问题中的荒地开垦优化问题，提出了一种高效解决方案。问题要求在最多清除一个杂物的条件下，最大化可开垦的荒地数量。解决方案分三步：首先统计初始可开垦荒地数量；然后通过局部影响分析，计算清除每个杂物可能带来的收益；最后选择最优解。该方法通过避免全局遍历，将时间复杂度优化至O(n×m)，适用于大规模网格。文章结合具体样例详细解析了算法逻辑，并提供了完整代码实现，有效解决了约束条件下的最优化问题。

2025-09-06 17:30:37 1101 1

原创机器人复健指南：基于 BFS 的可达性问题解析与代码实现

本文讲解了如何用BFS算法解决机器人在网格场地中的可达性问题。文章详细分析了题目需求，包括8方向移动规则、步数限制和去重要求，提供了基于BFS的完整代码实现，并逐行解析核心逻辑。重点讨论了BFS的层次遍历特性如何适配步数限制，以及1-based坐标处理、访问标记等关键细节，同时指出了代码输出与题目描述可能存在的矛盾点。通过示例演示了算法执行过程，帮助读者理解BFS在有限步数路径搜索问题中的应用。

2025-08-31 22:10:12 1359

原创正态分布查表定位问题：题目解析与代码实现

本文解析了正态分布查表定位问题，将统计概念转化为代码实现。通过标准化转换公式Z=(X-μ)/σ，将非标准正态分布转换为标准正态分布变量。文章详细解释了表格行列映射规则：行号由整数+十分位决定，列号由百分位确定。提供的C++代码实现了这一逻辑，包括标准化计算、行列号推导和结果输出。代码通过浮点数运算和类型转换确保精度，并包含异常处理机制。最后通过样例验证了算法的正确性，展示了从统计理论到编程实现的完整过程。

2025-08-31 21:50:12 875

原创 openEuler 全方位指南：从安装到实战，附经典习题解析

摘要：本文全面介绍openEuler企业级操作系统，包括其核心特性、版本生命周期及安装配置步骤。内容涵盖基础命令操作、网络服务管理、常见问题排查方法，并提供22道经典习题及解析，帮助读者掌握系统运维核心技能。文章重点解析了openEuler在服务器、云计算等场景的应用优势，以及DNF软件管理、firewalld防火墙等关键技术，适合从入门到进阶的系统学习参考。

2025-08-29 21:44:01 1795

原创基于 PyTorch 的 CNN 实现 MNIST 手写数字识别全解析

摘要：本文详细解析了基于PyTorch框架实现CNN进行MNIST手写数字识别的完整流程。内容包括数据预处理、CNN模型构建（含卷积层、池化层和全连接层）、训练过程优化（使用交叉熵损失和SGD优化器），以及结果可视化分析。通过2500次迭代训练，模型在测试集上达到93%以上的准确率，有效验证了CNN在图像识别任务中的强大性能。该案例为深度学习初学者提供了从理论到实践的完整学习路径，是掌握计算机视觉基础的重要实践。

2025-08-29 21:42:17 912

原创基于 PyTorch 的 MNIST 手写数字识别：多层前馈神经网络（ANN）实现详解

本文详细介绍了基于PyTorch实现MNIST手写数字识别的多层前馈神经网络(ANN)。内容涵盖数据加载、模型构建、训练评估全流程，重点解析了三层隐藏层的网络结构设计(混合使用ReLU/Tanh/ELU激活函数)、交叉熵损失函数和SGD优化器的使用。文章还提供了现代PyTorch的改进建议，包括GPU加速、Adam优化器、学习率调度等优化方法，并讨论了正则化和数据归一化等提升模型性能的技巧。通过可视化训练曲线和模型保存，帮助读者完整理解从基础实现到工程优化的全过程。该ANN模型在MNIST上预期准确率可达9

2025-08-28 23:10:50 949

原创基于 PyTorch 的 MNIST 手写数字识别：逻辑回归实现全解析

本文详细介绍了使用PyTorch框架实现逻辑回归模型完成MNIST手写数字识别的全过程。通过解析代码结构，阐述了从数据加载、模型构建到训练评估的完整流程：包括解决SSL证书验证问题、设定超参数、定义线性分类模型、使用交叉熵损失和SGD优化器进行训练，以及结果可视化等关键步骤。该实践不仅验证了线性变换+损失函数+优化器的机器学习基础范式，准确率达到90%以上，更为后续深度学习研究奠定基础。文章完整展示了计算机视觉任务的开发流程，突显了MNIST数据集的教学价值。

2025-08-28 22:30:43 1593

原创用 PyTorch 实现 CNN 手写数字识别：MNIST 数据集完整实战

本文介绍了使用PyTorch实现CNN进行MNIST手写数字识别的完整流程。主要内容包括：1) 构建一个包含两个卷积层、两个池化层和一个全连接层的CNN模型；2) 数据预处理步骤，包括归一化、训练测试集划分和张量转换；3) 训练过程中采用交叉熵损失和Adam优化器；4) 测试阶段评估模型性能，最终准确率达98%以上。文章详细解析了每个模块的实现细节，包括模型结构设计、数据加载、训练循环和测试评估，并提供了可视化样本展示。此外，还讨论了可能的改进方向，如增加Dropout层、数据增强等。该案例展示了CNN在图

2025-08-27 15:29:39 1058

原创汽车价格与销量预测：用 PyTorch 线性回归模型实现预测分析

本文介绍了使用PyTorch实现汽车价格与销量预测的线性回归模型。通过定义模型结构、准备数据、训练优化和结果可视化，完整展示了机器学习预测流程。代码实现了价格与销量数据的线性关系建模，训练后模型能准确预测不同价格下的销量，为商业决策提供支持。该方案适用于价格敏感性分析、库存管理等领域，具有实际应用价值。

2025-08-27 15:06:26 864

原创安德烈・卡帕西大模型介绍课：第一部分 —— 预训练阶段

本讲解围绕大语言模型的预训练阶段展开。首先，从互联网获取海量高质量文本数据（如FineWeb的44TB语料，主要源于Common Crawl），并通过URL过滤、语言筛选、去重与隐私信息移除等步骤清洗处理。其次，将原始文本转化为词元序列（约15万亿个token），通过分词器实现符号化表示。随后，利用神经网络学习词元之间的统计关系，不断预测下一个词元，从而在参数中内化语言规律。训练完成后，模型可在推理阶段基于概率分布生成文本。GPT-2和Llama系列模型展示了参数规模与数据规模扩张下的能力跃升，奠定了现代大

2025-08-27 14:31:02 930

原创用 PyTorch 实现线性回归：预测汽车价格与销量的关系

本文介绍如何使用PyTorch实现线性回归模型，预测汽车价格与销量之间的关系。代码首先准备汽车价格和销量的模拟数据，并将其转换为PyTorch张量。接着定义线性回归模型类，配置均方误差损失函数和随机梯度下降优化器。通过1001次迭代训练模型，记录损失值并可视化其下降趋势。文章详细解析了代码实现过程，包括数据转换、模型定义、训练循环等关键步骤，并解释了线性回归、损失函数、梯度下降等核心概念。结果表明，该模型能有效学习价格与销量间的负相关关系，可为企业定价策略提供数据支持。这个简单的线性回归案例展示了PyTor

2025-08-25 10:35:31 1286

原创汽车价格与销量数据分析：从数据准备到可视化

在数据分析和机器学习项目中，数据准备与可视化是至关重要的第一步。它们帮助我们理解数据特征、发现潜在规律，并为后续建模提供依据。本文将通过一段分析汽车价格与销量关系的代码，详细解析数据处理的基本流程、关键技术以及可视化的重要性。

2025-08-25 10:27:28 1012

原创深度学习中的反向传播：PyTorch 实现与原理详解

本文通过PyTorch代码示例解析了深度学习中的反向传播原理。演示代码构建了简单的计算图（y=x²→o=1/2*sum(y)），并调用backward()进行梯度计算。详细解释了计算图、链式法则和梯度计算过程，验证了输出结果（x=[2,4]时梯度为[2,4]）的正确性。特别强调了requires_grad参数的作用和现代PyTorch的简化写法。指出反向传播通过计算损失函数对各参数的梯度，为神经网络参数更新提供了关键依据，是深度学习模型训练的核心机制。理解这一基础原理有助于掌握复杂模型的训练过程。

2025-08-24 12:16:25 898

空空如也

空空如也