- 博客(334)
- 收藏
- 关注
原创 [特殊字符]️ 技术方案文档:下一代轻量化解码器设计 (MambaCD_light_v2)
下一代轻量化解码器MambaCD_light_v2技术方案提出三大创新改进:1)采用可重参数化的RepRectBlock,通过训练时1x3/3x1卷积和推理时3x3转换,高效捕捉建筑物矩形特征;2)设计StructureGatedFusion模块,利用边缘特征过滤skip connection中的背景噪声;3)引入多尺度特征聚合。方案在不增加推理参数量的前提下,预期将F1-score提升至90.0%,IoU提高2.75%,有效解决现有架构的形状失配、融合粗糙和边缘被动问题。
2026-02-18 20:48:59
9
原创 MambaCD_light_v0修改意见
aux_logits_list: List[[B, 2, H_i, W_i]] 辅助输出。- 修改 FrequencyAwareFusion.forward (第 450-467 行)✅ 建议 2: Mamba-CNN 桥接层 (Global Context Bridge)- 替换 PixelShuffle 为 DySample (建议 3, 第 470-543 行)🔥 建议 8: 类别平衡损失 (Class-Balanced Loss)- LEVIR-CD+ 数据集严重不平衡 (背景:变化 ≈ 7:1)
2026-02-14 22:41:17
10
原创 核心模块详解:Rep-ERFB (Rep-Parameterizable Edge-Enhanced Receptive Field Block)
本文提出Rep-ERFB模块,通过重参数化机制和辅助监督思想改进RFB模块,解决遥感图像变化检测中全局语义与局部边缘难以兼顾的问题。该模块在训练时采用多分支RepConv和显式边缘监督,推理时合并为单分支并移除辅助头,实现零成本边界感知。实验表明,Rep-ERFB在保持高精度的同时显著提升推理速度,为Mamba架构提供了有效的局部特征补充。
2026-01-31 13:15:08
32
原创 模块集成与使用指南 (Integration & Usage Guide)
本文详细介绍了如何在ChangeDecoder中集成BDGMAM和RFB模块。主要内容包括:1)整体改造逻辑,移除原有模块并新增BDGMAM和RFB;2)模块实例化与参数配置,分阶段说明各层通道数设置;3)前向传播流程,展示数据在各模块间的流动;4)关键注意事项,包括Stage4特殊处理、通道匹配和部署模式切换。通过重构解码器架构,实现了更高效的特征交互和融合,同时支持训练/推理模式的无缝切换。
2026-01-27 23:14:30
26
原创 边缘感知型重参数化融合模块 (EP-RFB)
本文提出了一种轻量化的重参数化特征融合模块(Rep-FusionBlock, RFB),用于变化检测任务的解码器设计。RFB采用"训练多路并行、推理单路折叠"的重参数化架构,包含多源特征聚合和层级级联融合两个核心功能。该模块整合了RepVGG的结构重参数化、Changer的特征交互理念和ACAHNet的层级融合策略,在保证性能的同时实现高效推理。针对解码器起始层(Stage1)的特殊情况,RFB-S1采用简化的"聚合-增强"结构,专注于底层特征处理。实验表明,RFB在
2026-01-27 23:08:52
29
原创 改进版技术描述文档:双时相差异引导的掩码注意力模块 (BDGMAM)
摘要:本文提出双时相差异引导的掩码注意力模块(BDGMAM),通过三个创新子模块实现鲁棒的特征融合:1)DAMG采用5×5深度卷积生成抗配准误差的差异掩码,并引入TemperatureSoftmax优化梯度;2)MG-DAU利用掩码引导双路注意力,增强变化区域特征;3)AFL通过重参数化卷积和全局残差连接确保信息保真。该模块显著提升了抗配准误差能力,优化了梯度传导,并实现了零信息丢失风险,为双时相图像分析提供了可靠的解决方案。
2026-01-27 22:06:38
28
原创 轻量化遥感变化检测复现任务
本文汇总了多个遥感影像变化检测相关数据集与模型资源,主要包括LEVIR-CD、WHU-CD、SYSU-CD等常用数据集,以及RS-Mamba、ChangeMamba、Mobile-CDNet等深度学习模型。这些资源覆盖二分类变化检测、语义变化检测等任务,涉及城市、郊区等多种场景。各模型均提供开源代码和论文DOI链接,部分还包含轻量化版本。数据集获取方式包括GitHub、百度网盘等公开渠道,为遥感变化检测研究提供了全面的数据与算法支持。
2026-01-17 16:05:30
44
原创 changemamba模块修改
本文介绍了一种用于遥感图像变化检测的差异感知门控模块(DAG Module)及其相关技术组件。DAG Module作为RMG-Block的前置处理模块,通过空间注意力机制动态增强变化区域特征,抑制背景噪声。系统包含多个关键技术:1) RD-Gate模块利用重参数化技术捕捉双时相特征差异;2) Global Context Mamba模块进行全局时空建模;3) RepConv模块增强局部细节感知;4) Prediction Head生成最终变化检测图。这些组件协同工作,在保持轻量化的同时实现了高精度的变化检测
2026-01-17 15:54:28
46
原创 Mamba模型理解
《Mamba:基于选择性状态空间的线性时间序列建模》提出了一种新型神经网络架构Mamba(选择性状态空间模型),作为Transformer的高效替代方案。该模型通过动态选择机制(S6模块)实现输入依赖的参数调整,既能像RNN保持线性时间复杂度(O(L)),又能如Transformer灵活捕捉长程依赖。其核心创新在于:1)打破传统SSM的时不变限制,通过x→B/C/Δ函数实现内容感知记忆;2)设计硬件感知并行算法解决非LTI系统的计算瓶颈。实验表明,Mamba在长序列任务中兼具卓越性能与推理速度,结构上比Tr
2025-10-28 10:19:03
782
原创 什么是SSM(状态空间模型)
摘要:状态空间模型(SSM)源于控制理论,用于描述动态系统,近年来被改进为深度学习中处理长序列的革命性工具。经典SSM通过状态和输出方程描述系统演变,而深度学习中的SSM通过离散化和卷积模式适应序列处理。Mamba在此基础上引入选择性机制,使模型能动态调整参数,兼顾效率与表现力,成为Transformer的有力竞争者。SSM在深度学习中的双重计算模式(递归和卷积)使其高效处理长序列数据。
2025-10-28 08:23:48
981
原创 感受野是什么?以及全局感受野
摘要:CNN中感受野指输入图像影响特征图某单元的区域,随着网络加深而扩大。全局感受野是覆盖整个输入图像的理想情况,能捕获长程依赖关系(如关联猫的分散特征)。Transformer自注意力机制和Mamba模型都能实现全局上下文建模,前者通过全token交互,后者借助选择性扫描机制实现数据依赖的全局建模。(149字)
2025-10-27 19:57:59
370
原创 传统变化检测CD方法
遥感图像变化检测方法主要包括四类:1)代数运算法(差值法、比值法、回归法),计算简便但易受干扰;2)变换法(主成分分析、缨帽变换、变化向量分析),通过特征转换提取变化信息;3)分类后比较法,先分类再对比,可识别变化类型但误差易累积;4)机器学习法(SVM、随机森林等),利用分类器直接识别变化区域。这些方法各有特点,适用于不同场景的变化检测需求。
2025-10-26 19:25:36
223
原创 S2Anet介绍
本文提出S²A-Net网络用于旋转目标检测,通过特征对齐模块(FAM)解决传统方法中特征与目标几何不匹配的问题。网络架构包含骨干网络、FPN特征金字塔、FAM模块和检测模块。FAM由锚点优化(ARN)生成高质量旋转Anchor,再通过对齐卷积(ACL)实现特征空间对齐,最终输出分类和回归结果。该设计有效提升了遥感图像中旋转目标(如飞机、建筑物)的检测精度,解决了特征错位和Anchor匹配差等关键问题。
2025-10-11 21:28:23
959
原创 理解一下CNN以及卷积
CNN被比喻为"近视眼",因其卷积核只能聚焦图像的局部区域(3×3像素等),擅长提取细节但缺乏全局视野。卷积过程如同用手电筒扫描图像:核矩阵与图像局部相乘求和,生成特征图(数值越大表示特征越明显)。通过多层堆叠,CNN实现从边缘→部件→整体的层次化理解:底层提取线条颜色,中层识别器官,高层组合成完整物体。这种"局部感受野+多层抽象"的机制,使CNN能间接获得全局信息,但也导致远距离特征关联困难。
2025-10-10 11:42:09
621
原创 MobaXterm的训练启动命令是什么??关闭MobaXterm会不会影响训练进程?
【SSH训练中断原理与解决方案】使用SSH工具(如MobaXterm)直接运行训练脚本时,关闭终端会导致训练中断,因为SSH会话终止会发送SIGHUP信号终止所有子进程。 解决方案: nohup方案:使用命令nohup python train.py > log 2>&1 &让程序脱离终端运行,输出重定向到日志文件,可通过tail -f log查看进度。 tmux方案(推荐): 创建会话:tmux new -s session_name 运行训练后按Ctrl+B D分离会话 重连
2025-09-30 14:36:10
451
原创 在RSAR项目中插入“CT扫描”和“复数神经网络”模块
本文介绍了如何将"CT扫描"数据增强模块和"复数神经网络"骨干网络封装为可插拔的Python模块,便于集成到MMDetection框架中。首先创建了SarCTScan类实现SAR图像的多通道分解,通过FFT将单通道图像转换为多通道特征图。然后构建了CV_CNN_V1_Backbone复数卷积神经网络,包含复数残差块结构,最后通过修改配置文件实现模块的动态加载。这两个独立模块既保持了算法创新性,又提供了标准接口,只需简单配置即可快速集成到现有目标检测系统中。
2025-09-27 12:47:05
426
原创 远程服务器核心快捷指令清单
本文提供了远程服务器操作的核心指令大全,包含三大类常用命令:1. 连接与文件传输(SSH/SCP);2. 文件目录操作(ls/cd/mkdir等Linux基础命令);3. 进程监控与系统管理(重点介绍nvidia-smi、ps、kill等GPU/进程管理命令)。特别提供了"实战组合拳"操作指南,通过"GPU状态监控-进程确认-日志跟踪"三步法,帮助用户快速掌握远程训练项目的实时状态监测技巧。文章强调rm -rf等危险命令需谨慎使用,并详细解释了各命令参数的实际应用场景
2025-09-21 23:04:28
558
原创 学习笔记:从“CT扫描”到“复数大脑”——SAR目标检测的终极进化
本文提出了一种创新的SAR目标检测方法,通过两项核心技术突破传统局限:1)"CT扫描"技术将单通道SAR图像分解为多频段、多角度的复数多通道图像,利用FFT/IFFT转换保留相位和频率信息;2)"复数大脑"神经网络直接处理复数数据,通过ComplexResNetBlock等复数运算模块提取特征,最后转换为实数预测。该方法突破了传统将SAR图像视为灰度图的局限,充分利用了相位、频率等物理特性信息,在复杂场景下展现出更强的识别能力。两个模块的协同工作为SAR目标检测提供了
2025-09-18 19:20:31
757
原创 U-Net的理解
U-Net采用"U型结构"实现图像分割,其工作流程包含三个关键环节:编码器像侦探提取核心特征,解码器如绘图员补充细节边界,跳跃连接则实现两者实时交互。这种架构先通过编码器压缩图像获取深层语义(如施工区的围挡、土块等核心特征),再由解码器结合浅层特征还原精确位置(如围挡边缘像素),最后通过跳跃连接融合高低层信息,确保分割边界清晰准确。整个过程模拟专业团队协作,最终实现像素级精准分割,满足施工区域识别等精细任务需求。
2025-09-16 12:24:48
80
原创 学习笔记:从弱监督到完美约束——SAR有向目标检测模型的演进之路
本文系统梳理了SAR图像有向目标检测模型的演进历程,聚焦如何从仅有水平框标注的弱监督数据中学习旋转框检测。三阶段演进:1)HBox-to-Rbox-v1通过双分支结构,利用外接矩形约束和旋转等变性自监督学习,实现从无到有的角度预测;2)HBox-to-Rbox-v2引入物体对称性先验,通过翻转一致性约束提升角度预测鲁棒性;3)HBox-to-Rbox-v2+UCR采用二维向量表示角度,通过单位圆约束和无效区域策略,从根本上解决角度边界不连续问题。该系列工作逐步解决了弱监督学习、几何先验利用和数值稳定性等核心
2025-09-15 09:17:23
823
原创 P10720 [GESP202406 五级] 小杨的幸运数字
本文介绍了如何通过预处理方法高效判断一个数是否为"幸运数字"(恰好有两种不同质因子)。首先使用埃氏筛法标记质数,然后遍历每个质数的倍数,统计每个数的不同质因子数量。预处理完成后,查询时只需检查计数是否为2即可。该方法预处理复杂度为O(mxloglogmx),查询复杂度为O(1),适用于a_i≤1e6、n≤1e4的数据范围。文中包含代码实现、复杂度分析和样例验证,并强调了注意"不同质因子"的含义和处理细节。
2025-09-09 18:15:52
791
原创 P10719 [GESP202406 五级] 黑白格
【摘要】本文介绍了一种解决黑白格子问题的二维滑窗算法。给定n×m的01网格,要求找到包含至少k个黑格子的最小面积子矩形。核心思路是将二维问题转化为一维子段和问题:枚举上下边界确定高度H,维护每列的黑格数数组col,用滑动窗口在col中寻找和≥k的最短连续列段。算法时间复杂度O(n²·m),空间复杂度O(n·m),适用于n,m≤100的情况。文章详细解析了算法步骤、易错点,并提供了优化技巧和完整代码实现,最后通过测试案例验证了算法的正确性。
2025-09-09 17:50:13
981
原创 B4361 [GESP202506 四级] 排序
本文解析了GESP四级考试中的排序与最少相邻交换次数问题。题目要求将队伍按身高降序、体重降序排列,每次只能交换相邻同学,求最少交换次数。解题关键在于理解相邻交换的最少次数等于冒泡排序中的交换次数,即序列中的逆序对总数。文章详细分析了排序规则转化为代码逻辑的过程,包括定义比较条件和冒泡排序实现。代码解析部分说明了使用二维vector存储数据的原因,以及冒泡排序函数中的关键细节。时间复杂度分析表明该解法在题目限制下完全可行。最后总结了易错点及核心收获,强调掌握多关键字排序条件和相邻交换计数的实际应用价值。
2025-09-07 12:15:17
963
原创 B4360 [GESP202506 四级] 画布裁剪
本文解析了GESP四级真题中的画布裁剪问题。题目要求将一个h行w列的字符矩阵按给定的1-based行列范围(x1-x2,y1-y2)进行裁剪输出。解题关键在于正确将1-based行列编号转换为0-based数组索引,通过遍历指定范围逐字符输出或使用substr函数截取子串。核心易错点是行列索引转换和循环边界处理,需特别注意x1-1到x2-1的转换。文章提供了完整的C++代码实现,分析了O(h*w)的时间复杂度,并讨论了空间优化可能。题目考察基础编程能力,重点在于精确实现需求转换。
2025-09-07 10:04:26
1042
原创 B4264 [GESP202503 四级] 二阶矩阵
本文解析了GESP四级考试中的"好子矩阵"计数问题。题目要求统计给定n×m整数矩阵中所有满足条件的2×2子矩阵数量,条件为子矩阵左上×右下=右上×左下。解题采用暴力枚举法:遍历所有可能的2×2子矩阵,逐个验证条件并计数。由于数据范围较小(n,m≤500),该方法时间复杂度为O(nm),完全可行。文章详细讲解了代码实现,包括矩阵存储、边界处理、条件判断等关键点,并提醒注意循环边界和元素位置等易错问题。最终强调对于小数据量问题,暴力法是最直接可靠的解决方案。
2025-09-07 08:14:49
959
原创 被导师夸爆的文献工具!Connected Papers 帮我告别 “文献迷宫”
科研文献梳理神器ConnectedPapers:一键可视化学术脉络 这款工具通过智能图谱直观展示文献关联,节点大小反映引用量,连线粗细体现关联度,帮助研究者快速定位核心文献与关键演进路径。其筛选功能支持按时间、引用量、开放获取等维度精准检索,而"相关论文"推荐能挖掘隐藏的重要文献。虽然对冷门领域和中文文献覆盖有限,但能显著提升英文文献调研效率,尤其适合撰写综述或开题时理清学术脉络,让科研新手也能快速把握领域全貌。(149字)
2025-09-06 17:36:30
1155
原创 洛谷B4263 [GESP202503 四级] 荒地开垦
本文针对网格类问题中的荒地开垦优化问题,提出了一种高效解决方案。问题要求在最多清除一个杂物的条件下,最大化可开垦的荒地数量。解决方案分三步:首先统计初始可开垦荒地数量;然后通过局部影响分析,计算清除每个杂物可能带来的收益;最后选择最优解。该方法通过避免全局遍历,将时间复杂度优化至O(n×m),适用于大规模网格。文章结合具体样例详细解析了算法逻辑,并提供了完整代码实现,有效解决了约束条件下的最优化问题。
2025-09-06 17:30:37
1014
1
原创 机器人复健指南:基于 BFS 的可达性问题解析与代码实现
本文讲解了如何用BFS算法解决机器人在网格场地中的可达性问题。文章详细分析了题目需求,包括8方向移动规则、步数限制和去重要求,提供了基于BFS的完整代码实现,并逐行解析核心逻辑。重点讨论了BFS的层次遍历特性如何适配步数限制,以及1-based坐标处理、访问标记等关键细节,同时指出了代码输出与题目描述可能存在的矛盾点。通过示例演示了算法执行过程,帮助读者理解BFS在有限步数路径搜索问题中的应用。
2025-08-31 22:10:12
1317
原创 正态分布查表定位问题:题目解析与代码实现
本文解析了正态分布查表定位问题,将统计概念转化为代码实现。通过标准化转换公式Z=(X-μ)/σ,将非标准正态分布转换为标准正态分布变量。文章详细解释了表格行列映射规则:行号由整数+十分位决定,列号由百分位确定。提供的C++代码实现了这一逻辑,包括标准化计算、行列号推导和结果输出。代码通过浮点数运算和类型转换确保精度,并包含异常处理机制。最后通过样例验证了算法的正确性,展示了从统计理论到编程实现的完整过程。
2025-08-31 21:50:12
844
原创 openEuler 全方位指南:从安装到实战,附经典习题解析
摘要:本文全面介绍openEuler企业级操作系统,包括其核心特性、版本生命周期及安装配置步骤。内容涵盖基础命令操作、网络服务管理、常见问题排查方法,并提供22道经典习题及解析,帮助读者掌握系统运维核心技能。文章重点解析了openEuler在服务器、云计算等场景的应用优势,以及DNF软件管理、firewalld防火墙等关键技术,适合从入门到进阶的系统学习参考。
2025-08-29 21:44:01
1618
原创 基于 PyTorch 的 CNN 实现 MNIST 手写数字识别全解析
摘要:本文详细解析了基于PyTorch框架实现CNN进行MNIST手写数字识别的完整流程。内容包括数据预处理、CNN模型构建(含卷积层、池化层和全连接层)、训练过程优化(使用交叉熵损失和SGD优化器),以及结果可视化分析。通过2500次迭代训练,模型在测试集上达到93%以上的准确率,有效验证了CNN在图像识别任务中的强大性能。该案例为深度学习初学者提供了从理论到实践的完整学习路径,是掌握计算机视觉基础的重要实践。
2025-08-29 21:42:17
841
原创 基于 PyTorch 的 MNIST 手写数字识别:多层前馈神经网络(ANN)实现详解
本文详细介绍了基于PyTorch实现MNIST手写数字识别的多层前馈神经网络(ANN)。内容涵盖数据加载、模型构建、训练评估全流程,重点解析了三层隐藏层的网络结构设计(混合使用ReLU/Tanh/ELU激活函数)、交叉熵损失函数和SGD优化器的使用。文章还提供了现代PyTorch的改进建议,包括GPU加速、Adam优化器、学习率调度等优化方法,并讨论了正则化和数据归一化等提升模型性能的技巧。通过可视化训练曲线和模型保存,帮助读者完整理解从基础实现到工程优化的全过程。该ANN模型在MNIST上预期准确率可达9
2025-08-28 23:10:50
884
原创 基于 PyTorch 的 MNIST 手写数字识别:逻辑回归实现全解析
本文详细介绍了使用PyTorch框架实现逻辑回归模型完成MNIST手写数字识别的全过程。通过解析代码结构,阐述了从数据加载、模型构建到训练评估的完整流程:包括解决SSL证书验证问题、设定超参数、定义线性分类模型、使用交叉熵损失和SGD优化器进行训练,以及结果可视化等关键步骤。该实践不仅验证了线性变换+损失函数+优化器的机器学习基础范式,准确率达到90%以上,更为后续深度学习研究奠定基础。文章完整展示了计算机视觉任务的开发流程,突显了MNIST数据集的教学价值。
2025-08-28 22:30:43
1547
原创 用 PyTorch 实现 CNN 手写数字识别:MNIST 数据集完整实战
本文介绍了使用PyTorch实现CNN进行MNIST手写数字识别的完整流程。主要内容包括:1) 构建一个包含两个卷积层、两个池化层和一个全连接层的CNN模型;2) 数据预处理步骤,包括归一化、训练测试集划分和张量转换;3) 训练过程中采用交叉熵损失和Adam优化器;4) 测试阶段评估模型性能,最终准确率达98%以上。文章详细解析了每个模块的实现细节,包括模型结构设计、数据加载、训练循环和测试评估,并提供了可视化样本展示。此外,还讨论了可能的改进方向,如增加Dropout层、数据增强等。该案例展示了CNN在图
2025-08-27 15:29:39
1004
原创 汽车价格与销量预测:用 PyTorch 线性回归模型实现预测分析
本文介绍了使用PyTorch实现汽车价格与销量预测的线性回归模型。通过定义模型结构、准备数据、训练优化和结果可视化,完整展示了机器学习预测流程。代码实现了价格与销量数据的线性关系建模,训练后模型能准确预测不同价格下的销量,为商业决策提供支持。该方案适用于价格敏感性分析、库存管理等领域,具有实际应用价值。
2025-08-27 15:06:26
826
原创 安德烈・卡帕西大模型介绍课:第一部分 —— 预训练阶段
本讲解围绕大语言模型的预训练阶段展开。首先,从互联网获取海量高质量文本数据(如FineWeb的44TB语料,主要源于Common Crawl),并通过URL过滤、语言筛选、去重与隐私信息移除等步骤清洗处理。其次,将原始文本转化为词元序列(约15万亿个token),通过分词器实现符号化表示。随后,利用神经网络学习词元之间的统计关系,不断预测下一个词元,从而在参数中内化语言规律。训练完成后,模型可在推理阶段基于概率分布生成文本。GPT-2和Llama系列模型展示了参数规模与数据规模扩张下的能力跃升,奠定了现代大
2025-08-27 14:31:02
843
原创 用 PyTorch 实现线性回归:预测汽车价格与销量的关系
本文介绍如何使用PyTorch实现线性回归模型,预测汽车价格与销量之间的关系。代码首先准备汽车价格和销量的模拟数据,并将其转换为PyTorch张量。接着定义线性回归模型类,配置均方误差损失函数和随机梯度下降优化器。通过1001次迭代训练模型,记录损失值并可视化其下降趋势。文章详细解析了代码实现过程,包括数据转换、模型定义、训练循环等关键步骤,并解释了线性回归、损失函数、梯度下降等核心概念。结果表明,该模型能有效学习价格与销量间的负相关关系,可为企业定价策略提供数据支持。这个简单的线性回归案例展示了PyTor
2025-08-25 10:35:31
1267
原创 汽车价格与销量数据分析:从数据准备到可视化
在数据分析和机器学习项目中,数据准备与可视化是至关重要的第一步。它们帮助我们理解数据特征、发现潜在规律,并为后续建模提供依据。本文将通过一段分析汽车价格与销量关系的代码,详细解析数据处理的基本流程、关键技术以及可视化的重要性。
2025-08-25 10:27:28
964
原创 深度学习中的反向传播:PyTorch 实现与原理详解
本文通过PyTorch代码示例解析了深度学习中的反向传播原理。演示代码构建了简单的计算图(y=x²→o=1/2*sum(y)),并调用backward()进行梯度计算。详细解释了计算图、链式法则和梯度计算过程,验证了输出结果(x=[2,4]时梯度为[2,4])的正确性。特别强调了requires_grad参数的作用和现代PyTorch的简化写法。指出反向传播通过计算损失函数对各参数的梯度,为神经网络参数更新提供了关键依据,是深度学习模型训练的核心机制。理解这一基础原理有助于掌握复杂模型的训练过程。
2025-08-24 12:16:25
863
原创 PyTorch 中的 Variable:自动求导的基石
本文介绍了PyTorch中的Variable(变量)在自动求导中的核心作用。在PyTorch 0.4.0之前,Variable是包装张量并实现自动求导的关键组件,通过构建计算图记录操作历史,为反向传播提供支持。文章解析了Variable的核心属性(data、grad、grad_fn)和requires_grad参数的意义,并展示了创建Variable的示例代码。尽管现代PyTorch已将Variable功能整合到Tensor中(通过requires_grad=True),但理解Variable的工作原理仍对
2025-08-24 11:53:12
754
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅