- 博客(26)
- 收藏
- 关注
原创 VScode调试能实现和Pycharm一样的tensor shape,ssh远程连接linux服务器版
本文介绍了修改VSCode远程调试器中pydevd_xml.py文件的方法,以支持显示Tensor等对象的shape信息。具体步骤包括:1) 定位服务器上的目标文件路径;2) 备份原文件;3) 替换get_variable_details函数实现,新增对PyTorch Tensor、NumPy数组等对象shape信息的提取;4) 重启VSCode远程会话并重新加载窗口。修改后调试时即可像PyCharm一样显示Tensor的shape等维度信息。
2026-03-24 11:46:48
100
原创 【C++算法】Vector动态数组-① 基础知识
动态数组vector是C++中可自动扩容的数组容器,相比普通数组功能更强大。基本定义方式为vector<类型>名称,支持多种初始化方法。常用操作包括push_back()添加元素、pop_back()删除末尾元素、front()/back()访问首尾元素、size()获取大小等。遍历vector有三种方式:索引遍历、范围for循环和迭代器遍历。二维vector可用于表示矩阵,通过vector<vector<int>>定义,使用matrix[i][j]访问元素。vector
2026-03-12 20:08:44
46
原创 将Google drive上的大文件传输到Linux服务器
本文介绍使用gdown工具下载Google Drive文件的方法。首先通过git安装gdown工具,然后获取Google Drive文件的公开分享链接。最后使用gdown命令下载文件,建议添加"--continue"参数支持断点续传,对于大文件推荐在tmux或screen会话中运行下载命令以确保稳定性。
2026-03-04 10:32:23
42
原创 Doker部署遇到错误解决方案
摘要:解决Docker常见问题的方法:1.权限问题:执行docker build时若报错"permission denied",改用sudo docker build命令;2.连接DockerHub失败:先检查网络连接和镜像拉取状态,若无法访问,可配置国内镜像加速器,修改/etc/docker/daemon.json文件并重启Docker服务。测试docker pull hello-world验证是否成功。
2026-03-03 15:47:03
206
原创 【论文阅读-nnUNet】a self-configuring method for deep learning-based biomedical image segmentation
摘要:nnUNet是一种自动化医学图像分割框架,通过系统化专家经验实现高性能分割。其核心创新在于将模型参数分为三类:固定参数(通用设计)、基于规则的参数(根据数据特征自动配置)和少量需学习的参数。该方法自动完成数据预处理、网络设计、训练策略和后处理全流程,针对不同数据集动态调整3D U-Net配置。实验表明,nnUNet在多个公开数据集上达到SOTA性能,证明合理的配置比复杂网络结构更重要。该框架为医学图像分割提供了可靠、可扩展的基准工具,显著降低了人工调参需求。
2025-12-24 11:22:16
768
原创 【论文阅读-TMI】Semi-Supervised Deep Transfer Learning for Benign-Malignant Diagnosis of Pulmonary Nodules
本研究提出了一种半监督深度迁移学习(SDTL)框架,用于提高肺结节良恶性分类的准确性。通过结合迁移学习(使用预训练的肺结节识别模型)和半监督学习(利用大量无标签CT数据),模型在病理确诊的1,530例患者数据集上达到88.3%的准确率和91.0%的AUC值,显著优于基线模型和其他半监督方法。研究创新性地采用特征相似度筛选高置信度无标签样本,在保持诊断敏感性的同时提高了特异性。虽然模型在外部验证集上表现略有下降(74.5%准确率),但仍展现出良好的临床应用潜力,可作为辅助工具帮助医生更准确地判断肺结节性质。
2025-09-22 22:33:36
909
原创 【论文阅读—智能驾驶】Diving Deeper Into Pedestrian Behavior Understanding
本文针对行人行为理解中的意图估计、动作预测和事件风险评估三个关键任务展开研究。通过分析现有研究的不足(如任务混淆、评估方法局限),作者在JAAD和PIE数据集上构建了新的评测基准,提出三类创新指标(基础指标、加权指标、稳定性指标)。实验对比了四种先进模型的表现,发现:1)意图预测依赖视觉特征,动作预测更需要动态信息;2)车速对动作预测影响显著(准确率从95%降至8%);3)模型在风险评估任务中,对边缘区域预测较好(准确率约80%),但对高风险的中心区域表现不稳定。研究揭示了三个任务的互补性,为智能驾驶系统的
2025-09-15 10:32:07
969
原创 【论文阅读—深度学习处理表格数据】ResNet-like & FT Transformer
论文摘要:该研究系统评估了处理表格数据的深度学习方法,指出当前模型因测试标准不一而难以比较的问题。作者提出了两个简单高效的基线模型:ResNet-like架构和改良的FT-Transformer,通过统一实验框架在11个数据集上验证其性能。实验表明,FT-Transformer综合表现最优且稳定,但传统梯度提升树(GBDT)仍具竞争力。研究还开发了基于注意力机制的特征重要性解释方法,为表格数据深度学习提供了实用基准和开源实现。
2025-09-04 17:04:33
1603
原创 【论文阅读—可解释性AI(Transformer篇)】Transformer Interpretability Beyond Attention Visualization
本文提出了一种改进Transformer模型可解释性的新方法。针对现有注意力可视化方法(如Attention Rollout)存在的模糊性和无关区域高亮问题,作者基于Deep Taylor分解原理,提出融合梯度信息和相关性传播的解决方案。该方法通过创新性地处理Transformer特有的自注意力机制和跳跃连接结构,实现了更准确、类别特定的决策过程可视化。实验表明,该方法在图像分类和文本情感分析任务中均优于传统方法,能更精确地识别模型决策的关键区域。这项工作为理解Transformer的"黑箱&qu
2025-08-01 21:12:16
1819
1
原创 【论文阅读—可解释性AI(Transformer篇)】-Quantifying Attention Flow in Transformers
本文指出传统Transformer注意力权重可视化方法在高层的局限性,提出两种改进方法:Attention Rollout和Attention Flow。通过主谓一致预测任务实验发现,原始注意力权重在高层相关性下降(从0.69降至负值),而新方法能保持0.7左右的稳定相关性。Attention Rollout通过矩阵连乘追踪多层信息传递,Attention Flow则用最大流算法计算信息贡献。可视化对比显示新方法能更准确聚焦关键词语,尤其在高层有效解决注意力分散问题,为模型解释提供了更可靠的工具。
2025-07-31 11:44:00
1591
原创 【LLM大模型—笔记2】Transformer架构
Transformer模型采用Encoder-Decoder架构处理序列数据。Encoder通过多头自注意力机制提取输入特征,Decoder结合掩码自注意力和编码器输出来生成输出。关键组件包括:1)BPE分词和位置编码处理输入;2)多头自注意力捕捉上下文关系;3)Decoder使用掩码防止信息泄露。该架构在NLP和CV领域均有应用,如Vision Transformer通过图像分块嵌入适配视觉任务。模型通过并行计算和注意力机制有效处理长距离依赖关系。
2025-05-13 17:08:41
1109
1
原创 【论文阅读—专家特化微调】ESFT 对Deepseek MOE框架下面的专家特化微调
本文介绍了MOE框架和ESFT专家特化微调方法。MOE框架用多个小型专家网络替代传统全连接层,通过路由机制选择相关专家进行加权计算,实现参数规模优化。ESFT微调方法包含数据采样、专家评分(基于平均门控分数和token选择比例)及专家选择微调三个步骤,能有效解决专家负载不均衡问题。实验表明,该方法在提升模型性能的同时显著降低计算成本,在通用任务和专门领域任务中均表现良好,但当参数规模过大时可能影响专家领域性能。该方法实现了高效微调和性能优化的平衡。
2025-03-20 15:23:29
1154
1
原创 【LLM大模型-笔记1】神经网络中的链式法则
本文总结了神经网络输出层的核心功能和工作流程。输出层通过激活函数(如Softmax)将全连接层的logits转换为归一化概率分布,实现多分类预测。损失函数(如交叉熵)用于衡量预测与真实标签的差异,训练目标是使损失最小化。网络训练通过反向传播和链式法则计算梯度,逐步更新权重参数,使模型预测趋近真实结果。文章通过具体案例解释了链式法则在梯度计算中的应用,并类比"传声筒"形象说明了前向传播与反向传播的协同过程,最终通过梯度下降实现参数优化。
2025-02-21 19:05:27
1087
1
原创 【机器学习—自监督学习3】Generative Methods
摘要:生成式方法通过学习数据重构来捕捉关键信息,主要包括自编码器(AE)、变分自编码器(VAE)和生成对抗网络(GAN)三类。AE通过编码-解码结构重建数据;VAE引入概率分布学习;GAN通过生成器与判别器的对抗训练生成逼真数据。典型应用如BEiT和MAE:BEiT通过掩码图像建模预训练视觉Transformer,MAE则采用高比例遮蔽的自编码架构高效重建图像。这些方法为无监督学习提供了强大工具,在计算机视觉等领域表现优异。
2025-01-02 16:58:28
948
原创 【机器学习—自监督学习2】Context-Based Methods
摘要:本文介绍了自监督学习中的Context-Based方法,通过设计辅助任务(如图片旋转、颜色还原、拼图顺序预测等)让模型从数据本身获取监督信号。这类方法利用图像上下文信息,迫使模型学习有用的特征表示,弥补无监督学习在语义信息上的不足。重点分析了旋转预测、色彩类比和拼图重建三种典型方法的工作机制和局限性,阐述了"Pretrain-Finetune"范式如何实现特征迁移。这些基于上下文的自监督方法为后续学习对比式和生成式方法奠定了基础。
2025-01-01 01:19:34
1139
1
原创 【论文阅读—联邦学习】FedFed
《FedFed: Feature Distillation Against Data Heterogeneity in Federated Learning》论文分享
2024-12-31 22:15:59
590
2
原创 【机器学习—评估指标】混淆矩阵、准确率、精确率、召回率、F1分数、ROC曲线和AUC
机器学习评价指标是衡量模型性能的关键工具。本文介绍了常见指标及其计算方法:1.混淆矩阵展示分类预测结果分布,包含TP、TN、FP、FN四个基础指标;2.准确率反映整体预测正确率;3.精确率关注预测正例的准确性;4.召回率衡量正例检出能力;5.F1分数综合平衡精确率和召回率;6.ROC曲线通过TPR与FPR的权衡关系评估模型性能,AUC值量化区分能力。文章详细说明了各指标的定义、计算公式、适用场景及局限性,并通过Python代码示例演示了具体实现方法,特别对ROC曲线和AUC的计算原理进行了深入解析。
2024-12-30 14:23:57
6544
4
原创 【机器学习—自监督学习1】为什么要做自监督学习
自监督学习通过为无标签数据生成伪标签来解决传统无监督学习缺乏语义信息的问题。它介于监督和无监督学习之间,利用辅助任务(如旋转预测、拼图重建)引导模型捕捉语义特征。自监督学习面临三个关键问题:如何实现无标签数据的表征学习、如何设计有效的辅助任务,以及如何评估学习到的表征质量。评估通常通过在下游任务微调预训练模型来实现。该方法在保留无监督学习优势的同时,通过自我生成的监督信号提升了模型对语义信息的捕捉能力。
2024-12-28 11:15:10
1509
原创 基于U-Net网络的分割mask实现医学图像剪裁
摘要:本文介绍了医学图像处理中.nii.gz格式文件(包含空间定位信息的Affine矩阵)与PNG格式的坐标转换方法。通过Python代码实现了从3D医学图像分割结果到2D PNG图像的坐标对齐和裁剪功能,关键步骤包括:1) 解析NIfTI文件的Affine矩阵获取空间信息;2) 对U-net输出的2D分割结果进行坐标轴转换(X/Y轴交换、Y轴翻转);3) 根据mask确定的边界框进行图像裁剪。提供了完整的代码实现,包含路径配置、图像显示、坐标转换和边界计算等功能,适用于医学图像分析任务。
2024-12-26 13:32:08
782
原创 Windows系统打不开百度网盘客户端里面的文件夹
百度网盘无法打开文件夹的解决方案:1)通过任务管理器结束所有baidu开头的进程后重启软件;2)修改host文件,在C:\Windows\System32\drivers\etc路径下添加"111.206.209.82 pan.baidu.com"并保存;3)若仍无法解决,可临时使用网页版查看文件。这些方法能解决因进程卡顿或网络问题导致的文件夹加载失败情况。
2024-12-25 13:50:54
5162
原创 Timesformer论文讲解和方法介绍
从研究问题到创新点到方法细节全面介绍和Timesformer方法,是对Timesformer论文的全方位解读,
2024-12-24 20:28:33
287
原创 linux端口转发加速打开Gradio/Tensorboard
远程服务器运行深度学习项目时,可视化工具如Gradio/TensorBoard的链接默认在服务器端打开,导致浏览器卡顿。通过SSH本地端口转发,可将远程端口映射到本地:使用ssh -L 本地端口:127.0.0.1:远程端口 -p SSH端口 用户名@服务器地址命令,例如将远程7860端口映射到本地8080端口。成功后,在本地浏览器访问http://localhost:8080/即可流畅查看可视化界面。这种方法有效解决了远程服务器浏览器性能不足的问题。
2024-10-09 10:02:16
982
原创 Mmaction2跑视频帧训练
本文分享了在MMA2框架中解决视频帧训练问题的经验。作者最初使用旧版配置无法运行Rawframes数据集,只能转为视频格式训练。后发现官方更新了视频帧训练方法,修改了配置文件:1)将data_dict拆分为三个dataloader;2)更新了学习率和优化器设置;3)关键是要正确设置RawframeDataset路径和标注文件。具体修改包括数据集路径、预处理流程等参数,并提供了可运行的完整配置示例。作者建议参考原帖处理数据集生成问题,最终成功实现了视频帧训练流程。
2024-09-30 12:21:23
1001
原创 Mmaction2随机种子固定
在使用mmaction2训练自定义数据集时,发现两次训练结果不一致。检查发现代码中未设置默认随机种子,需手动添加"--seed"参数。进一步发现还需添加"--deterministic"参数确保结果可复现,但高版本CUDA会报错。解决方法:1)在代码中添加环境变量配置;2)运行时指定随机种子和确定性参数;3)也可直接修改代码中的随机种子函数并提前设置。最终实现了训练结果的可重复性。
2024-09-30 11:59:37
463
FedFed关键代码流程梳理pdf版本
2025-04-29
C# .Net 计算机房管理系统
2025-01-02
Nuclear power introduction presentation for English class
2024-12-31
Zephyr:直接蒸馏语言模型对齐技术,提升小型模型性能
2024-12-31
《FedFed: Feature Distillation Against Data Heterogeneity in Federated Learning》论文分享
2024-12-31
csdn怎么提升等级啊?
2025-01-02
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅