TouristLin-CSDN博客

原创技巧｜在SwanLab上恢复崩溃的实验（断点续训）

摘要：SwanLab的断点续训功能允许用户通过resume和id参数恢复中断/完成的实验，保持实验数据连续性。关键功能包括：1）基于检查点继续训练；2）合并训练与评估数据；3）更新错误配置参数。使用时需指定21位实验ID，并设置resume参数为must/allow/never。还支持通过环境变量或实验复制方式安全恢复实验，确保数据完整性。该功能适用于需要补充数据或修正参数的实验场景。

2025-08-05 15:01:28 457

SwanLab提供了绘制ROC曲线的功能，用于评估二分类模型的性能。通过swanlab.roc_curve函数，用户可以记录模型在不同阈值下的真正率和假正率关系。该功能支持自定义标题显示，并能与其他评估指标（如PR曲线、准确率等）同时记录。使用时需确保输入数据为二分类概率值，并安装必要的依赖包（scikit-learn和pyecharts）。函数会自动计算AUC值，生成的ROC曲线从(0,0)延伸到(1,1)，对角线代表随机分类器的表现。

2025-08-02 22:10:33 336

原创技巧｜SwanLab记录混淆矩阵攻略

本文介绍了如何使用SwanLab绘制混淆矩阵评估分类模型性能。内容涵盖基本用法、自定义类别名称设置以及二分类示例，支持多分类问题，需搭配scikit-learn和pyecharts使用。混淆矩阵能直观展示模型预测结果与真实标签的对应关系，横轴为预测标签，纵轴为真实标签。通过示例代码演示了在鸢尾花数据集和二分类任务中的应用，包括数据准备、模型训练和混淆矩阵记录过程。

2025-08-02 22:09:10 428

原创技巧｜SwanLab记录PR曲线攻略

PR曲线是评估二分类模型性能的重要工具，特别适用于不平衡数据集。SwanLab提供了swanlab.pr_curve方法记录PR曲线，支持自定义标题显示。使用时需注意：1）输入数据为真实标签和预测概率；2）仅适用于二分类任务；3）需要scikit-learn和pyecharts依赖。该方法会自动计算PR曲线下面积（AUC），但不默认显示在标题中。用户可通过调整title参数控制标题的显示方式。

2025-08-02 22:07:31 348

原创 PaddleNLP框架训练模型：使用SwanLab教程

PaddleNLP 是基于飞桨深度学习框架的大语言模型开发套件，支持高效的大模型训练、无损压缩和高性能推理。其简单易用且性能卓越，助力开发者实现产业级应用。PaddleNLP 可与 SwanLab 集成，通过 SwanLabCallback 实现实验跟踪与可视化。开发者只需在 Trainer 中传入 SwanLabCallback，即可自动记录超参数和训练指标。此外，开发者可通过继承 SwanLabCallback 自定义回调函数，如在每个 epoch 结束时记录模型推理结果，进一步提升实验管理效率。

2025-05-14 16:29:48 940

原创 Qwen3大模型微调入门实战（完整代码）

阿里最新开源的Qwen3大模型登顶HuggingFace开源LLM榜首，成为开发者首选。本文手把手教你用全参数微调技术，基于Qwen3-1.7B和医学数据集打造能进行深度推理的医疗对话助手。通过transformers和SwanLab工具链，实现带思考链（类似DeepSeek R1）的专业回复生成，完整公开32GB显存适配代码、数据集处理技巧及过拟合解决方案。附实战训练日志可视化分析、模型效果演示及推理部署指南，适合LLM微调入门者快速掌握领域适配核心技术。

2025-05-08 17:24:55 3300 1

原创 UNet脑瘤医学影像分割训练实战（PyTorch 完整代码）

本文详细介绍了如何使用UNet模型进行医学影像分割任务，以脑肿瘤数据集为例，从环境配置、数据准备到模型训练与推理，提供完整的PyTorch实现代码。通过SwanLab工具实时监控训练过程，可视化损失和准确率曲线，最终模型在测试集上达到97.93%的准确率。文章还包含显存占用分析、早停策略、Dice损失函数优化等实战细节，适合希望入门医学图像分割的开发者。附代码、数据集和训练日志链接，可直接复现。

2025-04-16 15:40:56 1869

原创 EvalScope x SwanLab：领先的大模型评估测试神器

SwanLab与EvalScope完成官方集成！现在您可以在EvalScope评估LLM性能时，无缝使用SwanLab进行可视化跟踪和对比。这个强大组合支持多模型、多数据集、多硬件环境的测试对比，让复杂的LLM评估变得直观高效。SwanLab提供实验管理、性能曲线监控和团队协作功能，而EvalScope则带来专业的大模型评估能力，包括RAG评估、竞技场模式等。立即体验这个AI研发利器，提升您的模型评估效率！

2025-04-15 15:13:07 944

原创 SwanLab x EasyR1：多模态大模型强化学习可视化训练

EasyR1是基于veRL的一个高效、可扩展、多模态强化学习LLM训练框架，由LLaMA Factory作者hiyouga打造，很很短的时间内获得了1.8k Star。EasyR1 受益于 veRL 的 HybridEngine 和 vLLM 0.7 的 SPMD mode，并适配了 Qwen2.5-VL 模型，在多模态几何题任务 Geometry3k 上通过 30 个 batch 的 GRPO 训练，即可提升 5% 验证集准确率。EasyR1 目前已经被很多优秀的项目采用，如等。

2025-04-02 15:41:18 1304

原创 SwanLab Slack通知插件：让AI训练状态同步更及时

在AI模型训练的过程中，开发者常常面临一个难题：如何及时跟踪训练状态？无论是实验超参数的调整、关键指标的变化，还是意外中断的告警，传统的监控方式往往依赖手动刷新日志或反复检查终端，这不仅效率低下，还可能因信息滞后导致资源浪费和决策延迟。团队推出的Slack通知插件正是为了解决这一问题而生。通过将训练状态实时同步至团队协作工具Slack，开发者可以摆脱“被动等待”的束缚，让关键信息主动触达。无论是训练完成的通知、指标波动的预警，还是硬件资源的异常提醒，只需简单配置，即可实现自动化推送。

2025-04-01 20:36:16 776

原创 SwanLab更新｜寒武纪硬件监控、Slack、Discord通知插件更新、swanlab.Settings支持精细化实验行为控制等

1. 新增swanlab.Settings方法，支持更精细化的实验行为控制，进一步增强开放性2. 修复了sync_wandb的一些问题3. 修复了Obejct3D类的一些问题## 🔌插件1. 官方插件增加Slack通知、Discord通知，进一步打通海外生态## 💻硬件模块1. 支持了寒武纪MLU的硬件记录和资源监控，国产卡支持+12. 昇腾NPU的硬件记录，支持记录CANN版本3. 英伟达GPU的硬件记录，支持记录GPU架构和cuda核心数4. 英伟达GPU的硬件监控，支持记

2025-03-31 18:52:55 220

原创 SwanLab硬件监控：英伟达、昇腾、寒武纪

SwanLab在跟踪实验的过程中，会机器的硬件资源情况，并记录到当中。目前SwanLab已支持监控3款）的硬件资源情况，涵盖显卡利用率、显存占用率、显卡温度、显卡功率等指标。除此之外，SwanLab还支持监控等硬件资源情况。很开心，我们与昇腾计算团队合作，为训练师提供更多的国产算力使用体验。

2025-03-31 18:49:03 1514

原创 Transformers x SwanLab:可视化NLP模型训练（2025最新版）

探索如何将HuggingFace的Transformers框架与SwanLab无缝结合，实现高效的模型训练与实验管理！Transformers是当前最流行的深度学习框架之一，广泛应用于大语言模型（如LLaMa、Qwen、ChatGLM）和自然语言处理模型（如Bert）的预训练、微调和推理。而SwanLab则是一款强大的实验管理与可视化工具，结合了Weights & Biases和TensorBoard的优点，支持训练可视化、多实验对比、超参数记录和团队协作。

2025-03-22 21:18:15 1110

原创使用SwanLab记录3D点云：swanlab.Obejct3D使用指引

SwanLab 3D点云图表使用教程，可用于自动驾驶、机器人、具身智能等场景

2025-03-22 21:04:25 543

原创 SwanLab飞书通知插件：训练完成收到飞书消息，掌握训练进度更及时

如果你希望在训练完成/发生错误时，第一时间发送飞书信息通知你，那么非常推荐你使用飞书通知插件。SwanLab插件均为开源代码，你可以在中查看，欢迎提交你的建议和PR！

2025-03-17 21:54:29 605

原创 SwanLab邮件通知插件：训练完成收到邮件，掌握训练进度更及时

如果你希望在训练完成/发生错误时，第一时间发送邮件通知你，那么非常推荐你使用邮件通知插件。SwanLab插件均为开源代码，你可以在中查看，欢迎提交你的建议和PR！

2025-03-17 21:52:31 686

原创 SwanLab私有化部署教程！

SwanLab 是一个开源、现代化设计的深度学习训练跟踪与可视化工具，常被称为"中国版 Weights & Biases + Tensorboard"。SwanLab同时支持云端和离线使用，并适配了从PyTorch、Transformers、Lightning再到LLaMA Factory、veRL等30多种主流AI训练框架，Python API设计也简洁易上手，能轻松嵌入你的训练代码。

2025-03-15 16:37:17 1696

原创 SwanLab简明教程：从萌新到高手

SwanLab是一个开源、现代化设计的深度学习训练跟踪与可视化工具，常被称为"中国版 Weights & Biases + Tensorboard"。SwanLab同时支持云端和离线使用，并适配了从再到等30多种主流AI训练框架，Python API设计也简洁易上手，能轻松嵌入你的训练代码。面向人工智能研究者，SwanLab设计了友好的Python API 和漂亮的UI界面，并提供训练可视化、自动日志记录、超参数记录、实验版本管理与对比、多人协同。

2025-03-08 20:10:26 2140

原创 DiffSynth-Studio文生图+文生视频模型训练：使用SwanLab超参数记录与可视化

DiffSynth Studio是推出的一个开源的扩散模型引擎，专注于图像与视频的风格迁移与生成任务。它通过优化架构设计（如文本编码器、UNet、VAE 等组件），在保持与开源社区模型兼容性的同时，显著提升计算性能，为用户提供高效、灵活的创作工具。DiffSynth Studio 支持多种扩散模型，包括 Wan-Video、StepVideo、HunyuanVideo、CogVideoX、FLUX、ExVideo、Kolors、Stable Diffusion 3 等。

2025-03-06 16:32:17 610

原创 Swift训练大模型可视化教程：使用SwanLab

Ms-swift的是一个集模型训练、微调、推理、部署于一体的框架。🍲是 ModelScope 社区提供的官方框架，用于微调和部署大型语言模型和多模态大型模型。它目前支持大型模型和多模态大型模型的训练（预训练、微调、人工对齐）、推理、评估、量化和部署。🍔 此外，ms-swift 还采用了，包括，以及等人工对齐训练方法。ms-swift 支持使用 vLLM 和 LMDeploy 加速推理、评估和部署模块，并支持使用 GPTQ、AWQ 和 BNB 等技术进行模型量化。

2025-03-03 01:09:48 1838

原创如何将SwanLab集成到Unsloth与TRL？

Unsloth是最近AI圈特别火的Python库，起因是DeepSeek R1带火了用GRPO（一种强化学习方法）来训练大模型，HuggingFace的TRL框架也在第一时间更新了GRPOTrainer。但在大家兴冲冲地启动训练时却发现，这显存占用也太高了，一般的显卡完全finetune不动呀！这个时候，Unsloth进入了大家的视野。它能够将Llama 3.3、Mistral、Phi-4、Qwen 2.5和Gemma的微调速度提高2倍，同时内存减少80%，足以在一张单卡进行GRPO训练。

2025-02-25 00:57:11 997

原创 SwanLab x Swift：一站式大模型训练工具链，让模型进化更轻松（附教程）

探索如何利用 Modelscope Swift 和 SwanLab 进行高效的模型训练与实验跟踪！Swift 是 ModelScope 社区推出的强大框架，支持 450+ 大型语言模型和 150+ 多模态模型的训练、微调、推理与部署。无论是轻量级技术如 LoRA、QLoRA、LongLoRA，还是人工对齐方法如 DPO、PPO、ORPO，Swift 都能轻松应对。

2025-02-18 17:13:38 1422

原创 GDC2025 | DeepSeek-Qwen 模型蒸馏极限挑战赛，来了！（预赛报名）

2025全球开发者先锋大会（GDC）| 魔乐社区与SwanLab平台联合举办的 DeepSeek-Qwen 模型蒸馏极限挑战赛！本赛事将作为2025全球开发者先锋大会（GDC）的活动之一，欢迎具备大模型训练/微调实战经验的独立开发者前来挑战！详细报名规则见后文。报名时间：2025年2月16日～20日12时。

2025-02-16 17:26:20 717

原创集成SwanLab与HuggingFace TRL：跟踪与优化强化学习实验

TRL是一个领先的Python库，旨在通过监督微调（SFT）、近端策略优化（PPO）和直接偏好优化（DPO）等先进技术，对基础模型进行训练后优化。TRL 建立在 🤗 Transformers 生态系统之上，支持多种模型架构和模态，并且能够在各种硬件配置上进行扩展。你可以使用Trl快速进行模型训练，同时使用SwanLab进行实验跟踪与可视化。是适配于Transformers的日志记录类。

2025-02-08 20:32:24 597

原创 SwanLab x verl：可视化LLM强化学习后训练教程

verl是一个灵活、高效且可用于生产环境的强化学习（RL）训练框架，专为大型语言模型（LLMs）的后训练设计。它由字节跳动火山引擎团队开源，是HybridFlow论文的开源实现。verl目前已经被很多优秀的项目采用，如TinyZeroRAGENLogic R1等。verl 具有以下特点，使其灵活且易于使用：易于扩展的多样化 RL 算法：Hybrid 编程模型结合了单控制器和多控制器范式的优点，能够灵活表示并高效执行复杂的后训练数据流。用户只需几行代码即可构建 RL 数据流。

2025-02-08 16:01:23 2986

原创 DQN深度强化学习：CartPole倒立摆任务（完整代码）

🚀 DQN实战：3分钟极速训练倒立摆控制模型 | 附完整代码+可视化训练；📌 核心技术亮点：DQN双剑合璧：融合深度神经网络与Q-Learning，通过经验回放打破数据关联性，目标网络稳定训练过程，解决高维状态空间难题；CartPole极简环境：4维状态空间+2个离散动作，完美契合入门级深度强化学习实战（附环境配置指南）

2025-02-07 15:30:50 2484

原创 SmolAgents快速上手：最优雅的Agent构建工具

smolagents是HuggingFace官方推出的Agent开发库，HF出品的库，往往的设计理念是“低门槛，高天花板，可拓展”，所以知道HF出了Agent相关的框架后，也是很快体验了一下。首先来介绍一下smolagents吧，smol是small的俏皮用法，故smolagents的含义是“轻量的agent工具”。smolagents库提供：✨：Agent逻辑仅需约千行代码即可实现。在原生代码之上，我们将抽象保持至最简形态！🌐。

2025-01-25 16:48:29 2151

原创 MiniCPM-o-2.6 多模态大模型微调实战（完整代码）

MiniCPM-O-2.6 多模态大模型微调实战。本文我们将简要介绍基于 transformers、peft 等框架，使用 MiniCPM-O-2.6 模型在上进行Lora微调训练，同时使用监控训练过程与评估模型效果。

2025-01-25 14:14:23 2843

原创 Qwen2.5大模型微调实战：医疗命名实体识别（NER）任务（完整代码）

带你从零开始，手把手教你如何通过指令微调Qwen2.5大语言模型，完成医学命名实体识别（NER）任务。本文详细介绍了如何使用transformers、peft等框架，结合SwanLab可视化工具，在医学数据集上进行Lora微调训练。无论你是AI新手还是进阶开发者，这篇教程都能帮助你快速上手大模型微调，掌握NER任务的核心技术。立即跟随教程，开启你的AI训练之旅！

2025-01-21 17:52:43 3477 2

原创如何命令行退出swanlab账号

SwanLab命令行退出登录教程。

2025-01-17 23:25:57 259

原创 SwanLab环境变量列表

SwanLab环境变量列表，包含SWANLAB_SAVE_DIR、SWANLAB_LOG_DIR、SWANLAB_MODE等常用的环境变量

2025-01-17 23:22:06 507

原创 SwanLab使用技巧：与PyTorch Lightning集成使用

PyTorch Lightning与SwanLab配合训练。是一个开源的机器学习库，它建立在 PyTorch 之上，旨在帮助研究人员和开发者更加方便地进行深度学习模型的研发。Lightning 的设计理念是将模型训练中的繁琐代码与研究代码分离，从而使研究人员可以专注于研究本身，而不是底层的工程细节。SwanLabLogger是适配于PyTorch Lightning的日志记录类。你可以使用PyTorch Lightning快速进行模型训练，同时使用。进行实验跟踪与可视化。

2025-01-17 19:17:54 458

原创 SwanLab使用技巧：一行代码同步Wandb

SwanLab与Wandb类似，专为国内用户设计，支持实验跟踪和模型优化。通过swanlab.sync_wandb()命令，可同步Wandb指标至SwanLab，或使用swanlab convert将Wandb项目迁移至SwanLab，实现无缝过渡和高效管理。

2025-01-17 19:10:18 1661

原创 SwanLab x LLaMA Factory：国产开源AI训练工具组合拳（含教程）

我们非常高兴地宣布SwanLab与LLaMA Factory建立合作伙伴关系，致力于为中国训练者提供优质、高效的大模型训练体验。现在你使用新版本的LLaMA Factory启动训练前，可以在WebUI的「SwanLab configurations」（中文：SwanLab参数设置）卡片中勾选「Use SwanLab」，就可以通过SwanLab强大的训练看板进行这一次大模型微调的跟踪、记录与可视化。

2024-12-31 13:43:40 1774

原创如何在手机上看AI训练（基于SwanLab）

你一定遇到过，实验正在training，但你不在电脑旁边 —— 也许在运动、在通勤、或者刚刚起床，十分想瞄一眼实验的进展和结果。这个时候，，会是绝佳组合。下面将介绍如何将SwanLab添加到你的手机主屏幕，以接近APP的体验，快速访问SwanLab。

2024-12-25 21:37:04 464

原创 Qwen2-VL多模态大模型微调实战教程

Qwen2-VL是通义千问团队最近开源的大语言模型，由阿里云通义实验室研发。以Qwen2-VL作为基座多模态大模型，通过的方式实现特定场景下的OCR，是学习的入门任务。本文我们将简要介绍基于 transformers、peft 等框架，使用 Qwen2-VL-2B-Instruct 模型在上进行Lora微调训练，同时使用监控训练过程与评估模型效果。

2024-12-04 20:21:35 8382 5

原创 Qwen2-VL视觉大模型微调实战：LaTex公式OCR识别任务（完整代码）

SwanLab机器学习实战教程是一个主打「开箱即用」的AI训练系列教程，我们致力于提供手把手帮助你跑起训练。Qwen2-VL是通义千问团队最近开源的大语言模型，由阿里云通义实验室研发。以Qwen2-VL作为基座多模态大模型，通过的方式实现特定场景下的OCR，是学习的入门任务。本文我们将简要介绍基于 transformers、peft 等框架，使用 Qwen2-VL-2B-Instruct 模型在上进行Lora微调训练，同时使用监控训练过程与评估模型效果。

2024-12-04 16:01:38 2247 3

原创 Qwen2-VL-2B模型微调实战-COCO2014数据集-SwanLab可视化记录

本文我们将简要介绍基于 transformers、peft 等框架，使用 Qwen2-VL-2B-Instruct 模型在上进行Lora微调训练，同时使用监控训练过程与评估模型效果。

2024-11-16 19:41:44 2205 6

原创 SwanLab安装教程

其提供了友好的API和漂亮的界面，结合了超参数跟踪、指标记录、在线协作、实验链接分享、实时消息通知等功能，让您可以快速跟踪ML实验、可视化过程、分享给同伴。SwanLab是一款开源、轻量级的AI实验跟踪工具，提供了一个跟踪、比较、和协作实验的平台，旨在加速AI研发团队100倍的研发效率。借助SwanLab，科研人员可以沉淀自己的每一次训练经验，与合作者无缝地交流和协作，机器学习工程师可以更快地开发可用于生产的模型。

2024-11-16 19:38:51 979

原创 Qwen2-VL多模态大模型微调实战（完整代码）

Qwen2-VL多模态大模型微调实战。本文我们将简要介绍基于 transformers、peft 等框架，使用 Qwen2-VL-2B-Instruct 模型在上进行Lora微调训练，同时使用监控训练过程与评估模型效果。

2024-11-15 21:23:54 23569 25

空空如也

空空如也