TensorBoard 部署与使用步骤

学亮编程手记

已于 2025-03-15 19:16:20 修改

阅读量347

点赞数 4

分类专栏： Python 文章标签：深度学习人工智能 python

于 2025-02-26 16:48:32 首次发布

本文链接：https://blog.csdn.net/a772304419/article/details/145882957

版权

Python 专栏收录该内容

545 篇文章

订阅专栏

TensorBoard 工具介绍

TensorBoard 是机器学习领域广泛使用的可视化工具，最初为 TensorFlow 设计，但现已支持 PyTorch 等框架。其核心功能是帮助开发者直观监控模型训练过程、分析模型结构和性能。以下是其核心特性：

核心功能
- 模型指标跟踪：实时记录并可视化损失（Loss）、准确率（Accuracy）等关键指标的变化曲线。
- 模型结构可视化：展示神经网络的计算图（如层结构、参数连接）。
- 数据可视化：支持图像、文本、音频等非结构化数据的预览（如训练样本、特征图）。
- 参数分布分析：通过直方图展示权重、偏差等参数的分布变化。
- 高维数据降维：将高维嵌入向量（如词向量）投影到2D/3D空间，便于观察聚类效果。
适用场景
- 多框架兼容：支持 TensorFlow、PyTorch（需 tensorboard 或 tensorboardX 库）。
- 训练调试：快速定位模型过拟合、梯度消失等问题。
- 实验对比：同时对比多个训练日志（如不同超参配置的效果差异）。

TensorBoard 部署与使用步骤

1. 安装

基础安装：
```
pip install tensorboard
```
- 若用于 PyTorch，需确保 PyTorch 版本 ≥1.2.0，否则需额外安装 tensorboardX。
- 注意：安装时可能自动安装最新版 TensorFlow，若出现页面空白问题，可降级至 tensorboard==2.0.2。

2. 生成日志文件

在代码中添加日志记录功能：

from torch.utils.tensorboard import SummaryWriter

# 创建日志写入对象（默认生成 logs 文件夹）
writer = SummaryWriter("logs")

# 记录标量数据（如损失、准确率）
for epoch in range(100):
    loss = ...  # 计算损失
    writer.add_scalar("Loss/train", loss, epoch)

# 记录图像数据（如输入样本）
images = ...  # 获取图像数据
writer.add_images("Training_samples", images, epoch)

# 记录模型结构（需传入示例输入）
model = ...  # 定义模型
input_sample = torch.rand(1, 3, 224, 224)  # 示例输入
writer.add_graph(model, input_sample)

writer.close()  # 关闭写入

3. 启动 TensorBoard

本地启动：
在终端运行以下命令，指定日志目录：
```
tensorboard --logdir=logs --port=6006
```
- 浏览器访问 http://localhost:6006 查看仪表盘。
- 路径问题：若日志文件夹为子目录（如 project/logs），需指定上级目录（--logdir=project）。
远程服务器启动：
通过 SSH 端口转发访问远程 TensorBoard：
```
ssh -L 6006:localhost:6006 username@server_ip
```
在服务器端执行：
```
tensorboard --logdir=logs --port=6006
```

4. 常见问题解决

页面空白：降级 TensorBoard 版本或检查日志路径是否正确。
端口冲突：更换端口号（如 --port=8123）。
数据不更新：TensorBoard 默认每30秒刷新，可手动刷新浏览器。

实用技巧

分类显示指标
通过命名格式（如 Loss/train、Loss/val）将同类指标分组显示，便于对比。
多实验对比
将不同实验的日志存到不同子目录（如 logs/exp1、logs/exp2），启动时指定父目录（--logdir=logs），可在同一图表中对比多个结果。
图像与模型结构优化
- 使用 add_image 记录训练过程中的图像变化（如生成对抗网络的输出）。
- 使用 add_graph 可视化模型结构时，确保输入张量维度与真实数据一致。