TensorBoard安装与基本操作指南(PyTorch)

什么是TensorBoard?

  • TensorBoard是TensorFlow生态系统中的一款强大的可视化工具,它可以帮助机器学习开发者和研究人员理解、调试和优化他们的模型。最初由Google Brain团队开发,TensorBoard已经成为深度学习领域最受欢迎的可视化工具之一。
  • TensorBoard是TensorFlow的一个附件,可以记录训练过程的数字、图像等内容,方便研究人员观察神经网络训练过程。
  • 目前,TensorBoard在TensorBoardX工具辅助下,可以和其他框架,如Pytorch,结合使用实现建模和训练的可视化。
  • TensorBoardX是一个PyTorch生态中的工具库,它允许PyTorch用户像TensorFlow用户一样方便地使用TensorBoard进行可视化。

TensorBoard的主要功能包括:

  • 可视化模型的计算图
  • 跟踪和展示训练指标(如损失和准确率)
  • 展示权重和偏差的直方图
  • 显示图像、文本和音频数据样本
  • 分析模型的计算性能

TensorBoardX与TensorBoard的依赖关系

  • 当前最新版本的TensorBoardX仍然需要安装TensorBoard作为基础依赖才能正常使用。TensorBoardX本质上是对TensorBoard功能的封装扩展,它通过调用TensorBoard的核心功能来实现PyTorch的可视化支持。虽然部分基础功能可能不需要完整安装TensorFlow,但TensorBoard组件是必须安装的。

易混关系辨析

  • 单独的TensorBoardX并不能进行可视化展示,TensorBoardX本质上是对TensorBoard功能的封装扩展,通过调用TensorBoard的核心功能来实现PyTorch的可视化支持。
  • 所以,在Pytorch环境中安装TensorBoard,可以广义来说安装TensorBoardX或者安装TensorBoard。但更严格来说,是在Pytorch环境中安装TensorBoard。
  • 读者在阅读文章,可以视TensorBoardx和TensorBoard为等价工具。执行命令和使用没有区别,代码写法可能稍有区别。

Pytorch安装TensorBoard并验证

1. TensorBoard安装和访问

  1. 激活需要安装TensorBoardX的虚拟环境
conda activate env_name
  1. 进入虚拟环境后,安装tensorboardtensorboardX非必须
pip install tensorboard
# 可以不安装tensorboardX
pip install tensorboardX
  1. 打开项目文件,导入相关的包,并在该目录下创建一个测试日志目录。如果执行成功,表明tensorboard安装成功

    • 使用PyTorch官方集成的TensorBoard支持(无需显式调用writer.close()
    from torch.utils.tensorboard import SummaryWriter
    writer = SummaryWriter(log_dir = 'test')
    writer.log_dir
    for i in range(10):
        writer.add_scalar('mul', i*i, i)
    
    • 如果也安装了tensorboardX ,使用TensorBoardX进行操作(必须显示调用writer.close())
    from tensorboardX import SummaryWriter
    writer = SummaryWriter(log_dir = 'test')
    for i in range(10):
        writer.add_scalar('mul', i*i, i)
    writer.close()  # 确保关闭 writer    
    
  2. 由于在虚拟环境中安装的tensorboard,所以想要启动也需要进入虚拟环境。操作方法是:在test目录所在文件夹下打开终端,然后在终端中激活python虚拟环境,然后使用tensorboard --logdir="xxx"命令运行TensorBoard。默认情况下,TensorBoard会在本地6006端口启动。你可以在浏览器中访问http://localhost:6006来查看可视化结果。
    在这里插入图片描述

conda activate [env_name]
tensorboard --logdir="test"
或者
tensorboard --logdir=./test
  • 完整执行代码如下:
D:\code\deeplearning_view_tools>conda activate pytorch_stu

(pytorch_stu) D:\code\deeplearning_view_tools>tensorboard --logdir="test"
TensorFlow installation not found - running with reduced feature set.
Serving TensorBoard on localhost; to expose to the network, use a proxy or pass --bind_all
TensorBoard 2.19.0 at http://localhost:6006/ (Press CTRL+C to quit)
  1. 执行代码绘图结果如下:
    在这里插入图片描述

2. TensorBoard主要界面介绍

  • 启动TensorBoard后,主要包含选项卡:
  1. Custom Scalars:显示训练过程中的标量指标(如损失、准确率等),支持自定义图表布局和多个指标的对比分析。
  2. Images:显示训练过程中保存的图像数据,可用于可视化输入数据、特征图或模型生成的图像样本。
  3. Audio:播放保存的音频数据,适用于语音处理或音频生成模型的调试和评估。
  4. Debugger V2:调试器界面,提供实时变量监控、张量值和计算图检查功能,帮助诊断训练问题。
  5. Graphs:可视化模型的计算图,展示各层之间的连接关系和数据流向,支持交互式探索模型架构。
  6. Distributions:展示权重和偏差的分布变化,以折线图形式显示张量值随训练步骤的分布演变。
  7. Histograms:以直方图形式展示权重和偏差的变化,直观呈现参数在不同训练阶段的数值分布。
  8. Text:显示文本数据,可用于查看嵌入向量、自然语言处理模型的输入输出或日志信息。
  9. Pr Curves(Precision-Recall Curves):绘制精确率-召回率曲线,特别适用于分类模型的性能评估。
  10. Profile: 性能分析工具,提供训练过程中的详细时间消耗和资源使用情况,帮助优化模型效率。
  11. Hparams:超参数调优面板,支持比较不同超参数组合下的模型表现,辅助选择最佳配置。
  12. Mesh:3D数据可视化工具,用于显示和交互式探索三维网格数据(如点云、3D物体等)。
  13. What-if Tool:交互式模型探索工具,允许用户通过修改输入数据实时观察模型预测变化,支持公平性分析和反事实推理。
  14. Projector:使用PCA或t-SNE进行高维数据的降维可视化,特别适用于嵌入向量(embeddings)的可视化分析。

实用技巧

  1. TensorBoard不显示数据:确保log_dir路径正确;检查是否传入TensorBoard回调;确认训练确实运行。
  2. 端口冲突
    tensorboard --logdir=./logs --port 6007
    
  3. 加载太慢:减少日志文件数量;关闭不需要的选项卡。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值