tensorboard+seaborn 画RL论文图片

概要

  1. tensorboard记录数据,并保存为fie_name.csv 文件
  2. 加载file_name.csv文件, 处理加载得到数据,然后通过seaborn 显示出来。

1. tensorboard

通常来说,我们一般会用 tensorboard 去记录一些数据。

所以我们先介绍一下 tensorboard 一些注意事项

  1. setings 按钮上是可以设置 多久reload的,训练的时候记得打开,这样就不用手动刷新了。
  2. scalars 界面可以设置smoothing, 用的平滑算法可能是 Exponential Moving Average (EMA)

然后下面是PPO跑LunarLander-v2的图示。
你可以认为他们seed不一样。


先勾选上方的 Show data downloads links ,然后图标下方会出现下载按钮,选中下载,格式为.csv.
保存完后打开pycharm

2. seaborn

pycharm 中我们的文件结果如下, 两个保存的csv文件。然后有一个测试的jupyter文件

  1. 如何得到带阴影的图片

在 Seaborn 中,带有阴影的图形通常表示误差区间。这种图形一般用于显示估计值的不确定性,其中阴影表示估计值的置信区间或标准差。这在统计学和数据可视化中是一种常见的方式,以展示估计值的可靠性或稳定性。
所以意味着 同一个 x 上 y 应该是有多个值的。
解决方法: 堆叠

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

sns.set_style("darkgrid")

# without smoothing
csv_file_path = "./reward.csv"
df = pd.read_csv(csv_file_path)
csv_file_path = "./reward1.csv"
df1 = pd.read_csv(csv_file_path)
# 堆叠到一块
df = pd.concat([df,df1],ignore_index=True)

plt.title("LunarLander-v2")
sns.lineplot(x="Step",y="Value",data=df,label="PPO")

plt.xlabel("steps")
plt.ylabel("reward")
plt.show()

效果如下


  1. 如何同时展现平滑前和平滑后的曲线

解决方法: 设置透明度,同样的颜色,但是透明度不一样,即可

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

sns.set_style("darkgrid")

# without smoothing
csv_file_path = "./reward.csv"
df = pd.read_csv(csv_file_path)
x, y = df["Step"], df["Value"]

sns.lineplot(x=x,y=y, color="red",alpha=0.2)
# Exponential Moving Average (EMA)
smoothed_y = y.ewm(span=15, adjust=False).mean() 

plt.title("LunarLander-v2")
sns.lineplot(x=x,y=smoothed_y,color="red",label="PPO")

plt.xlabel("steps")
plt.ylabel("reward")
plt.show()

效果如下


然后 对于一些其他的细节,比如x轴的显示,label的字体和大小等,就自己去弄吧。至此,我们已经可以应付大部分的论文图片的需求了。

  • 7
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值