自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

bug404

知乎:https://www.zhihu.com/people/bug-404,古月居:https://www.guyuehome.com/author/611ca8f30d7f8,GitHub:https://github.com/borninfreed

  • 博客(2)
  • 资源 (15)
  • 收藏
  • 关注

原创 使用tune.run怎么获取model summary的信息

使用rllib的时候,如果使用PPOTrainer或者某一个其他的trainer,在执行trainer.train()的时候,会打印model summary,也可以显式调用获取model summary的API,就像下面这样>>> from ray.rllib.agents.ppo import PPOTrainer>>> trainer = PPOTrainer(env="CartPole-v0", config={"eager": True, "num_work

2021-05-06 18:19:24 704 4

原创 解决rllib使用custom model没有日志输出的问题

在rllib的example中,有一个custom model的例子,链接,但是运行这个就会发现一个问题,没有训练的日志输出,只有这个状态信息,训练过程中的training iter, episode reward mean等信息都不输出。== Status ==Memory usage on this node: 1.2/9.3 GiBUsing FIFO scheduling algorithm.Resources requested: 0/1 CPUs, 0/0 GPUs, 0.0/5.22

2021-05-06 17:50:44 485

深度强化学习视频.zip

模仿学习,深度强化学习领域视频合集

2020-05-10

Papers.zip

模仿学习,深度强化学习领域论文合集

2020-05-10

themes.zip

自己用的Ubuntu18 MacOS主题

2020-04-08

Mc-OS-Transparent-1.1.tar

Ubuntu18,MacOS,透明主题。 啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊

2020-02-09

Cupertino.tar

Ubuntu18,MacOS主题,Cupertino图标。 啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊

2020-02-09

Sierra-dark.tar

Ubuntu18,MacOS,Sierra-dark主题 啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊

2020-02-09

Sierra-light.tar

Ubuntu18,Sierra-light MacOS主题。 啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊啊

2020-02-09

ProofQlearning.pdf

Q-learning收敛证明。

2020-02-06

必应壁纸集合_最近的必应壁纸

必应壁纸集合。

2020-01-14

cudart64_100.zip

cudart64_100.dll, CUDA Toolkit 10.0 对应的cuda文件,对于安装的高版本的cuda的,只需要把这个dll文件复制到cuda文件所在的bin目录就可以使用。

2020-01-08

1天搞懂深度学习-李宏毅.zip

李宏毅 1天搞懂深度学习 ppt。

2020-01-07

Deep Learning and Robotics(pieter abbeel).zip

Deep Learning and Robotics,pieter abbeel的演讲PDF。

2020-01-05

机器学习 VS 深度学习.mp4

机器学习和深度学习的对比,matlab官方教程视频。

2020-01-05

Hybrid PositionForce Control of Manipulators.zip

Raibert, Marc H., and John J. Craig. "Hybrid position/force control of manipulators." Journal of Dynamic Systems, Measurement, and Control 102, no. 127 (1981): 126-133.

2020-01-04

强化学习PPO算法.zip

强化学习PPO算法论文

2020-01-04

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除