深度学习
昵称已被吞噬~‘(*@﹏@*)’~
这个作者很懒,什么都没留下…
展开
-
【分层强化学习】Option Critic 的 CartPole-v1 的简单实例
【代码】【分层强化学习】Option Critic 的 CartPole-v1 的简单实例。原创 2024-09-01 22:46:25 · 229 阅读 · 1 评论 -
【强化学习】解决gym安装Atari2600环境gym[atari,accept-rom-license] RuntimeError 无法下载Roms的问题
安装gym[accept-rom-license]时会出现安装失败的情况,因为Roms.tar.gz文件因网络问题下载不下来,而且这个包不是很好找(google上也没找到,还是在一段代码里看见的下载地址),使用一下方法替代:step1:先安装AutoROM: pip install AutoROMstep2:然后使用下载的Roms.tar.gz文件安装Atari2600: AutoROM --source-file ./Roms.tar.gz原创 2023-02-21 11:07:18 · 2837 阅读 · 0 评论 -
【深度强化学习实战】tensorflow2.x 训练 muzero 玩井字棋(tic-tac-toe)
【深度强化学习实战】tensorflow2.x 训练 muzero 玩井字棋(tic-tac-toe)原创 2022-08-04 09:14:25 · 602 阅读 · 0 评论 -
【tensorflow2.x】训练 muzero 玩五子棋 (Gomoku)
tensorflow2.x 训练 muzero 玩五子棋 (Gomoku)原创 2022-08-01 15:49:40 · 2056 阅读 · 3 评论 -
【tensorflow2.x】使用 wgan-gp 生成 mnist 手写数字
tensorflow2.x实现wgan生成mnist手写数字原创 2022-07-30 11:12:25 · 446 阅读 · 0 评论 -
【tensorflow2.x】自编码器mnist
【tensorflow2.x】自编码器mnist。原创 2022-07-23 14:03:28 · 176 阅读 · 0 评论 -
【强化学习】tensorflow2.x 构造 SoftActorCritic(SAC) 训练 LunarLanderContinuous-v2
论文地址.策略网络的损失函数不是按照原论文所写。requirements.txt:tensorflow-gpu==2.4.0gym[all]==0.21.0tensorflow_probability==0.14.0keras==2.6.0matplotlib==3.5.1from tensorflow.keras import layers, models, Input, optimizers, lossesfrom tensorflow_probability.python...原创 2022-04-14 23:47:24 · 1984 阅读 · 9 评论 -
【强化学习】MuZero 训练CartPole-v1
【深度强化学习】tensorflow2.0复现Google DeepMind版本的muzero训练CartPole-v1参考资料:[1]ColinFred. 蒙特卡洛树搜索(MCTS)代码详解【python】. 2019-03-23 23:37:09.[2]饼干Japson 深度强化学习实验室.【论文深度研读报告】MuZero算法过程详解.2021-01-19.[3]Tangarf. Muzero算法研读报告. 2020-08-31 11:40:20 .[4]带带弟弟好吗. AlphaGo版本三原创 2022-02-25 19:02:41 · 6223 阅读 · 16 评论 -
【强化学习】tensorflow2.0构造DDPG训练LunarLanderContinuous-v2
from tensorflow.keras import optimizers, layers, models, lossesfrom collections import dequeimport matplotlib.pyplot as pltimport tensorflow as tfimport numpy as npimport randomimport gymimport copy# 配置GPU内存physical_devices = tf.config.experiment原创 2022-02-08 11:49:33 · 2526 阅读 · 0 评论 -
【强化学习】基于tensorflow2.2实现A3C训练火箭着陆器LunarLander-v2
本来是想训练SpaceInvaders-v4来着,结果电脑train不起来,就换成LunarLander-v2了import matplotlib.pyplot as pltimport tensorflow as tfimport numpy as npimport threadingimport gymepisodes = 2000gamma = 0.9learning_rate = 1e-3num_workers = 3game = 'LunarLander-v2'state原创 2021-05-24 23:41:58 · 953 阅读 · 0 评论 -
【colab】白嫖Google的tpu和gpu
先打开Google云盘.在关联应用里搜索 Colaboratory 安装插件。安装完成后就可以直接在Google云盘里创建colab了。然后在 ‘代码执行程序’ 里找 ‘更改运行时类型’, 可以选择实在gpu上跑还是tpu。(这里的gpu是Tesla T4,因为 gpu 的话网上资料一大把,这里接下来已 tpu 为例)可以通过一下代码将你的 Google云盘挂载到 notebook上(这里会给你一个网址,打开后是Google云盘的授权码,粘贴下来,因为这里已经授权过了所以下图中没有提示,原创 2021-04-14 18:35:27 · 1817 阅读 · 5 评论 -
tensorflow2.0 DenseNet121 训练 cifar100
from tensorflow.keras import layers, regularizers, Sequential, optimizersimport tensorflow as tfimport numpy as npdef regularized_padded_conv2d(*args, **kwargs): ''' 带标准化的卷积 ''' return layers.Conv2D( *args, **kwargs, padding='s原创 2020-06-08 21:34:44 · 1109 阅读 · 6 评论