自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 远程服务器python运行及管理方法

登录远程服务器后启动python程序,当关闭终端时相应python程序会终止。这里记录1.如何在linux的远程服务器上运行不随终端关闭而终止的python程序2.再次打开终端如何管理之前未终止程序并进行终止操作 Q1.如何在linux的远程服务器上运行不随终端关闭而终止的python程序          打开连接远程服务器的终端          conda inf...

2019-01-15 17:46:01 2185 1

原创 google免费GPU使用经历记录

听说Google提供免费的GPU加速了,通读相关教程https://medium.com/deep-learning-turkey/google-colab-free-gpu-tutorial-e113627b9f5d,但由于我比较操作废,在网上也找不到更加详尽的教程,磕磕绊绊折腾半天,终于可以成功使用,赶紧记录下来每一步的操作吧。1.找到google drive:在chrome浏览器中输入网...

2018-08-22 18:36:36 4979 1

翻译 揭秘深度强化学习-7DQN的一些小技巧

看完觉得深受启发的一篇文章,根据自己的理解翻译过来留以后再次翻看原文地址http://neuro.cs.ut.ee/demystifying-deep-reinforcement-learning/经验回放(Experience Replay)至今我们已经知道如何通过Q-learning和近似Q函数的CNN来评估任一状态的未来奖励。但是关于Q值的渐近使用的是非线性函数并不稳定。这里有一...

2018-08-09 10:16:36 768 1

翻译 揭秘深度强化学习-6状态空间过大之神经网络来帮忙

看完觉得深受启发的一篇文章,根据自己的理解翻译过来留以后再次翻看原文地址http://neuro.cs.ut.ee/demystifying-deep-reinforcement-learning/DQN上回书咱们说到,当状态和动作很小时,我们可以用表结构来记录Q值。再捡起我们的打砖块游戏,它的环境中的状态,可以被定义为平板位置,球的位置和方向,每个独立砖块的存在性。然而,这个直觉...

2018-08-08 17:26:48 4247

翻译 揭秘深度强化学习-5 评估奖励之Q-learning算法

看完觉得深受启发的一篇文章,根据自己的理解翻译过来留以后再次翻看原文地址http://neuro.cs.ut.ee/demystifying-deep-reinforcement-learning/Q-learning算法在Q-learning算法中,我们定义一个函数Q(s,a) 来表示当我们在状态s采取行动a且之后都是最理想状态,我们预期未来能获得的衰减未来奖励Q(s,a)可...

2018-08-08 16:40:12 4493

翻译 揭秘深度强化学习-4长期策略之衰减因子

看完觉得深受启发的一篇文章,根据自己的理解翻译过来留以后再次翻看原文地址http://neuro.cs.ut.ee/demystifying-deep-reinforcement-learning/衰减未来奖励(Discounted Future Reward)为了在周期很长的游戏中同样表现出色,我们需要考虑的不仅仅是当下即时奖励,同样还有未来我们能够得到的。那么我们该如何做呢?假...

2018-08-08 15:53:00 4673 1

翻译 揭秘深度强化学习-3强化学习理论依据——马尔科夫决策过程

看完觉得深受启发的一篇文章,根据自己的理解翻译过来留以后再次翻看原文地址http://neuro.cs.ut.ee/demystifying-deep-reinforcement-learning/马尔科夫决策过程(Markov Decision Process)现在我们来看看如何构造一个强化学习问题的公式。最常用的是基于马尔科夫决策过程(Markov decision process...

2018-08-08 15:28:16 487

翻译 揭秘深度强化学习-2强化学习主要挑战

看完觉得深受启发的一篇文章,根据自己的理解翻译过来留以后再次翻看原文地址http://neuro.cs.ut.ee/demystifying-deep-reinforcement-learning/回忆一下童年游戏打砖块(Breakout)。在这个游戏中,玩家通过控制一根屏幕上的平板,让一颗不断弹来弹去的“球”在撞击作为过关目标消去的“砖块”的途中不会落到屏幕底下,每当球撞到一个砖块,砖块...

2018-08-08 14:27:56 1061

翻译 揭秘深度强化学习-1简述

看完觉得深受启发的一篇文章,根据自己的理解翻译过来留以后再次翻看原文地址http://neuro.cs.ut.ee/demystifying-deep-reinforcement-learning/某年某月某一天,DeepMind在Arxiv上发表论文“Playing Atari with Deep Reinforcement Learning”。在这篇论文中,他们证明了一台计算机是如...

2018-07-24 11:14:58 380

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除