qq_26690795-CSDN博客

原创远程服务器python运行及管理方法

登录远程服务器后启动python程序，当关闭终端时相应python程序会终止。这里记录1.如何在linux的远程服务器上运行不随终端关闭而终止的python程序2.再次打开终端如何管理之前未终止程序并进行终止操作 Q1.如何在linux的远程服务器上运行不随终端关闭而终止的python程序打开连接远程服务器的终端 conda inf...

2019-01-15 17:46:01 2190 1

听说Google提供免费的GPU加速了，通读相关教程https://medium.com/deep-learning-turkey/google-colab-free-gpu-tutorial-e113627b9f5d，但由于我比较操作废，在网上也找不到更加详尽的教程，磕磕绊绊折腾半天，终于可以成功使用，赶紧记录下来每一步的操作吧。1.找到google drive：在chrome浏览器中输入网...

2018-08-22 18:36:36 4982 1

翻译揭秘深度强化学习-7DQN的一些小技巧

看完觉得深受启发的一篇文章，根据自己的理解翻译过来留以后再次翻看原文地址http://neuro.cs.ut.ee/demystifying-deep-reinforcement-learning/经验回放(Experience Replay)至今我们已经知道如何通过Q-learning和近似Q函数的CNN来评估任一状态的未来奖励。但是关于Q值的渐近使用的是非线性函数并不稳定。这里有一...

2018-08-09 10:16:36 770 1

翻译揭秘深度强化学习-6状态空间过大之神经网络来帮忙

看完觉得深受启发的一篇文章，根据自己的理解翻译过来留以后再次翻看原文地址http://neuro.cs.ut.ee/demystifying-deep-reinforcement-learning/DQN上回书咱们说到，当状态和动作很小时，我们可以用表结构来记录Q值。再捡起我们的打砖块游戏，它的环境中的状态，可以被定义为平板位置，球的位置和方向，每个独立砖块的存在性。然而，这个直觉...

2018-08-08 17:26:48 4255

翻译揭秘深度强化学习-5 评估奖励之Q-learning算法

看完觉得深受启发的一篇文章，根据自己的理解翻译过来留以后再次翻看原文地址http://neuro.cs.ut.ee/demystifying-deep-reinforcement-learning/Q-learning算法在Q-learning算法中，我们定义一个函数Q(s,a) 来表示当我们在状态s采取行动a且之后都是最理想状态，我们预期未来能获得的衰减未来奖励Q(s,a)可...

2018-08-08 16:40:12 4501

翻译揭秘深度强化学习-4长期策略之衰减因子

看完觉得深受启发的一篇文章，根据自己的理解翻译过来留以后再次翻看原文地址http://neuro.cs.ut.ee/demystifying-deep-reinforcement-learning/衰减未来奖励(Discounted Future Reward)为了在周期很长的游戏中同样表现出色，我们需要考虑的不仅仅是当下即时奖励，同样还有未来我们能够得到的。那么我们该如何做呢？假...

2018-08-08 15:53:00 4686 1

翻译揭秘深度强化学习-3强化学习理论依据——马尔科夫决策过程

看完觉得深受启发的一篇文章，根据自己的理解翻译过来留以后再次翻看原文地址http://neuro.cs.ut.ee/demystifying-deep-reinforcement-learning/马尔科夫决策过程（Markov Decision Process）现在我们来看看如何构造一个强化学习问题的公式。最常用的是基于马尔科夫决策过程(Markov decision process...

2018-08-08 15:28:16 490

翻译揭秘深度强化学习-2强化学习主要挑战

看完觉得深受启发的一篇文章，根据自己的理解翻译过来留以后再次翻看原文地址http://neuro.cs.ut.ee/demystifying-deep-reinforcement-learning/回忆一下童年游戏打砖块(Breakout)。在这个游戏中，玩家通过控制一根屏幕上的平板，让一颗不断弹来弹去的“球”在撞击作为过关目标消去的“砖块”的途中不会落到屏幕底下，每当球撞到一个砖块，砖块...

2018-08-08 14:27:56 1064

翻译揭秘深度强化学习-1简述

看完觉得深受启发的一篇文章，根据自己的理解翻译过来留以后再次翻看原文地址http://neuro.cs.ut.ee/demystifying-deep-reinforcement-learning/某年某月某一天，DeepMind在Arxiv上发表论文“Playing Atari with Deep Reinforcement Learning”。在这篇论文中，他们证明了一台计算机是如...

2018-07-24 11:14:58 381

qq_26690795的博客