• 我的消息
  • 我的博客
  • 我的学院
  • 我的下载
  • 我的收藏
  • 消息
  • 搜索条件:
    点击返回全部
    全部文章 > {categoryName }
    • 置顶深度增强学习 知乎专栏与Blog迁移说明

      本Blog接下来将陆续迁移至 blog.floodsung.com主要内容将全面聚焦深度增强学习Deep Reinforcement Learning!使用Github Pages和Hexo。更简洁...

      原创
      2016-05-24 16:04:25
      4214
      3
    • DRL前沿之:Hierarchical Deep Reinforcement Learning

      1 前言如果大家已经对DQN有所了解,那么大家就会知道,DeepMind测试的40多款游戏中,有那么几款游戏无论怎么训练,结果都是0的游戏,也就是DQN完全无效的游戏,有什么游戏呢? 比如上图这...

      原创
      2016-05-12 15:52:41
      4691
      0
    • 增强学习Reinforcement Learning经典算法梳理3:TD方法

      1 前言在上一篇blog中,我们分析了蒙特卡洛方法,这个方法的一个特点就是需要运行完整个episode从而获得准确的result。但是往往很多场景下要运行完整个episode是很费时间的,因此,能不能...

      原创
      2016-05-12 11:35:26
      20968
      0
    • 增强学习Reinforcement Learning经典算法梳理2:蒙特卡洛方法

      1 前言在上一篇文章中,我们介绍了基于Bellman方程而得到的Policy Iteration和Value Iteration两种基本的算法,但是这两种算法实际上很难直接应用,原因在于依然是偏于理想...

      原创
      2016-05-12 10:17:36
      10721
      2
    • 增强学习Reinforcement Learning经典算法梳理1:policy and value iteration

      前言就目前来看,深度增强学习(Deep Reinforcement Learning)中的很多方法都是基于以前的增强学习算法,将其中的value function价值函数或者Policy functi...

      原创
      2016-05-11 21:46:05
      10972
      2
    • OpenAI Gym 关于CartPole的模拟退火解法

      前言今天测试OpenAI Gym,然后发现CartPole的最快实现快到离谱,使用Simulated Annealing,也就是SA模拟退火法。效果如下图: 代码地址:模拟退火解CartPole于是...

      原创
      2016-05-03 21:38:01
      5493
      0
    • DRL前沿之:End to End Learning for Self-Driving Cars

      前言如果大家关注上个月Nvidia GTC,那么大家应该会注意到Nvidia 老大黄仁勋介绍了他们自家的无人驾驶汽车,这个汽车的无人驾驶技术和以往的方法不一样,完全采用神经网络。这个系统取名为DAVE...

      原创
      2016-05-03 10:21:26
      4526
      1
    • DRL前沿之:Benchmarking Deep Reinforcement Learning for Continuous Control

      前沿Deep Reinforcement Learning可以说是当前深度学习领域最前沿的研究方向,研究的目标即让机器人具备决策及运动控制能力。话说人类创造的机器灵活性还远远低于某些低等生物,比如蜜蜂...

      原创
      2016-04-27 15:48:38
      4657
      2
    • 你是这样获取人工智能AI前沿信息的吗?

      前言对于Researchers或者Geeks而言,特别是并没有在顶级的科研圈里的人,如何高效的获取最新的科技前沿,对自己的研究方向,定位是非常重要的。对于比如人工智能的入门者而言,确定方向更是重中之重...

      原创
      2016-04-16 14:06:41
      5829
      3
    • 了解点OpenAI及深度学习研究前沿

      前言OpenAI是2015年底刚成立的人工智能公司,由Elon Musk领投,号称有10亿美金的投资额,由几位人工智能的顶尖好手组成。这基本上意味着一个新的DeepMind公司诞生,只不过这次Open...

      原创
      2016-04-14 09:07:32
      12315
      4
  • 学院
  • 下载
  • 消息