强化学习理论与实践
司南牧
立志让初学者跨界学编程/算法/AI机器人无障碍专注零基础教程,知乎@司南牧
展开
-
适合初学者的强化学习教程(1): python使用gym实践和注意事项
安装 pip install gym报错 AttributeError: module 'gym.envs.box2d' has no attribute 'BipedalWalker'这是因为gym没有安装box2d的原因。pip install box2d-py如果上面这条命令出下面这个报错:error: command ‘swig.exe’ failed: No such...原创 2019-04-26 16:06:08 · 7197 阅读 · 4 评论 -
适合初学者的神经网络理论到实践(4): 打破概念束缚:强化学习是个啥?
注意:强化学习有很多概念,不要一开始被这些概念束缚了。首先得知道强化学习大致是什么,再看这些概念就会恍然大悟。 本文的思路就是先介绍我对强化学习的理解。然后介绍强化学习中的一些概念。最后是强化学习实践。打破概念束缚:强化学习是个啥?答:强化学习就是受到动物从生活中学习技能的思想启发的一种智能算法;那么怎么启发的呢?动物学习技能的过程就是不断尝试各种行为,最后总结经验,然后以后遇到相同情...原创 2019-04-27 20:23:53 · 679 阅读 · 0 评论 -
一文看懂强化学习中的那些概念及各算法之间本质上的联系易懂梳理简单举例与python实践
强化学习它的思路基本是想要遍历穷举计算各种状态的价值,然后尽可能的达到高价值的那些状态。那么什么是状态?什么是状态的价值?不同问题的里面含有的“状态”的内容和数量都不一样。下面我举个例子。比如玩井字棋(三个相同色在一条线就赢)。看下面这张图**,每张图对应的棋子放置的位置就是一个状态**。(在本例子中我们编程化那就一个状态就只需要用一个3×3的数组来保存棋谱即可)。# 用3×3的二维数组保存状...原创 2019-09-22 15:17:28 · 355 阅读 · 0 评论