人工智能
rufanchen_
这个作者很懒,什么都没留下…
展开
-
一文打尽人工智能和机器学习网络资源,反正我已经收藏了
大数据文摘作品 的确,如今学习人工智能最大的困难不是找不到资料,更多同学的痛苦是:网上资源太多了,以至于没法知道从哪儿开始搜索,也没法知道搜到什么程度。 为了节省大家的时间,我们搜遍网络把最好的免费资源汇总整理到这篇文章当中。这些链接够你学上很久,而且你看完本文一定会再次惊叹:现在网上关于机器学习、深度学习和人工智能的信息真的非常多。 本文罗列了以下几个方面的学习资源,供大家收藏...转载 2018-09-15 17:37:19 · 1568 阅读 · 0 评论 -
强化学习(十四) Actor-Critic
在强化学习(十三) 策略梯度(Policy Gradient)中,我们讲到了基于策略(Policy Based)的强化学习方法的基本思路,并讨论了蒙特卡罗策略梯度reinforce算法。但是由于该算法需要完整的状态序列,同时单独对策略函数进行迭代更新,不太容易收敛。 在本篇我们讨论策略(Policy Based)和价值(Value Based)相结合的方法:Actor-Critic算法。...转载 2019-07-08 20:16:07 · 2044 阅读 · 0 评论 -
强化学习(十三) 策略梯度(Policy Gradient)(源码)
在前面讲到的DQN系列强化学习算法中,我们主要对价值函数进行了近似表示,基于价值来学习。这种Value Based强化学习方法在很多领域都得到比较好的应用,但是Value Based强化学习方法也有很多局限性,因此在另一些场景下我们需要其他的方法,比如本篇讨论的策略梯度(Policy Gradient),它是Policy Based强化学习方法,基于策略来学习。 本文参考了Sut...转载 2019-07-09 09:52:39 · 2161 阅读 · 0 评论