![](https://img-blog.csdnimg.cn/20201014180756930.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
强化学习
改造汽水侠2号
机器学习,深度学习 ,计算机图形学 硕士在读
展开
-
David Silver 强化学习RL笔记
以前虽然很早就接触了强化学习,也做过一些项目,但是总觉得基础不扎实,所以决定把David Silver在伦敦大学的强化学习基础课程好好学一遍,然后再学一遍斯坦福大学的CS294深度强化学习课程。CS294先放着,先把David Silver的课程搞定。David 是阿尔法狗的第一作者,名副其实的大佬,他的课还是很有价值的,我学习了之后确实很多地方有了更深的理解。 课程...原创 2018-03-22 14:55:26 · 1472 阅读 · 0 评论 -
AlphaZero算法玩游戏《步步为营》(Quoridor)
引入 最近突然想起2个月前做的一个项目,还处于起步阶段,就是利用AlphaZero算法玩一个叫步步为营的游戏,最初写这个项目其实是受人所托,后来初步完成后由于各种原因,打比赛,做项目等等,就一直荒废在那里了。先介绍下这个游戏,中文名叫步步为营,英文名叫Quoridor,这个游戏在中国或许不火,但是以前在国外还是特别火的。属于一款益智类的桌游,大体如下面这个样子: 游戏可以由...原创 2018-07-28 23:44:23 · 6592 阅读 · 6 评论