使用Q-learning算法让Chrome小恐龙自动学习躲避障碍物(示例)

weixin_33847182

于 2017-12-31 23:48:00 发布

阅读量2.3k

点赞数

文章标签：人工智能

原文链接：https://yq.aliyun.com/articles/658206

版权

原理很简单,就是给定小恐龙障碍物类型、障碍物距离、游戏的相对速度作为状态,小恐龙有跳跃,低头,不做任何动作这三种动作可选,小恐龙存活则奖励碰到障碍物则惩罚。
Q-learning算法详细说明可参考知乎问题:如何用简单例子讲解 Q - learning 的具体过程？
在示例中我默认让小恐龙不做任何动作让其慢慢纠正错误,不然你们会看到:

不停乱跳或是低头有点鬼畜

按空格开始游戏

未学习示例:http://runjs.cn/detail/cirqzzgn
已学习部分(未学习躲避翼龙)记录示例:http://runjs.cn/detail/baxttgdk

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。