算法
文章平均质量分 77
BUPTNser
hellosun
展开
-
Q-Learning的一个简单的教程
阅读的文献中涉及到了Q-learning,是与机器学习有关的,虽然与自己方向并不相关。但作为一种思想值得学习。故翻译如下,不当之处,恳请批评指正!原文地址:http://mnemstudio.org/path-finding-q-learning-tutorial.htm这篇教程通过一个简单而且好理解的数字例子来介绍Q-Learning的概念。这个例子描述了一个Agent是如何通过无监翻译 2015-03-10 14:45:07 · 11160 阅读 · 3 评论 -
手动计算Q-Learning的一个实例
此篇文接上篇为了更好的理解Q-Learning算法是如何工作的,我们一步步手动计算一些过程。我们把γ的值设为0.8,初始状态在房间1中。把Q矩阵初始化为0让我们看一下R矩阵的第二行(状态1),对当前状态1有两种可能的动作:到达状态3或者到达状态5.我们随机选择到达状态5作为采取的动作。现在让我们想象一下Agent在状态5会发生什么。观察R矩阵的第六行(状态5),翻译 2015-03-10 16:13:24 · 5124 阅读 · 2 评论