- 博客(12)
- 收藏
- 关注
翻译 手动计算Q-Learning的一个实例
此篇文接上篇为了更好的理解Q-Learning算法是如何工作的,我们一步步手动计算一些过程。我们把γ的值设为0.8,初始状态在房间1中。把Q矩阵初始化为0让我们看一下R矩阵的第二行(状态1),对当前状态1有两种可能的动作:到达状态3或者到达状态5.我们随机选择到达状态5作为采取的动作。现在让我们想象一下Agent在状态5会发生什么。观察R矩阵的第六行(状态5),
2015-03-10 16:13:24 5128 2
翻译 Q-Learning的一个简单的教程
阅读的文献中涉及到了Q-learning,是与机器学习有关的,虽然与自己方向并不相关。但作为一种思想值得学习。故翻译如下,不当之处,恳请批评指正!原文地址:http://mnemstudio.org/path-finding-q-learning-tutorial.htm这篇教程通过一个简单而且好理解的数字例子来介绍Q-Learning的概念。这个例子描述了一个Agent是如何通过无监
2015-03-10 14:45:07 11167 3
原创 Git 分支相关
查看分支:git branch创建分支:git branch 切换分支:git checkout 创建+切换分支:git checkout -b 合并某分支到当前分支:git merge 删除分支:git branch -d
2015-03-08 19:15:18 464
原创 Git checkout
Git checkout -- file其本质是使用暂存区的文件替换工作区的文件。因此如果误删了工作区的文件,则可使用checkout还原;如果想撤销对工作区文件的修改,也可以用checkout把工作区的修改撤销。
2015-03-08 13:55:28 527
原创 Git撤销修改的三种情况
1.只在工作区做了修改并没有add到暂存区,则可以用git checkout -- file的方式撤销修改。2.将修改add到了暂存区,可以通过git reset HEAD file的方式,把暂存区的修改撤销,放回工作区,然后按1种的方式撤销修改。3.如果已经commit到了版本库里,如果你还没有推送到远程库的话,可以使用版本回退的方式撤销修改,比如git reset --hard HE
2015-03-08 13:46:58 553
原创 set中怎么放入结构体数据
#include #include using namespace std;struct GenerationInfoNode{ int iGenertionNumber; int iGenerationStartTsn; int iGenerationEndTsn; int iGenerationSize;};bool operator<(const G
2014-12-18 16:50:23 8963
原创 NS2 写自己的协议之后运行tcl脚本 出现死循环错误
错误原因:自己加了一个NC chunk header.....仔细分析:一个packet大小为1500字节,出去common header,还剩下1468字节给数据,这个数据包括了很多chunk(chunk的头和chunk中的净荷数据),自己加了这个NC header之后,把这个NC Header的大小也加到sHdr.usLength中了,导致这个量的值变成了1488>1468。然后在Rt
2014-12-11 17:32:49 1032
原创 [LeetCode] Merge Two Sorted Lists
//题目描述:Merge two sorted linked lists and return it as a new list. The new list should be made by splicing //together the nodes of the first two lists.思路:创建一个新的链表,将l1,l2中元素按由小到大依次插入。wrong的原因是,最初在最后返回的是
2014-11-27 17:22:06 383
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人