AI
哈鲤哈鲤路丫
依然奋斗的泼昂鲤~
展开
-
蒙特卡洛树搜索(MCTS)进行模拟的实现流程
首先,要明确的一点是,算法并不用了解游戏的领域知识。 在一个游戏模拟过程中,相关决策的组合可能是一个很大的数,我们如何控制这个模拟行为是满足一定时间上的限制的。我们允许一个参数来控制时间。每次模拟一条路径,直到timeout模拟结束。 下面先介绍MCTS。 4个阶段,选择,扩展,模拟,回溯更新原创 2017-03-01 16:58:24 · 3882 阅读 · 1 评论 -
基于蒙特卡罗的VOI(Value of Information)
MC-VOI MC-VOI for stastic下面将列出计算VOI的过程: 纵观整个算法,这是一个通过模拟未来多个步骤,来对当前所在状态的下一步做出最优决策的过程。 设在当前系统中,包含两类action, A[c, ¬c ]。 在程序执行模拟未来的action时,遇到action c 会收集observation o, 并由当前状态的 b原创 2017-02-23 14:54:59 · 1008 阅读 · 0 评论