Game_Theary
Coop_Multi-Agent_DRL
The whole world can be modeled as multi-agent
展开
-
Impartial_Conbinatorial_Games
文章目录视频教程1. 一堆东西2. 俩堆东西 视频教程 1. 一堆东西 参考文献 如果 n=(m+1)r+s,(r为任意自然数,s≤m),那么先取者要拿走s个物品,如果后取者拿走 k(≤m)个,那么先取者再拿走m+1-k个,结果剩下(m+1)(r-1)个,以后保持这样的 取法,那么先取者肯定获胜。总之,要保持给对手留下(m+1)的倍数,就能最后获胜。 2. 俩堆东西 ...原创 2019-12-10 16:21:33 · 132 阅读 · 0 评论 -
CFR
文章目录CFR+“直觉”(DeepStack) CFR+“直觉”(DeepStack) 直觉 类似于 价值原创 2019-11-18 21:50:18 · 832 阅读 · 1 评论 -
Game_Theory
文章目录Zero-Sum(每玩一局都有一个玩家会赢和一个玩家会输)纯策略(确定性选择一个策略)混合策略(基于agent所有可能行为的概率分布, 从而来选择动作) Zero-Sum(每玩一局都有一个玩家会赢和一个玩家会输) 纯策略(确定性选择一个策略) 混合策略(基于agent所有可能行为的概率分布, 从而来选择动作) ...原创 2019-11-13 22:28:05 · 164 阅读 · 0 评论