博弈论
文章平均质量分 90
longzu0
java和pyhton学习者,不知名大学在读
展开
-
完美信息博弈
这里写目录标题perfect-information game从博弈树得到收益表subgamebackward induction 反向推导一个值得思考的例子:另一个例子umperfect information extensive混合策略和行为策略(mexed and behavioral strategies)不完美信息博弈的求解博弈树用于动态博弈(不是同时决定)。博弈按照博弈的顺序和信息的情况分为四大类: 1、完全信息静态博弈(最简单的,表格就行) 2、完全信息动态博弈(又分为完全且完原创 2021-11-05 19:25:48 · 2644 阅读 · 0 评论 -
博弈论 第五章 重复博弈
无限重复博弈的效用(utility)使用平均收益:有时我们认为不同时间获得的收益重要性不同,比如一开始的收益权重更大(因为越早获得,可以收利息:注意β\betaβ小于1,所以指数函数递减。如果这个游戏每次开始前有β\betaβ的概率继续,1−β1-\beta1−β的概率终止,那么计算公式还是上面这个。随机博弈一个博弈的结果,可能会导致另一个博弈的出现。这个定义里假设了所有博弈里行动集合相同,也可以定义成不同。这个定义也生成了一个马尔可夫决策过程(MDP)。(MDP就是单人随机博弈)原创 2021-11-05 19:22:19 · 3524 阅读 · 0 评论 -
第四章 博弈树game tree
博弈树 game tree、perfect-information game(N, A, H, Z, χ, ρ, σ, u)(N,~A, ~H, ~Z,~\chi, ~\rho, ~\sigma, ~u )(N, A, H, Z, χ, ρ, σ, u)N:人数A:每个人的行动集合Z:叶子节点。H:博弈树中除了叶子节点的其余节点集合。 χ~\ch原创 2021-07-21 19:31:11 · 11616 阅读 · 0 评论 -
2021-07-18
严格劣策略 strictly dominated strategies不管别人怎么选,我选ai行动的收益都小于a’i,那么ai相比ai’是严格劣策略。原理:基本假设:1、 所有人都想最大化收益。2、 所有人都知道第1条。3、 所有人都知道上一条。。。例子:玩家2的R比C是严格劣策略,所以他不可能选R,由此得到:不断重复,最后剩下:(D, C)例子:这里M不是严格劣策略,但是玩家以有另一个选择,0.5U+0.5D的组合。此时增加一行:因此M比组合策略是严格劣策略。因此删除M原创 2021-07-19 12:32:42 · 1032 阅读 · 1 评论 -
博弈论coursera
博弈论1-9 Dominant Strategies 占优博弈si是i个体的某个策略。S-i是其他个体策略组合的集合(例如包括元素:s-1:即{s1,s2…si-1, si+1,sn},即个体k选择策略sk)。si比si‘严格占优当:解释:无论其他n-1个个体选择什么策略,得到什么样的策略组合s-1∈S-1,我(个体i)用si策略的收益总是比用si’的收益高。弱占优:解释:大于等于说明在某个s-i下,可能si等于si’。甚至可能所有情况下si都等于si’。即可能是三种情况:严格占优;完全相等;原创 2021-07-17 09:35:14 · 1706 阅读 · 1 评论