Strategy set、Action set和Information set

[1]selcuk ozyurt, 2. Introduction to Game Theory - Part 2 (Game Theory Playlist 1), Oct 1, 2020,  https://www.youtube.com/watch?v=2kLvPrXVpGs&list=PLcrc6i6xwaQQGOK095_Im781aFOQ1BFix&index=2

[2]selcuk ozyurt, 5. Normal (Strategic) Form Representation of Games - Part 1 (Game Theory Playlist 1), Oct 1, 2020,  https://www.youtube.com/watch?v=cvCMBmpbDQQ&list=PLcrc6i6xwaQQGOK095_Im781aFOQ1BFix&index=5

[3]selcuk ozyurt, 7. Review Examples for Normal Form Representation - Example 1 (Game Theory Playlist 1), Dec 23, 2020, https://www.youtube.com/watch?v=1NU26XZwAvM&list=PLcrc6i6xwaQQGOK095_Im781aFOQ1BFix&index=7

【轉註】我來學習Prof. Ozyurt對strategy的說明。

Mr. Brown面臨一個抉擇[1]:錢是投到對沖基金(hedge fund)還是投資開一家餐館,如果開餐館,選在城區(downtown)還是某個郊區(Richmond Hill)。

Mr. Green是要開餐館的,但需要做個選址決定:城區(downtown)還是某個郊區(Richmond Hill)。

他們之間有一個strategy interaction,因為如果大家都開在城區的話,可能需要你開意餐館,我開日餐館,如果都選在郊區,本來郊區人就少,可能競爭過於激烈了。

依照他們做決策的順序,game tree如圖1。

 圖1:game tree 1

Game tree的要素有[1]:1)decision node,每個decision node屬於一個player。2)information。每個player知道的game information。3)每個decision node的action set。

其中Mr. Brown的decision node有{A, C},Mr. Green的decision node有{B, D, E}。

Node C 是Mr. Brown,如果Mr. Green 先做決策,那麼Node C就表示Mr. Green。

在D、E,Mr. Green不知道Mr. Brown選了城區還是郊區,他是需要在不清楚對方的決策的情況下做一個決策。這樣D、E屬於同一個information set(簡稱infoset),也就是說D、E的information是一樣的。

如果在D、E點,Mr. Green已經觀察到Mr. Brown做了什麼選擇了,那麼這兩個點就不連在一起了,就是兩個information set。(也就是說不知道其他player做了什麼選擇的情況下,多個decision node連在一起,組成一個information set,假如知道其他player 做了什麼選擇,那麼decision node是單獨的,單獨稱為一個information set。)

同一個information set decision node的actions是相同的。

比如在D、E,Mr. Green不知道Mr. Brown選了城區還是郊區,可他自己必須做一個選擇。他就評估一個utility expectation最好的選擇。如果他能知道Mr. Brown選了什麼,他就能在D、E有獨立的決策過程。


n個player,strategy profile為S=S_1\times S_2\times... \times S_n

下面我們來看S_i如何確定。

圖2:Game tree 2 

Game tree 2中[2],Player 1只有一個decision node,其strategy set=action set,S_1=\{A, B\}

Player 2有兩個decision nodes,但屬於同一個information set,那麼每個decision node可選的action是一樣的。不可能不一樣,因為他不知道對方選了什麼,他只能做一個選擇,選一個utility expection最好的選擇。

 圖3:Game tree 3

Game tree 3中,Player 1有兩個decision node,其strategy set = action set 1 \times action set 2 = {AC, AD, BC, BD}。(組合拳)

這裡我們看出,為了清晰,獨立的decision node的Actions用不同的字母表示。(即使實際動作是一樣的,但數學表達上不區分會讓人迷惑的,例如若Player 2的第二decision node,其action set 也是{A, B},S_1=\{AA,AB,BA,BB\},第二A、B時,我們就不那麼直觀地知道到底是哪個decision node。)

Player 2有兩個decision nodes,屬於同一個information set,故兩個decision nodes的action set相同。其strategy set = {E, F}。

Game tree 可化為normal form。


如果三個player的話[3],從Game tree化成normal form就得3D了?可以是一組表格(如圖4示)。

 圖4:Game Tree 4


所以,Strategy set的定義:設Player i有k個infosets,第j個infoset的Action set 是A_jS_i=A_1 \times A_2 \times ...\times A_k

選擇Strategy(a choice of strategy,choosing a strategy):我們在Game tree化為Normal form時,每個decision node選擇分支,來到達Terminal node,從而確定表格中utility。

但理論上choosing a strategy是從S_i選擇一組action,尤其是第j個infoset選擇A_j中的一個action,需要選擇utility expection最好的action,這並不簡單,我們在Bayesian Nash Equilibrium中的學習。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值