[Game Theory and Strategy 7]

賽局理論篇:混合策略 Mixed Strategies - 猜拳、猜硬幣、猜對方如何進攻

Chinese 賽局與策略

written by LiaoWC on 2021-07-01


untitled-18.png

Matching Pennies Game

在講混合策略是什麽以前,我們先看“Matching Pennies”這個遊戲。簡單來說,有點像是猜硬幣賭博,有兩位玩家各有一枚硬幣,雙方可以決定要翻到哪一面,然後雙方同時出示自己翻的那一面,如果兩個人的硬幣是同一面,則一方贏錢,若不同面,則另一方獲勝。如下圖所表示:

untitled-20.png

從賽局矩陣可以看到,沒有納許均衡點。那這樣的賽局要怎麼決定出什麼策略呢?

這時候混合策略就登場啦~

混合策略(Mixed Strategies)

什麼是混合策略?就是把每個策略都想成是有一個機率會被選擇到的。沿用上面的矩陣,我們假設玩家 A 在配對成功時算賭贏。當 A 要下決定時,他可以這麼想:假設對方出「正面」的機率是 p。

untitled-21.png

那麼 A 出「正面」的期望值就是:

$(+1)(p)+(-1)(1-p)=-1+2p$

出「反面」的期望值就是:

$(-1)(p)+(+1)(1-p)=1-2p$

混合策略的精神就是你在出招時,要做到出什麼招的期望值都「沒有不同」(indifferent)。什麼意思呢?如果你的期望值有高有低,那麼對手就可以針對你期望值比較高的策略去打擊。雙方用這樣的出招方式的來思考的結果稱為「混合策略納許均衡」(mixed strategy Nash equilibrium)。以這個例子來講,我們先算一下在「沒有不同」的狀況下:

$-1+2p=1-2p\Rightarrow p=\frac{1}{2}$

也就是當玩家 B 出正反面的比例都是一半一半時,他出正反面的期望值都一樣。如果他不是這樣出會怎麼樣?假設 B 讓 $p > \frac{1}{2}$,也就是他比較常出「正面」,那麼玩家 A 出「正面」的期望值就會比出「反面」高;反之,如果 A 知道 B 比較常出「反面」那麼 A 出「反面」的期望值就會比較高。

再舉個更生活化的例子,可以思考一下:你跟一個人猜拳時,是不是你知道他較常出什麼你就會比較有利?所以你在猜拳時,要做到讓人家猜不透你出什麼,也就是剪刀石頭布各$1/3$的機率。

從前面猜硬幣和猜拳的例子來看,它們的結論都是出每個策略的機率都相同。那麼,請問是不是表示解混合策略問題時,讓每個策略的機率都一樣就好了?並不是。會有這樣的現象只是特例,當個策略的回報相同時。我們看下一個例子。

untitled-19.png

投三分球還是切入?

想像你正在一場籃球比賽,在三分線拿到球的你正在猶豫要投三分球還是切入。對方的防守球員也正觀察著你的行為,思考要防守你的投籃還是你的切入。假設如果對方猜對你的下一步就會成功防守,讓你得不到任何分數;如果對方猜錯,而你投三分球就會得分,心裡的價值估算我們設成 3;如果是切入,而對方猜錯,我們價值算成是 2。如下圖表示:

untitled-22.png

這個情境和前面的猜硬幣不同的地方在於這邊的兩個策略的回報不同。我們把機率的概念代進去:

untitled-23.png

設 p 為防守方選擇防三分球的機率;q 為進攻方選擇投三分球的機率。

進攻方選擇投三分球的期望值:$(0)(p)+(3)(1-p)=3-3p$

進攻方選擇切入的期望值:$(2)(p)+(0)(1-p)=2p$

做到期望值「沒有不同」:$3-3p=2p\Rightarrow p=\frac{3}{5}$

防守方選擇防守三分球的期望值:$(0)(q)+(-2)(1-q)=-2+2q$

防守方選擇防守切入的期望值:$(-3)(q)+(0)(1-p)=-3q$

做到期望值「沒有不同」:$-2+2q=-3q\Rightarrow q=\frac{2}{5}$

最後的混合策略納許均衡就是進攻方以 2/5 的比例來投三分球,3/5 的比例切入;防守方以 3/5 的比例選擇防守三分球,2/5 的比例防守切入。

可以觀察到的是:

  1. 兩種策略的選擇機率並不相等
  2. 可以得比較高分的策略竟然反而機率要比較低

關於第二點,有點違反一般人的直覺。比較強的武器竟然要比較少用一點!?你可以再重新思考一下為什麼會這樣。

結論

對於一個賽局,你可以去思考看看有沒有「混合策略納許均衡」(Mixed Strategy Nash Equilibrium,機率思考),而非只思考純策略納許均衡(Pure Strategy Nash Equilibrium,單純只決定選擇一個策略的那種,此篇以前文章提到的都是屬於這種)。

順帶一提,一個賽局可能同時有純策略和混合策略的納許均衡喔!

圖片來源

https://unsplash.com/photos/kY6HbkiauSc?utm_source=unsplash&utm_medium=referral&utm_content=creditShareLink https://unsplash.com/photos/9OzQCwuaJhc?utm_source=unsplash&utm_medium=referral&utm_content=creditShareLink