上回介紹了囚徒困境,我們用下圖表示了這個囚徒困境的情境。對於其中一個嫌疑犯來說,無論另一個嫌疑犯選擇的策略為何,認罪都是最好的選項(如下圖紅線所示),因此認罪是支配性策略(dominant strategy);反過來看,另一個嫌疑犯的支配性策略也是認罪,因此最後結果會落在雙方都選擇認罪(即圖中右下角那格)。
在這個範例中,我們運用了「支配性策略」來預測結果,那如果今天我們的賽局矩陣並不能找到支配性策略(如下圖的數字組合),我們要怎麼進行結果的預測?
對玩家 A 來說,當 B 選擇策略 1 時,他的最佳策略是策略 1;但如果 B 選擇的是策略 2,則是策略 2 帶給 A 最大的回報。在這個沒有支配性策略的情境下,我們可以使用納許均衡(Nash Equilibrium)的概念來看這個問題。
以兩個玩家的賽局來說,當我們說雙方各自選擇的策略的這個組合是納許均衡,指的是雙方玩家所選策略皆是對方選的策略的最佳回覆。以上圖來說,A 選擇策略 1 + B 選擇策略 1 就是個納許均衡(左上角那個),為什麼?因為在 B 選策略 1 時,A 選策略 1 是最佳回覆;同時,在 A 選策略 1 時,B 選策略 1 也是最佳回覆。用這個概念來看,右下角(2, 2)那個也是個納許均衡,我們可以預估結果會落在納許均衡點上,意即落在(5, 5)或(2, 2)上。三人以上賽局的納許均衡概念也是一樣。
納許均衡點是個穩定的點,在納許均衡點上你沒辦法單方面藉由改變策略而得到更好的回報,所以納許均衡點會讓雙方動不了,換句話說,就是沒有讓你想選別的點的動力。