對策論

[編輯首段]維基百科，自由的百科全書

(重定向自博弈论)

跳转到：导航, 搜索

維基文庫中與本條目相關的原始文獻：

博弈論

對策論（game theory），曾稱為博弈論，作為運籌學的一個分支, 目前在生物學，經濟學，國際關係，電腦科學, 政治學，軍事戰略和其他很多學科都有廣泛的應用。主要研究公式化了的激勵結構對策（Game，又稱博弈）間的相互作用。是研究具有鬥爭或競爭性質現象的數學理論和方法。

對策論考慮遊戲中的個體的預測行為和實際行為，並研究它們的優化策略。表面上不同的相互作用可能表現出相似的激勵結構(incentive structure)，所以他們是同一個遊戲的特例。其中一個有名有趣的應用例子是囚徒困境悖論（Prisoner's dilemma）。

具有競爭或對抗性質的行為成為對策行為。在這類行為中，參加鬥爭或競爭的各方各自具有不同的目標或利益。為了達到各自的目標和利益，各方必須考慮對手的各種可能的行動方案，並力圖選取對自己最為有利或最為合理的方案。比如日常生活中的下棋，打牌等。對策論就是研究對策行為中鬥爭各方是否存在著最合理的行為方案，以及如何找到這個合理的行為方案的數學理論和方法。

生物學家使用對策理論來理解和預測演化（論）的某些結果。例如，John Maynard Smith 和George R. Price 在1973年發表於Nature上的論文中提出的「evolutionarily stable strategy」的這個概念就是使用了對策理論。還可以參見演化對策理論（evolutionary game theory）和行為生態學（behavioral ecology）。

對策論也應用於數學的其他分支，如機率，統計和線性規劃等。

[編輯] 數學定義

對於「對策」(game)有不少可以互換的定義。這裡給出簡短的介紹和相互關係的說明。

[編輯] 正則形式的對策(Normal form game)

設定 $N$ 是一個「遊戲者」(players)的集合。對於每一個「遊戲者」 $i \in \mathrm{N}$ 都有一個給定的「策略」集合 $\Sigma\ ^i$ . 對策（遊戲）是一個函數，定義為:

$\pi\ : \prod_{i\in \mathrm{N}} \Sigma\ ^i \to \mathbb{R}^\mathrm{N}$

也就是說，如果我們知道了遊戲者的策略集合是什麼，那麼就可以有一個實數值與之對應。我們可以把上面的方程拆成兩個方程來進一步把它一般化。一個方程是正則形式(Normal form game)的對策方程，描述策略規定結果的方式。另外一個方程描寫遊戲者對於結果(outcome)集合的偏愛(preference)。也就是：

$\pi\ : \prod_{i \in \mathrm{N}} \Sigma\ ^i \to \Gamma\$

這裡 $\Gamma\$ 是遊戲（對策）的結果集合(outcome set)。對於每一個遊戲者 $i\in \mathrm{N}$ 都有一個偏愛函數( preference function)

$\nu\ ^i : \Gamma\ \to \mathbb{R}$ .

[編輯] 展開形式的對策(Extensive form game)

(參見展開形式的對策)(Extensive form game)

正則形式的定義為數學家們提供了「均衡」(equilibria)問題的研究一個容易使用的表達式。因為它避免了怎麼計算「策略」的問題，也就是說遊戲是怎麼進行的問題。處理這類問題的一個比較方便的表達式，是展開形式的對策。這個形式與組合對策論關係密切。這個定義通過一個樹的形式給定。在樹的每一個節點（vertex), 不同的遊戲者選擇一個邊(edge)。

[編輯] 簡單遊戲(Simple game)

[編輯] 對策論簡史

對於對策論的研究，開始於策墨洛(Zermelo,1913)，波雷爾(Borel,1921)及馮·諾伊曼(von Neumann, 1928)，後來由馮·諾伊曼和奧斯卡·摩根斯坦(von Neumann and Morgenstern，1944，1947)首次對其系統化和形式化（參照Myerson, 1991）。隨後約翰·福布斯·納什(John Forbes Nash Jr., 1950, 1951)利用不動點定理證明了均衡點的存在，為對策論的一般化奠定了堅實的基礎。

[編輯] 當代對策論領軍人物

約翰·福布斯·納什、約翰·C·海薩尼，以及萊因哈德·澤爾騰。這三人同時因為他們對對策論的突出貢獻而獲得1994年的瑞典銀行經濟學獎（也稱諾貝爾經濟學獎）。
羅伯特·J·奧曼、肯·賓摩爾、戴維·克瑞普斯，以及阿里爾·魯賓斯坦。

[編輯] 對策分類

對策的分類根據不同的基準也有不同的分類。一般認為，對策主要可以分為合作對策和非合作對策。它們的區別在於相互發生作用的當事人之間有沒有一個具有約束力的協議，如果有，就是合作對策，如果沒有，就是非合作對策。

從行為的時間序列性，對策論進一步分為兩類：靜態對策是指在對策中，參與人同時選擇或雖非同時選擇但後行動者並不知道先行動者採取了什麼具體行動；動態對策是指在對策中，參與人的行動有先後順序，且後行動者能夠觀察到先行動者所選擇的行動。通俗的理解："囚徒困境"就是同時決策的，屬於靜態對策；而棋牌類遊戲等決策或行動有先後次序的，屬於動態對策

按照參與人對其他參與人的了解程度分為完全信息對策和不完全信息對策。完全對策是指在對策過程中，每一位參與人對其他參與人的特徵、策略空間及收益函數有準確的信息。如果參與人對其他參與人的特徵、策略空間及收益函數信息了解的不夠準確、或者不是對所有參與人的特徵、策略空間及收益函數都有準確的準確信息，在這種情況下進行的對策就是不完全信息對策。

目前經濟學家們現在所談的對策論一般是指非合作對策，由於合作對策論比非合作對策論複雜，在理論上的成熟度遠遠不如非合作對策論。非合作對策又分為：完全信息靜態對策，完全信息動態對策，不完全信息靜態對策，不完全信息動態對策。與上述四種對策相對應的均衡概念為：納什均衡(Nash equilibrium)，子對策精煉納什均衡（subgame perfect Nash equilibrium），貝葉斯納什均衡(Bayesian Nash equilibrium)，精煉貝葉斯納什均衡(perfect Bayesian Nash equilibrium)。

對策論還又很多分類，比如：以對策進行的次數或者持續長短可以分為有限對策和無限對策；以表現形式也可以分為一般型（戰略型）或者展開型，等等。

[編輯] 對策論相關概念

[編輯] 參考書目

Harold W. K.(editor), 1997, Classics in Game theory, Princeton, NJ:Princeton University Press ISBN 0691011931
Myerson, R., 1991, Game Theory: Analysis of Conflict. Cambridge and London: Harvard University Press.
Osborne, M. and A. Rubinstein，1994，A Course in Game Theory, Cambridge and London: The MIT Press.
岡田章,1996,『ゲーム理論』東京：有斐閣 ISBN 4641067945
Axelrod, Robert: The Evolution of Cooperation, 1985, ISBN 0465021212
Axelrod, Robert: The Complexity of Cooperation - Agent-Based Models of Competition and Collaboration, 1997, ISBN 0691015678
Dixit, Avinash K./ Skeath, Susan: Games of Strategy, 1999, ISBN 0393974219
Eigen, Manfred / Winkler, Ruthild: Das Spiel, 1976, ISBN 3492021514
Hargreaves Heap, Shaun P. / Varoufakis, Yanis: Game Theory - A Critical Text, 2004, ISBN 0415250951
Kelly, Anthony: Decision Making Using Game Theory - An Introduction for Managers, 2003, ISBN 0521814626
Schlee, Welter: Einführung in die Spieltheorie, 2004, ISBN 3528032146

[編輯] 外部連結

Economics and Language, by Ariel Rubinstein
Bargaining and Markets, by Osborne, M. and A. Rubinstein

取自"http://zh.wikipedia.org/w/index.php?title=%E5%AF%B9%E7%AD%96%E8%AE%BA&variant=zh-hk"

1個分類: 對策論

對策論