對策論
[拼音]:duicelun
[外文]:game theory
關(guān)于兩個(gè)或多個(gè)局中人按一定規(guī)則處于競爭狀態(tài)下的決策行為的數(shù)學(xué)理論,又稱博弈論。對策論是運(yùn)籌學(xué)的一個(gè)分支,起源于對室內(nèi)游戲(如象棋、撲克等)局中人的行為和得失的研究,后來發(fā)展成為研究帶有競爭因素的社會(huì)現(xiàn)象的一種數(shù)學(xué)方法。在社會(huì)、經(jīng)濟(jì)、管理等與人類活動(dòng)有關(guān)的復(fù)雜系統(tǒng)中,人的行為受感情、心理、經(jīng)驗(yàn)等因素的偶然變化影響,從而使系統(tǒng)具有很大的不確定性。而且,系統(tǒng)中決策人互相影響,并按各自的利益和知識進(jìn)行對策,又使問題進(jìn)一步復(fù)雜化。此時(shí),每人都把別人當(dāng)作自己的“控制對象”,卻又無法精確預(yù)測別人的行為,取得必需的信息,他們互相間還可能故意隱瞞真情,制造假象。對策論為局中人在這種高度不確定性和競爭性的環(huán)境中提供了一套完整的、可以定量化、程序化的選擇策略的理論和方法。對策論已應(yīng)用于社會(huì)、經(jīng)濟(jì)和軍事等方面,如對商品、消費(fèi)者、生產(chǎn)者之間供求平衡的分析,利益集團(tuán)間協(xié)商和談判以及潛艇和飛機(jī)等作戰(zhàn)模型的研究等,也可用于人類開發(fā)自然界的分析。
簡史
1921年法國數(shù)學(xué)家E.博雷爾最早提出對策論。1928年美國數(shù)學(xué)家 J.von諾伊曼證明了對策論中最重要的鞍點(diǎn)定理。1944年von諾伊曼和O.莫根施特恩建立了對策論的公理化系統(tǒng),共同發(fā)表《競賽理論與經(jīng)濟(jì)行為》一書,奠定了對策論的理論基礎(chǔ)。
效用函數(shù)
它綜合反映了局中人的利益,包括收益、支付的費(fèi)用或勞動(dòng)、舒適或安全等因素,并可用來刻劃人在風(fēng)險(xiǎn)條件下的決策行為。這些因素需要加以定量描述和歸并,例如通過邊際價(jià)格全部換算為錢的尺度,從而可以互相比較。人們一般具有回避風(fēng)險(xiǎn)的保守心理,這使效用函數(shù)呈凸性,即隨著支付錢的增多效用值趨于飽和。反之,對于傾向冒險(xiǎn)的人,效用函數(shù)則呈凹性。因此,不同的人有不同的效用函數(shù),甚至同一人在不同的條件下也有不同的效用函數(shù)。在對實(shí)際問題進(jìn)行定量分析時(shí),需要從觀測數(shù)據(jù)來估算效用函數(shù)的具體參數(shù),以便確定局中人的對策行為。效用函數(shù)u(ω)是定義在結(jié)局集合Ω={ω}上的有界實(shí)函數(shù)。若兩種具有不確定性的局勢 F1和 F2在 Ω上的概率分布密度分別為 P1(ω)和P2(ω),則局勢F1劣于F2(記作F1??F2)就可定量地表示為
效用函數(shù)具有3個(gè)性質(zhì):
(1)若u為效用函數(shù),則u′=αu+β(α >0)也是效用函數(shù)。
(2)若F??G,u 存在,則任給a<b,均存在效用函數(shù)u′,使u(F)=?唬?u′(G)=b。
(3)若 u與u′均為效用函數(shù),則存在α ,β(α >0)使u′=α u+β。
數(shù)學(xué)描述
社會(huì)、經(jīng)濟(jì)、管理等系統(tǒng)的特點(diǎn)是存在眾多相互影響的決策人(局中人),而且他們的利益不同,甚至是對抗和沖突的。在現(xiàn)代社會(huì)中,人類活動(dòng)范圍日益廣闊,制定完善策略所需知識和信息愈益增加,已經(jīng)達(dá)到任何一個(gè)決策人或機(jī)構(gòu)無法完全收集和處理的程度。信息和決策功能分散化已勢在必行,而各種信息在決策人之間的分配情況(稱為信息結(jié)構(gòu))則直接影響決策的結(jié)果。各種社會(huì)組織結(jié)構(gòu)形式和社會(huì)、經(jīng)濟(jì)的發(fā)展規(guī)律又決定了各人參與決策的次序和規(guī)則,它們同各種游戲和體育規(guī)則一樣,對決策方法和結(jié)果有重要影響。而且人本身的決策行為也存在不確定因素??梢詮囊韵?6個(gè)方面描述對策論的這些有關(guān)問題。
(1)設(shè)總共有 N個(gè)決策人,分別記為DM1,DM2,…,DMN。第i個(gè)決策人DMi所選用的決策量記為 ui。用ui∈Ui表示ui可在某個(gè)集合Ui中取值。Ui可以是有限元素集合、區(qū)間或函數(shù)空間(此時(shí)ui為函數(shù),對應(yīng)于微分對策問題)。
(2)各個(gè)DMi的目標(biāo)是使他的效用函數(shù)Ji達(dá)到極大。Ji不僅受到其他人的決策量的影響,而且還可能受到隨機(jī)因素ξ的影響。所以Ji可寫成
Ji=Ji(u1,u2,…,uN,ξ)
對策人假定均以追求各自的Ji的概率平均值EξJi(稱為支付函數(shù))作為行為的準(zhǔn)則。隨機(jī)量是人們無法控制的,有時(shí)稱為“大自然的選擇”。
(3)每個(gè)DMi作決策時(shí)所能依據(jù)的信息為yi=ηi(u1,u2,…,uN,ξ),稱為信息結(jié)構(gòu)。yi通常需要付出一定代價(jià)由觀測或通信得到。
(4)由yi決定ui的規(guī)則即稱為DMi的策略,記為γi。這實(shí)際上就是函數(shù)關(guān)系ui=γi(yi)。γi可能具有更抽象的含義,例如可以是把一個(gè)函數(shù)映射到另一個(gè)函數(shù)的映射。根據(jù)具體問題,對 γi可能還希望滿足諸如連續(xù)性、可測性之類數(shù)學(xué)條件并要有有效的算法。
(5)規(guī)定對策的法則,包括各人決策的邏輯或時(shí)間順序以及決策的方法和內(nèi)容等,例如宣布一個(gè)策略,提供一些信息或采取某種行動(dòng)。
(6)對各DMi的行為特征做出假定。例如,冒險(xiǎn)或保守,是否愿意合作等。
研究內(nèi)容
對策論按局中人數(shù)N 的多少可分為二人對策或多人對策;按局中人的合作態(tài)度可分為合作對策和非合作對策;按局中人支付函數(shù)的總和是否固定可分為零和對策與非零和對策。對策論中研究歷史最長、最成熟的是二人零和對策,即N=2,J1+J2=0時(shí)的對策問題,DM1所得就是DM2所失。這是完全對抗性的,沒有任何妥協(xié)余地。許多戰(zhàn)爭、對抗和競賽問題都可以應(yīng)用這種模型。當(dāng)所有局中人都為一個(gè)共同決策目標(biāo)函數(shù)J1=…=JN=J而奮斗時(shí),由于各人擁有信息不同而不能集中起來處理,也無法實(shí)現(xiàn)完善合作。這類對策問題屬于隊(duì)決策理論的研究內(nèi)容,主要是研究信息結(jié)構(gòu)同系統(tǒng)品質(zhì)和控制策略的關(guān)系。它可為大型分散控制系統(tǒng)信息結(jié)構(gòu)和相應(yīng)的控制策略提供設(shè)計(jì)參考。當(dāng)各局中人(DMi)之間不能預(yù)先確定合作行動(dòng)時(shí),對策論的解為納什平衡,即非合作平衡解,可應(yīng)用于社會(huì)經(jīng)濟(jì)等方面的大量問題。當(dāng)各局中人之間具有一定合作性時(shí),對策論的解為帕雷托最優(yōu)和協(xié)商解,可應(yīng)用于經(jīng)濟(jì)行為研究。局中人分居不同層次時(shí)的對策問題稱為主從對策,也稱為斯塔克爾貝格對策。其主要思想是上級的策略如何通過獎(jiǎng)罰手段以誘導(dǎo)或激勵(lì)下級的行動(dòng),使上下級都能獲得最高的收益。這種模型反應(yīng)了社會(huì)、經(jīng)濟(jì)和管理系統(tǒng)中的層次結(jié)構(gòu),可用于研究宏觀控制政策的制定。對策論的研究內(nèi)容還涉及決策人的合作可能性和由此引起的群體行為,即由小系統(tǒng)相互作用形成大型復(fù)雜系統(tǒng)的宏觀特性的問題。此外,動(dòng)態(tài)對策問題,即微分對策也是對策論的重要研究領(lǐng)域,它的特點(diǎn)是過程信息可不斷反饋回來而用于了解對手的特性,并可據(jù)以采取靈活的反應(yīng)。這給各類對策問題帶來許多新發(fā)展的可能性。在微分對策的研究中,自動(dòng)控制理論的概念和方法發(fā)揮了很大作用?,F(xiàn)代多人決策理論可看作是管理科學(xué)、對策論和自動(dòng)控制理論交叉融合的結(jié)果。
- 參考書目
-
- J.von諾伊曼,摩根斯頓著,王建華、顧瑋琳譯:《競賽論與經(jīng)濟(jì)行為》,科學(xué)出版社,北京,1963。(J.vonNeuman and O.Morgenstern, Theory of games and economic behavier, Princeton Univ.Press,Princeton,1944.)
- G.Owen, Game Theory, Academic Press,New York,1982.
建筑資質(zhì)代辦咨詢熱線:13198516101
標(biāo)簽:對策論
版權(quán)聲明:本文采用知識共享 署名4.0國際許可協(xié)議 [BY-NC-SA] 進(jìn)行授權(quán)
文章名稱:《對策論》
文章鏈接:http://www.kaputelugumatrimony.com/14379.html
該作品系作者結(jié)合建筑標(biāo)準(zhǔn)規(guī)范、政府官網(wǎng)及互聯(lián)網(wǎng)相關(guān)知識整合。如若侵權(quán)請通過投訴通道提交信息,我們將按照規(guī)定及時(shí)處理。
- 用繞線凸輪調(diào)節(jié)機(jī)械剛度的旋轉(zhuǎn)機(jī)…
- 港口工程總承包企業(yè)資質(zhì)轉(zhuǎn)讓哪家…
- 通航建筑物施工三級資質(zhì)轉(zhuǎn)讓哪里…
- 消防工程專業(yè)承包企業(yè)資質(zhì)轉(zhuǎn)讓多…
- 暖氣靠窗戶安裝的原因
- 液壓夯實(shí)機(jī)和強(qiáng)夯機(jī)的區(qū)別,液壓…
- 公路安全施工公司資質(zhì)轉(zhuǎn)讓多少錢
- 機(jī)械行業(yè)工程設(shè)計(jì)公司乙級資質(zhì)轉(zhuǎn)…
- 水利水電工程施工企業(yè)三類人員安…
- 塔吊安全監(jiān)理控制要點(diǎn)