-
- 素材大。
- 403.5 KB
- 素材授權(quán):
- 免費下載
- 素材格式:
- .ppt
- 素材上傳:
- chenrong
- 上傳時間:
- 2018-08-23
- 素材編號:
- 208125
- 素材類別:
- 課件PPT
-
素材預(yù)覽
這是博弈論的基本概念ppt,包括了博弈的基本概念,納什均衡,納什均衡應(yīng)用,混合策略和混合策略納什均衡等內(nèi)容,歡迎點擊下載。
博弈論的基本概念ppt是由紅軟PPT免費下載網(wǎng)推薦的一款課件PPT類型的PowerPoint.
經(jīng)濟(jì)博弈論方法第四部分
第六章 完全信息靜態(tài)博弈
博弈的基本概念
納什均衡
納什均衡應(yīng)用
混合策略和混合策略納什均衡
伐木工人的決策和一個將軍的決策有什么不同?
木頭沒有反抗。
將軍的每一步計劃都會引來抵抗,他必須克服這種抵抗。
你!你的對手、競爭者都是聰明有主見的!
社會科學(xué)研究策略性決策制定過程的分支稱為- 博弈論。
嚴(yán)格講,博弈論不是經(jīng)濟(jì)學(xué)的一個分支,它是一種方法,涉及到很多領(lǐng)域:
實際上,博弈論是數(shù)學(xué)的一個分支。
策略故事
妙手傳奇
給貓拴個鈴鐺
多管齊下
三思而后行
引言
博弈論
諾貝爾經(jīng)濟(jì)學(xué)獎
納什(Nash) (1950-1951)
澤爾騰(selten) (1965,1975)
海薩尼(Harsanyi) (1967-1968)
共同獲得1994年諾貝爾經(jīng)濟(jì)學(xué)獎
數(shù)學(xué)界的梵高——“瘋子天才”納什
三位大師主要的貢獻(xiàn)
1950年和1951年納什的兩篇關(guān)于非合作博弈論的重要論文,徹底改變了人們對競爭和市場的看法。他證明了非合作博弈及其均衡解,并證明了均衡解的存在性,即著名的納什均衡。從而揭示了博弈均衡與經(jīng)濟(jì)均衡的內(nèi)在聯(lián)系。因為在現(xiàn)實世界中,非合作博弈要比合作博弈普遍得多。
Selten and Harsanyi
澤爾騰(1965)將納什均衡的概念引入了動態(tài)分析,提出了“精煉納什均衡”概念;以及進(jìn)一步刻畫不完全信息動態(tài)博弈的“完備貝葉斯納什均衡”。
而海薩尼則發(fā)展了刻畫不完全信息靜態(tài)博弈的“貝葉斯納什均衡”(1967-1968)。總之,他倆進(jìn)一步將納什均衡動態(tài)化,加入了接近實際的不完全信息條件。他們的工作為后人繼續(xù)發(fā)展博弈論,提供了基本思路和模型 。
諾貝爾經(jīng)濟(jì)學(xué)獎
1968年,瑞典中央銀行成立300周年,是為了紀(jì)念諾貝爾獎獎金提供者,設(shè)立諾貝爾經(jīng)濟(jì)學(xué)獎。
1969年開始頒發(fā)。
從游戲到博弈
游戲的特點:下棋,打牌,賭勝,田徑,球類等等,共同的特點是
策略 策略的好壞決定游戲的結(jié)果
游戲的特征:規(guī)則,結(jié)果,策略,策略和利益的依存性
什么是博弈論?
博弈論:就是關(guān)于包含相互依存情況中理性行為的研究。
相互依存 :通常是指博弈中的任何一個局中人受到其他局中人的行為的影響,反過來,他的行為也影響到其他局中人。
相互依存的另一個方面是局中人可以有某些共同的興趣或利益所在。
“理性行為”的說明:博弈論中的所謂理性,一般不是指道德標(biāo)準(zhǔn)。
博弈三要素
博弈方(局中人)----參與博弈但利益不完全一致者。有二人博弈與多人博弈之分。
策略集----每個局中人都會有一系列的策略可選,稱為對應(yīng)于每個局中人的策略集。有限和無限個對策。
得益----在每策略組合下每一局中人的得益情況,是選擇策略的標(biāo)準(zhǔn),稱為得益函數(shù)或支付函數(shù)。
博弈的關(guān)鍵
局中人理性地采取或選擇自己的策略行為,在相互制約相互影響的依存關(guān)系中,盡可能的提高自己的利益所得,這樣,博弈論就是關(guān)于包含相互依存情況中理性行為的研究。
相互依存 理性行為
博弈的四種分類情況
完全信息靜態(tài)博弈
完全信息動態(tài)博弈
不完全信息靜態(tài)博弈
不完全信息動態(tài)博弈
博弈的分類及對應(yīng)的均衡
納什均衡
納什均衡的定義
納什均衡的一致預(yù)測性
納什均衡與嚴(yán)格下策反復(fù)消去法
納什均衡的定義
各博弈方都不愿或不會單獨改變自己策略的策略組合,只要這種策略組合存在且是唯一的,博弈就有絕對確定的解。這種各博弈方都不愿單獨改變策略的策略組合就是博弈論中最重要的一個概念——“納什均衡”。
我們常用G表示一個博弈; 如G有n個博弈方,每個博弈方的全部可選策略的集合我們稱策略空間,分別用 表示; 用 表示博弈方i的第j個策略,其中j可取有限個值(有限策略博弈),也可取無限個值(無限策略博弈);博弈方i的得益則用 表示, 是各博弈方策略的多元函數(shù)。n個博弈方的博弈G常寫成
定義
在博弈 中,如果由各個博弈方的各一個策略組成的某個策略組合 中,任一博弈方i的策略 ,都是對其余博弈方策略的組合
的最佳策略,即
對任意 都成立,則稱 為G
的一個“納什均衡”。
納什均衡的一致預(yù)測性
如果所有博弈方預(yù)測到一個特定的納什均衡將會出現(xiàn),那么,沒有人有興趣作不同的選擇。
納什均衡的特征:博弈方預(yù)測到均衡,博弈方預(yù)測到其他博弈方預(yù)測到均衡,等等。
一致性預(yù)測,并不意味著納什均衡一定是一個好的預(yù)測。
納什均衡應(yīng)用
囚徒困境說明了什么
在(坦白、坦白)這個組合中,A和B都不能通過單方面的改變行動增加自己的收益,于是誰也沒有動力游離這個組合,因此這個組合是納什均衡,也叫非合作均衡。
囚徒困境反映了個人理性和集體理性的矛盾。如果A和B都選擇不坦白,各判刑1年,顯然比都選擇坦白各判刑8年好得多。當(dāng)然,A和B可以在被警察抓到之前訂立一個“攻守同盟”,但是這可能不會有用,因為它不構(gòu)成納什均衡,沒有人有積極性遵守這個協(xié)定,顯然最好的策略是雙方都不坦白。
囚徒困境的意義
“囚徒的兩難選擇”有著廣泛而深刻的意義。個人理性與集體理性的沖突,各人追求利己行為而導(dǎo)致的最終結(jié)局是一個“納什均衡”,也是對所有人都不利的結(jié)局。他們兩人都是在坦白與不坦白策略上首先想到自己,這樣他們必然要服長的刑期。只有當(dāng)他們都首先替對方著想時,或者相互合謀(串供)時,才可以得到最短時間的監(jiān)禁的結(jié)果。
雙寡頭削價競爭
對經(jīng)典經(jīng)濟(jì)學(xué)的沖擊
“納什均衡”首先對亞當(dāng)·斯密的“看不見的手”的原理提出挑戰(zhàn)。按照斯密的理論,在市場經(jīng)濟(jì)中,每一個人都從利己的目的出發(fā),而最終全社會達(dá)到利他的效果。
《國富論》:“通過追求(個人的)自身利益,他常常會比其實際上想做的那樣更有效地促進(jìn)社會利益。”
從“納什均衡”我們引出了“看不見的手”的原理的一個悖論:從利己目的出發(fā),結(jié)果損人不利己,既不利己也不利他。兩個囚徒的命運(yùn)就是如此。從這個意義上說,“納什均衡”提出的悖論實際上動搖了西方經(jīng)濟(jì)學(xué)的基石。
研究囚徒困境問題的目的
利用這種困境達(dá)到有利于社會的目的
政府在經(jīng)濟(jì)活動中的組織協(xié)調(diào)工作的必要性
避免囚徒困境
混合策略納什均衡
許多現(xiàn)實中決策問題構(gòu)成的博弈中根本不存在具有穩(wěn)定性的各博弈方都接受的納什均衡策略組合如猜硬幣博弈和齊威王田忌賽馬,而另一些博弈卻有多于一個的納什均衡策略組合,如夫妻之爭博弈。這兩類博弈如果只進(jìn)行一次,實際結(jié)果如何確實取決于機(jī)會和運(yùn)氣,如果多次獨立反復(fù)進(jìn)行這些博弈,這樣博弈方?jīng)Q策的好壞就會從平均得益上反映出來,策略運(yùn)用得當(dāng)平均收益會較理想,至少是不吃虧,否則平均得益就會很差。
概念的引進(jìn)
在這種博弈中各博弈方?jīng)Q策的第一個原則:自己的策略選擇千萬不能預(yù)先被另一方偵知或猜到。
這就是說博弈方必須隨機(jī)地選擇策略。
其次,在本博弈中,如果蓋硬幣方雖然是隨機(jī)決定出正面還是反面,但如果在總體上出正面多于出反面,即出正面的概率大于出反面的概率,則猜硬幣方還是有機(jī)可乘。
設(shè)蓋硬幣方出正面的概率為p,則出反面的概率為1-p.出正面多于出反面,即p>1-p或p>1/2。在這種情況下,如猜硬幣方全猜正面,則他的期望得益:
即平均來講,猜硬幣方一定是贏多輸少。
雙方都按照上述概率隨機(jī)選擇策略,即在本博弈中,博弈方的決策內(nèi)容不是確定性的具體的策略,而是在一些策略中隨機(jī)選擇的概率分布,這樣的決策我們稱為“混合策略”。
定義
在博弈 中;博弈方i的策略空間為 ,則博棄方i以概率分布 隨機(jī)在其k個可選策略中選擇的“策略”,稱為一個“混合策略”,其中 都成立,
且
相對于這種以一定概率分布在一些策略中隨機(jī)選擇的混合策略,確定性的具體的策略我們稱為“純策略”,而我們原來意義上的納什均衡,即任何博弈方都不愿單獨改變策略的純策略組成的策略組合現(xiàn)在可稱為“純策略納什均衡”。當(dāng)然,純策略也可以看作混合策略的特例。
純策略可以看作,選擇相應(yīng)純策略的概率為1,選擇其余純策略的概率為0的混合策略。混合策略可以看作純策略的擴(kuò)展。
引進(jìn)了混合策略的概念以后,我們可將納什均衡的概念擴(kuò)大到包括混合策略的情況。對各博弈方的一個策略組合,不管它是純策略組成的還是混合策略組成的,只要滿足各博弈方都不會想要單獨偏離它,我們就稱之為一個納什均衡。如果確實是一個嚴(yán)格意義上的混合策略組合構(gòu)成的納什均衡,稱為“混合策略納什均衡”。
猜硬幣博弈中兩博弈方都以(1/2,1/2)的概率分布隨機(jī)選擇正面和反面的混合策略組合,就是一個混合策略納什均衡。
期望得益:
零和博弈!
應(yīng)用例子
本博弈中兩博弈方?jīng)Q策的第一個原則是不能讓對方知道或猜到自己的選擇,因而必須在決策時利用隨機(jī)性。第二個原則是他們選擇每種策略的概率一定要恰好使對方無機(jī)可乘。
設(shè)博弈方1選A的概率為pA,選B的概率為pB,博棄方2選C的概率為pC,選D的概率為pD。根據(jù)上述第二個原則,博弈方1選A和B的概率,一定要使博弈方2選C的期望得益和選D的期望得益相等,即:
這是博弈方1的混合策略。
同理,博弈方2的混合策略為
博弈方1以(0.8,0.2)的概率隨機(jī)選擇A和B,博弈方2以(0.8,0.2)的概率隨機(jī)選擇C和D,由于這時誰都無法通過改變自己的混合策略(概率 分布)而改善自己的得益(期望得益)、因此這樣的混合策略組合是穩(wěn)定的,是一個混合策略納什均衡。
該混合策略納什均衡的期望結(jié)果(即雙方的期望得益)分別為:
雖然單獨一次博弈的結(jié)果可能是四組得益中的任何一組.但是多次獨立重復(fù)博弈的平均結(jié)果卻應(yīng)該是雙方各得2.6。
混合策略和混合策略均衡的概念不僅可用在不存在純策略納什均衡的博弈問題中(這種問題各博弈方之間的利益總是有一定的對立性),在沒有確定性結(jié)果的博弈、即存在多個純策略納什均衡的博弈(這種博弈中博弈方之間的利益有相當(dāng)?shù)囊恢滦?中也可運(yùn)用。
第七章 完全信息動態(tài)博弈
完全且完美信息動態(tài)博弈
子博弈完美納什均衡
應(yīng)用舉例
動態(tài)博弈的表示法和特點
階段和表示法
動態(tài)博弈的基本特點
階段
動態(tài)博弈中一個博弈方的一次行為稱為一個“階段”。由于每個博弈方在動態(tài)博弈中可能不止一次行為,因此,每個博弈方在一個動態(tài)博弈中就可能有數(shù)個甚至許多個博弈階段。
擴(kuò)展形表示法
動態(tài)博弈的基本特點
動態(tài)博弈的策略
動態(tài)博弈的策略取決于他們整個博弈過程中的行為,因此我們主要討論的是各博弈方在這些動態(tài)博弈中決策的全部內(nèi)容,即各博弈方在每次輪到行為時,針對每種可能的情況如何選擇的完整的行動計劃,我們將這種行動計劃稱為博弈方的“策略”。
劉備過江招親(三個錦囊+親自過江)
動態(tài)博弈的結(jié)果
雙方(或多方)采用的策略組合,實現(xiàn)的博弈路徑和各博弈方的得益。
動態(tài)博弈的非對稱性
因為博弈方的選擇行為有先后次序,后行為者可能觀察到前面的選擇行為,各博弈方的地位是不對稱的。
可信性問題
動態(tài)博弈的一個中心問題是“可信性”問題。所謂可信性是指動態(tài)博弈中先行為的博弈方是否該相信后行為的博弈方會采取對自已有利的或不利的行為。因為后行為方將來會采取對先行為方有利的行為相當(dāng)于一種“許諾”,而將來會采取對先行為方不利的行為相當(dāng)于一種“威脅”,因此我們可將可信性分為“許諾的可信性”和“威脅的可信性”。
開金礦博弈
乙如何決策呢?
乙最需要關(guān)心的就是甲采到金子后是否會履行諾言跟自己平分,因為萬一甲采到金子后不但不跟乙平分,而且還賴帳或卷款潛逃,則乙連自己的本錢都收不回來。
關(guān)鍵的是要判斷甲的許諾是否可信!
以自身利益最大化原則,甲必然選擇不分!
乙清楚甲的行為準(zhǔn)則,最好的選擇是不借!
對乙來說,甲的許諾是不可信的!
增加對甲的約束
加上第三階段,乙的利益受到法律保護(hù),甲的許諾是可信的。
法律保障不足的開金礦博弈
結(jié)論
從本博弈的分析可以看出,在一個個體都有私心,都只注重自身的利益的社會里,完善公正的法律制度不淡能夠保障社會的公平,還能提高社會經(jīng)濟(jì)活動的效率,是實現(xiàn)最有效率的社會分工的重要保障。
可信性是動態(tài)博弈分析的一個中心問題。
打擊的威脅是可信的
打擊的威脅是不可信的
子博弈完美納什均衡
動態(tài)博弈中的子博弈
逆推歸納法
子博弈完美納什均衡
動態(tài)博弈中的子博弈
虛線框出的部分正是博弈方2在博弈方1選擇進(jìn)時所面臨的決策問題,它本身構(gòu)成博弈方2的一個單人博弈,我們稱它為原先來后到博弈的一個“子博弈”。
子博弈定義
由一個動態(tài)博弈第一階段以外的某個階段開始的后續(xù)博弈階段構(gòu)成,它必須有初始信息集,具備進(jìn)行博弈所需要的各種信息,能夠自成一個博弈的原博弈的一部分,稱為原動態(tài)博弈的一個“子博弈”。
遞推歸納法
從動態(tài)博弈的最后一個階段博弈方的行為開始分析,逐步倒推回前一個階段相應(yīng)博弈方的行為選擇,一直到第一個階段的分析方法。
博弈方2選擇打擊,博弈方選擇不進(jìn)
應(yīng)用
我們用上述兩個簡單的例子演示了逆推歸納法。逆推歸納法可以用于許多動態(tài)博弈的分析求解,除了有些不完美信息動態(tài)博弈以外,是解析動態(tài)博弈的基本方法。
子博弈完美納什均衡
上面用逆推歸納法導(dǎo)出的動態(tài)博弈的結(jié)果是由各階段輪到行 為的博弈方的一種行為依次構(gòu)成的,如在開金礦3.2中結(jié)果為 (借,分),是由乙在第一階段的借和甲在第二階段的分構(gòu)成。當(dāng)然該博弈本來應(yīng)該有三個階段,但當(dāng)甲在第二階段選擇分時第三階段就沒有必要進(jìn)行下去了因此結(jié)果中只有兩個階段的行為。
我們需要的適合動態(tài)博弈的新的均衡概念必須滿足(1)既是納什均衡,從而具有策略穩(wěn)定性,(2)又不能包含任何的不會信守的許諾或威脅。這樣的動態(tài)博弈的策略組合稱為“子博弈完美納什均衡”。
塞爾頓(selten)1965年給出了子博弈完美納什均衡的定義:
如果動態(tài)博弈中各博弈方的策略在動態(tài)博弈本身和所有子博弈中都構(gòu)成一個納什均衡,則稱該策略組合為一個“子博弈完美納什均衡”。
“子博弈完美納什均衡”是分析動態(tài)博弈,或者說完全且完美信息動態(tài)博弈的關(guān)鍵概念。而逆推歸納法正是(至少在完美信息動態(tài)博弈范圍之內(nèi))尋找動態(tài)博弈的子博弈完美納什均衡的基本方法。
子博弈完美納什均衡能夠排除均衡策略中不可信的威脅或許諾,就意味著每階段各博弈方的選擇都是按最大利益原則決策的,因此在每個子博弈中都只可能采用納什均衡的策略或行為選擇。
討價還價博弈
假設(shè)有兩人就如何分割1萬元進(jìn)行談判,并且已經(jīng)定下了這樣的規(guī)則:首先由甲提出一個分割比例,對此,乙可以接受也可以拒絕;如果乙拒絕甲的方案,則他自己應(yīng)提出另一個方案,讓甲選擇接受與否。如此循環(huán)。在上述循環(huán)過程中,只要有任何一方接受對方的方案博弈就告結(jié)束,而如果方案被拒絕,則被拒絕的方案就與以后的討價還價過程不再有關(guān)系。
由于談判費用和利息損失等,雙方的得益都要打一次折扣,折扣率為 ,我們稱它為消耗系數(shù)。如果限制討價還價最多只能進(jìn)行三個階段,到第三階段乙必須接受甲的方案,則這就是一個三階段的討價還價博弈。
本博弈有兩個關(guān)鍵點,第一是第三階段甲的方案是有強(qiáng)制力的,即進(jìn)行到這一階段,甲提出的分割S:(10 000-S)是雙方必須接受的,并且對這一點兩博弈方都非常清楚。第二是多進(jìn)行一個階段總得益就會減少一個比例,因此對雙方來說都是讓談判拖得太長是不利的,必須讓對方得的數(shù)額,不如早點讓他得到,免得自己的得益每況愈下。
第八章 不完全信息靜態(tài)博弈
靜態(tài)貝葉斯博弈和貝葉斯納什均衡
應(yīng)用舉例
不完全信息古諾模型
靜態(tài)貝葉斯博弈
海薩尼轉(zhuǎn)換
混合策略和不完全信息
第八章 不完全信息動態(tài)博弈
完美貝葉斯均衡定義
信號博弈的完美貝葉斯均衡
應(yīng)用舉例三角函數(shù)的概念PPT:這是三角函數(shù)的概念PPT,包括了學(xué)習(xí)目標(biāo),教學(xué)過程,鞏固練習(xí),教學(xué)過程,歸納小結(jié),作業(yè)布置等內(nèi)容,歡迎點擊下載。
三角函數(shù)角的概念PPT:這是三角函數(shù)角的概念PPT,包括了角的基本概念,任意角的三角函數(shù),典型例題,課后練習(xí)等內(nèi)容,歡迎點擊下載。
概念設(shè)計方案ppt:這是概念設(shè)計方案ppt,包括了概念文化背景,硬裝概念設(shè)計,盥洗室創(chuàng)意設(shè)計,音樂室創(chuàng)意設(shè)計,醫(yī)務(wù)保健室創(chuàng)意設(shè)計,軟裝綜合概念設(shè)計等內(nèi)容,歡迎點擊下載。