彩票网 一定牛彩票网

當前位置:首頁  >  校友之家  >  往事隨想

數 學 讓 你 更 聰 明

                      

                     ------ 例說博弈論

                                     游若云 教授

    1. 概說

    博弈論又稱對策論,是現代數學分支---運籌學的一個組成部分,最初是研究象棋、橋牌與賭博中的勝負問題,現在已經廣泛地應用于經濟學、政治科學與軍事戰略等領域。

    形成一局博弈應有三個要素:(1)一局博弈必有兩個或兩個以上的人參與。(2)局中人可以采取的行動方案,即做出的決策。(3)局中人可以得到的回報。

    博弈論討論的是“理性人”的博弈行為,也就是說,在一局博弈中,局中人都會選擇最佳決策,使自己取得最大回報,而不關心別人的得失。那么什么是非理性人的博弈行為?我們說一個笑話吧。某天,某甲遇到了傳說中的神明能人,能人對他說,你許個愿吧,想得到什么,都可以滿足你,條件是以你所得的雙倍給予你的鄰居。甲大喜,這回要發財啦!但轉念一想,不對呀,這白白地讓鄰居撿了個便宜,而且比自己所得還要多,無論如何不能讓這種事情發生。于是考慮良久,無奈地對能人說:你把我打個半死吧!這里,甲的決策由感情因素所支配,不是理性人的博弈行為,不屬博弈論的研討范圍。

    請注意,這里所說的“理性人”,乃是博弈論中的術語,是博弈論研討的對象,不應以一般道德標準來評論。

    為了說明作為理性人的博弈決策,我們來分析一個有名的案例----海盜分寶石。

    話說有五個海盜搶到100顆寶石,每顆大小一樣,價格相同,都價值連城。在討論分贓時,誰都想得到最多,經爭論商得如下辦法:先抽簽決定排名順序,之后,由第1號海盜提出分配方案,如果得到半數或以上的人同意,則按此方案進行分配,否則,方案作廢,同時1號海盜出局,取消分配資格。接著由 2號海盜提出方案,如此類推。

    那么,1號海盜將會提出怎樣的分配方案,讓自己獲得最大利益?如果平分,各得20顆寶石,那么1號海盜并沒有比其他人獲得更多的寶石,這是平庸的方案,對1號海盜來說并非最佳決策。分析這類問題,一般先從最簡單的情況開始,假定前三個海盜均已出局,僅剩下4號與5號兩個海盜,這時4號海盜無論提出怎樣的方案,都能通過,4號海盜將獨得全部100顆寶石,而5號海盜一顆也沒有。當然,5號海盜最不愿意看到出現這種情況。因此,3號海盜的方案只要對5號海盜有一點好處,定能得到5號海盜的支持。于是,3號海盜的最佳方案是,自己得99顆寶石,5號海盜得1顆 ,而不給4號海盜。同理,4號海盜最不愿意看到出現這種情況。因此,2號海盜的方案只要對4號海盜有一點好處,定能得到4號海盜的支持。于是,2號海盜的最佳方案是,自己得99顆寶石,4號海盜得1顆,不給3號與5號海盜?,F在,我們知道了1號海盜的最佳方案應該是,自己得98顆寶石,3號與5號海盜各得1顆寶石,而不給2號與4號海盜。

    1號海盜的分配方案,初看出乎意外,依直覺似不可信,但據嚴格的邏輯推理,不容置疑,這個方案確是1號海盜的最佳決策!

    當然,在這一局博弈中,假定每個海盜都屬“理性人”,都只考慮自己的利益,而且都明白博弈策略。

     2.序貫博弈

    大家都熟悉田忌賽馬的故事,說的是,齊國大將田忌與齊威王賽馬,約定各選上、中、下三個等級的馬各一匹,依等次比賽快慢,定出勝負。結果每次比賽田忌皆輸。好友孫臏獻策,以下馬對彼上馬,上馬對彼中馬,中馬對彼下馬,結果田忌以21勝了齊威王。

    這個故事說明,當知道了對手如何出招之后,做出對自己有利的決策,這是田忌獲勝的關鍵所在。因此,順序很重要,對博弈的勝負起關鍵作用。這類博弈稱為序貫博弈。

    如果齊威王也不依約定出招,那么情況會是怎樣呢?分析如下:

    每方各有上、中、下三匹馬,每次任選一匹馬參賽,賽三次,所選馬匹不得重復,共有9個可能得勝結果。假定每次比賽,勝者得1分,負者得0分。那么,齊威王的上馬全無敵,可得3分,齊威王的中馬可勝田忌的中馬與下馬,可得2分,齊威王的下馬可勝田忌的下馬,可得1分。反觀田忌,上馬可得2分,中馬可得1分,而下馬皆輸,得0分。因此,如果雙方同時隨意出招,那么9個可能得勝結果中,齊威王占有6個,得勝率為6/9=2/3,而田忌則只有3/9=1/3的取勝機會。

    雙方同時做出決策的博弈,稱為同時博弈。 由上所述,對于同時博弈,田忌還是處于劣勢

    3.一次性博弈與重復博弈

    先說一個實例。大家熟知李嘉誠是臺灣大富豪,人們好奇他發家致富的奧秘何在?有一天,有位記者采訪李澤楷,問:你的父親李嘉誠究竟教會了你怎樣的賺錢秘訣?李澤楷回答說:父親叮囑過,你和別人合作,假如你拿7分合理,8分也說得過去,那么我們李家拿6分就可以了。

    噢,原來如此,少拿2分,就是奧秘之所在了。其實這個奧秘也簡單,與人合作,讓利2分,合作者自然多起來,一旦生意興隆通四海,自然財源茂盛達三江了,這就是生意場上常說的薄利多銷的道理。在博弈論中我們稱之為重復博弈的決策。相反,如果只是一次性博弈,那么決策者就會采取最高利益為原則,李家就應該拿8分了。

    歷史上有孔融讓梨的故事,暫且不說倫理道德的教育問題,從重復博弈的觀點來看,孔融取小梨乃是聰明的最佳決策。每一位旅游者可能都有過同樣的經歷,在旅游點的購物,常常上當受騙。一是,旅游點的生意人,采取的是一次性博弈行為,當然以獲取最高利益為原則。二是,信息不對稱,賣方熟知自己商品的真偽與價格,而買方卻不知情或所知甚少。因此,作為旅游者的策略應該是不在旅游點購物為最佳。當然,這會損害導游小姐的利益,但,作為理性人就顧不及這些了。

    4.零和博弈

    在一個賭局中,莊家為一方,賭客為另一方,莊家所贏,必是賭客所輸,反之亦然。如果贏為正值,輸為負值,那么輸贏之和為零,這正是零和博弈的意思。

    在一局零和博弈中,一方的收益恰是對方的付出。如一局對弈,若非和局,必是一勝一負,因而,雙方的決策都只有一個目標,擒拿對方老帥,置對方于死地。因此,零和博弈屬于非合作博弈。

    歷史上劉項之爭就屬零和博弈,項羽不聽亞父范增的建言,在鴻門宴上放過劉邦,實乃下策,終于導致失敗,自刎烏江。諸葛亮七擒孟獲,同樣是“放”策略,但屬上策,因為諸葛與孟之爭屬正和博弈,在這樣博弈中有可能雙贏,史實表明諸葛亮的策略取得了成功。甲因財產問題與乙打官司,甲贏,獲得這份財產,乙輸失去這份財產,看似零和博弈,但甲方要支付不菲的律師費用,因此,甲得(為正值)與乙失(為負值)之和為負,這是一局負和博弈。當然,如果將律師也算作博弈的局中人,甲與律師聯手為一方,乙為另一方,那么得失之和仍為零,又是一局零和博弈了。

     零和博弈之所以廣受關注,主要是因為人們發現社會的方方面面都與零和博弈有類似的局面。房地產開發商得到土地發財了,農民失去土地貧困了;工業生產發展了,自然資源減少了;一將功成萬骨枯;勝利者的光榮背后往往隱藏著失敗者的辛酸和苦澀。從個人到國家,從政治到經濟,似乎無不驗證了世界正是一個巨大的零和博弈場。

    20世紀以來,人類在經歷了兩次世界大戰、經濟的高速增長、科技進步、全球一體化以及日益嚴重的環境污染之后,人們開始認識到,雖然在競爭的社會中,也應力爭利己而不損人;發展經濟而不損害環境;自己勝出而不讓對方受到傷害;等等。也就是說,零和博弈的觀念正逐漸被正和博弈(雙贏)觀念所取代。觀念的轉變意味著社會的文明與進步。當然,要最終達到從零和走向正和,迎來皆大歡喜的雙贏結局,這需要各方真誠有效的合作,否則,雙贏的局面就不會出現,吃虧的還是局中人自己。大家都知道,國共之爭是一局零和博弈,重慶談判原希望從零和走向正和,但缺乏真誠而有效的合作,最終失敗,沒有出現雙贏的局面,其損害在幾十后的今天仍在延續!

     下面,我們引用電影《美麗心靈》中的一個情節,來解讀怎樣從零和走向正和?!睹利愋撵`》是一部改編自同名傳記而獲得奧斯卡金像獎的電影。影片講述的就是因對博弈論做出重大貢獻而獲1994年諾貝爾經濟學獎的數學家約翰·福布斯·納什的故事。電影于2001年在美國上映。

     電影中有這樣的一段情節:在一個烈日炎炎的下午,約翰·納什教授正在上課,教室窗外有幾個工人正在施工,機器的響聲成了刺耳的噪音,于是納什走到窗前狠狠地把窗戶關上。馬上有同學提出意見:“教授,請別關窗子,實在太熱了!”而納什教授一臉嚴肅地回答說:“課堂的安靜比你舒不舒服重要得多!”然后轉過身一邊嘴里叨叨著“給你們來上課,在我看來不但耽誤了你們的時間,也耽誤了我的寶貴時間……”,一邊在黑板上寫著數學公式。正當此時,一位叫阿麗莎的漂亮女學生(后來成了納什的妻子)走到窗邊打開了窗子,電影中納什用責備的眼神看著阿麗莎:“小姐……”,而阿麗莎對窗外的工人說道:“打擾一下,嗨!我們有點小小的問題,關上窗戶,這里會很熱;開著,卻又太吵。我想能不能請你們先修別的地方,大約45分鐘就好了?!闭诟苫畹墓と擞淇斓卣f:“沒問題!”,又回頭對自己的伙伴們說:“伙計們,讓我們先休息一下吧!”阿麗莎回過頭來快活地看著納什教授,納什教授也微笑地看著阿麗莎,既像是講課,又像是在評論她的做法似地對同學們說:“你們會發現在多元微積分中,往往一個難題會有多種解答?!?span>

  這里,阿麗莎對“開窗難題”的解答,使得原本的零和博弈變成了雙贏的結果:同學們既不必忍受室內的高溫,教授也可以在安靜的環境中講課,結果不再是0,而成了+2。由此我們可以看到,很多看似無法調和的矛盾,其實并不一定是你死我活的僵局,那些看似零和博弈或者是負和博弈的問題,也會因為參與者的巧妙設計而轉為正和博弈。正如納什教授所說:“多元微積分中,往往一個難題會有多種解答?!边@一點無論是在生活中還是工作上;無論是平民百姓還是政府官員都能從中得到有益的啟示。

      5.納什均衡

    在上一段我們提到了約翰.納什的名字,也提到由于他對博弈論的重大貢獻,獲得1994年諾貝爾經濟學獎。以他名字命名的納什均衡,就是他的最有影響也最為杰出的貢獻。

    納什均衡簡單地說就是,一個策略組合中,所有的參與者面臨這樣的一種情況,當其他人不改變策略時,他此時的策略是最好的,每一個理性的參與者都不會有單獨改變策略的沖動,這時,這一策略組合達到了均衡。

    下面來分析一個典型的例子---囚徒困境。

囚徒困境說的是,警方拘捕兩個同案犯罪嫌疑犯甲與乙,在隔離審問時,甲、乙所面臨的認罪策略選擇的問題。警方將政策分別告訴他們:

(1).如果一方坦白,另一方抵賴,則坦白者從寬,判刑1個月,而抵賴者從嚴得坐牢10年。

    (2).如果雙方都坦白,各判坐牢5年。

(3).如果雙方都抵賴,則以妨礙公務罪各判坐牢1年。

    現在擺在甲、乙面前的選擇無非兩種:坦白或抵賴(不坦白)。甲想,當自己選擇抵賴時,若乙坦白,則被判刑10年,若乙也抵賴,則判1年;當自己選擇坦白時,若乙也坦白,則獲刑5年,若乙抵賴,則只有1個月的刑期。前者坐牢或10年或1年,而后者坐牢或5年或1個月,兩相比較,選擇坦白應是甲的最佳策略。同樣,對乙來說也是選擇坦白為最佳策略。這樣甲與乙的最佳策略組合(坦白,坦白),就是這局非合作博弈的納什均衡。

    我們注意到,選擇“坦白”雖然分別是兩人的最佳決策,但不是他們兩人共同的最佳策略。如果兩人有機會串供(合作)的話,他們將都會選擇抵賴,這樣只需坐牢1年,而不是5年了。因此,囚徒困境反映了一個很深刻的問題,雖然對個人而言是理性的選擇,但對整體而言卻不是理性的,揭示了個人理性與集體理性的矛盾。

    納什均衡的提出讓我們看到,在個人理性與集體理性的沖突的情況下,各人追求利己行為而導致的最終結局是一個“納什均衡”,也即對所有人都不利的結局。同時,也告誡我們合作才真正是有利的“利己策略”,才是獲得雙贏局面一條途徑。下面我們來分析幾個例子。

    價格博弈:設有產家甲與乙,為推銷相同的產品展開了價格戰。這時甲與乙雙方都會采取低價格策略,于是其結局是一個“納什均衡”。受益者是消費者,而產家則誰都沒有撈到好處。所以,價格戰都是短命的,絕無可能持久進行?! ?span>

    污染博弈:如果政府沒有嚴格的環境管制,所有企業都會從利己的目的出發,采取不顧環境的策略,從而進入“納什均衡”狀態。這時,如果有某個企業投資治理污染,而其他企業仍然不顧環境污染,那么這個企業的生產成本就會增加,價格就要提高,它的產品就沒有競爭力,甚至企業還要破產。直到20世紀90年代中期,中國鄉鎮企業的盲目發展造成嚴重污染的情況就是如此。只有在政府加強污染管制時,企業才會采取低污染的策略。當所有企業都采取低污染的策略時,仍有可能獲得與高污染同樣的利潤,但環境將更好了。

  關稅博弈:任何一個國家在國際貿易中都面臨著保持貿易自由與實行貿易保護主義的兩難選擇,甲國試圖對乙國進行進口貿易限制,會采取提高關稅的策略,乙國必然會進行反擊,也提高關稅,這也是一個“納什均衡”。這個均衡是貿易雙方采取不合作博弈的策略,結果雙方誰也沒有撈到好處。反之,如果甲與乙合作,從互惠互利的原則出發,雙方都減少關稅限制,結果大家都從貿易自由中獲得了最大利益。

    6. 低效用區的決策陷阱

    我們說過,博弈的局中人都是“理性”的,作為理性人的決策都是讓自己獲得最大利益,但實際情況往往并非如此,這就出現了所謂的“低效用區的決策陷阱”。

    比如說,彩票的發行者早就算好了彩票命中率與命中所得相乘,大大地低于購買彩票者的付出,這樣,彩票發行者定將獲得高額回報。對于這樣的局面,購買彩票就要承擔極高的損失的風險,不買彩票則沒有風險。作為理性人的最佳策略應該是不買彩票,但還是有眾多的人去購買各式各樣的彩票,而且屢敗屢買,樂此不疲。為什么?因為,每次購買彩票的付出只是少量金額,損失不很明顯,而寄托的希望卻是很大,在這個因素的驅使下,做出了非理性的決策,這就是低效用區的決策陷阱。彩票發行者正是利用了這個陷阱而發了大財!

    當走進賭場時便會看到一排排老虎機,許多人都喜歡上去碰碰運氣。其實,老虎機的性質與彩票一樣,一臺老虎機也就是一種彩票,只是命中與否立即分曉,更能滿足投注者的急切心理。精明的賭客常常選擇久未出現命中較大金額的老虎機,這樣命中的機會也許稍大些,但對賭場老板來說無所謂,只要這臺老虎機有人玩下去,老板永遠是贏家!

     7.“沉沒成本”的泥沼

     “沉沒成本”的意思是說,在正式完成交易之前投入的成本,如時間、金錢、精力等,如果交易失敗將無法收回。在繼續進行博弈決策時,如果對沉沒成本過分眷戀,就可能會陷入沉沒成本的泥沼,造成更大的損失。

    賭徒常常會因翻本(沉沒成本)而繼續賭博,結果必定越陷越深,直到傾家蕩產,甚至負債累累。

    在日常生活中,也往往發生類似的情況。媽媽為兒子買了一臺鋼琴,但兒子對鋼琴沒有興趣,拒絕學習,使鋼琴閑置著。一日,友人向媽媽建議,是否請一位鋼琴家庭教師?媽媽想,既然鋼琴都買了,那就請個家庭教師吧。但兒子不會因有家庭教師而對鋼琴發生興趣,還會繼續拒絕學習。這里,媽媽做出請家庭教師的決策時,已買鋼琴(沉沒成本)起了重要作用。于是,繼續第一次投資(買鋼琴)的錯誤,造成了更大的損失。

    在《三國演義》中,有一段這樣的情節:東吳為了討回被劉備“借去”的荊州,大都督周瑜設計以假招親誘捕劉備,被諸葛亮識破。劉備在諸葛亮的精心安排下,親赴東吳,將計就計娶到了孫權的妹妹,史稱孫夫人。目的達到后,自然要攜帶戰利品(孫夫人)離開東吳返回荊州,但周瑜心有不甘,率領水軍截殺而來,結果又中埋伏,損兵折將,大敗而歸。這就是歷史上“周郎妙計安天下,賠了夫人又折兵”的故事。

    在這一局博弈中,假招親的計謀失敗后,周瑜理應醒悟,諸葛亮已經洞察一切,劉備的返回自然也在其策劃之中,因不甘心而貿然率兵截殺,實乃下策,不但挽回不了已經付出的“沉沒成本”,包括聲譽、財力、精力以及孫夫人在內,而是重蹈覆轍,再一次中了諸葛亮的計謀。

    上世紀60年代,英、法兩國政府聯合投資開發大型超音速客機——協和飛機。項目開展不久,發現費用昂貴,超乎預計,是否適合市場需求也無把握,但之前的投資巨大,不忍犧牲,最終還是增加投資,協和飛機終于研制成功。但因耗油大,噪音大,污染嚴重,營運成本高等原因,不合市場需求而淘汰,兩國政府蒙受巨大損失。號稱發達國家,不乏智囊精英,也不免受“沉沒成本”的誘惑而陷入泥沼,成為博弈論教材的一個著名案例----“協和謬誤”。

    在博弈論中有個鱷魚法則,說的是:當發現自己的行動背離了既定的方向,必須立即停止時,就要果斷地做出決策,不得存有任何僥幸心理,而延誤時期,造成更大損失。好比被鱷魚咬住了一只手,就要有壯士斷臂的氣概,犧牲這只手。如果想用另一只手去挽救,那么失去的將是一雙手了。上述諸例說明,理解這個法則容易,但實踐這個法則卻是很難很難??!

     8. 共同知識

    共同知識是指在一局博弈中,每個局中人不僅知道這個事實,而且還知道其他局中人都知道這個事實,這樣,“這個事實”就成為所有局中人的共同知識。共同知識的獲取與利用對博弈決策至關重要。下面我們來分析一個例子。

    設有4名學生,教師給每人頭上戴一頂帽子。帽子只有紅與白兩種顏色,每個學生可以看到其他人帽子的顏色,但不知道自己頭上帽子是什么顏色。

    現在教師問:你們之中至少有一人戴的是紅色的帽子,你們知道自己頭上帽子的顏色嗎?

    4個學生望了一下別人頭上的帽子,都回答:不知道。

    分析:這個回答表明沒有一個學生看到三頂白帽子,否則就知道自己頭上是紅帽子了。由此推得他們之中至少有兩人戴的是紅帽子。這是一個新的共同知識,而比教師給的第一個共同知識“至少有一頂紅帽子”進了一步。

    教師再次問:現在你們知道自己頭上帽子的顏色嗎?

    4個學生互望一下,又都回答:不知道。

    分析:第二次回答不知道之后,4個學生又都明白了,沒有一個人看到兩頂白帽子,否則,此人就知道自己頭上是紅帽子了。于是,他們之中至少有三頂紅帽子。這又是他們的共同知識,而且是依據前一個共同知識做出判斷而得到的,同時,又比前一個共同知識進了一步。

    教師第三次問:現在你們知道自己頭上帽子是什么顏色嗎?

    4個學生都回答:不知道。但緊接著又都回答:知道了,是紅色的。

   分析:因為在聽到所有人都回答“不知道”時,他們頓悟了,沒有一個人看到白帽子,否則,此人就知道自己戴的是紅帽子了。所以他們頭上戴的都是紅帽子。

    在這個例子中,從教師的第一次問話,與學生的每一次回答,都給4個學生增添新的共同知識,而且,每一次獲得的共同知識都成為下一次決策的依據。這是一個層層相依、步步推進的認知過程。至于共同知識的獲取,當然要靠每一位局中人的智慧與判斷能力了。

     9.結束語

    博弈論的成熟發展雖然只有幾十年的歷史,但現在已是一株枝繁葉茂的大樹,并且廣泛地應用于社會的方方面面。本文只挑選其中的幾個部分,通俗而簡明地解說博弈論的思想方法,希望不論是熟悉或不熟悉數學的朋友,都能從中獲得受益。

      人生本來就是一局又一局的博弈組成,每一局博弈的決策都關乎成敗得失,增加一點博弈的常識,也許在下一局博弈中,有助你做出更佳決策,贏得更好的結局!

      參考文獻:圖解博弈論 李志新編著 中央編譯出版社20103月第一版

            

 

 

附言王晶昕曾是我的學生,我們雖師生亦朋友,學術上常有切磋。他生前曾閱讀本文,提出許多有益建言,特別對孫臏違規取勝,并不認同。這屬道德問題,本文未直接評說,而是從數學方面說明,如果齊威王同樣不按比賽規則出招,田忌獲勝的機率只是1/3。對處于劣勢的田忌,孫臏的辦法是不顧誠信、違背事先約定的比賽規則而取勝。這種行為,在競賽場上是不允許的,因此,不應贊揚,不宜仿效。這正是王晶昕的意思。正當他的忌日周年,特發本文,以表悼念。

<thead id="nvfzr"><span id="nvfzr"></span></thead>
<del id="nvfzr"><noframes id="nvfzr"><del id="nvfzr"></del><cite id="nvfzr"><th id="nvfzr"></th></cite>
<ins id="nvfzr"><noframes id="nvfzr"><cite id="nvfzr"></cite>
<ins id="nvfzr"><noframes id="nvfzr"><cite id="nvfzr"></cite><var id="nvfzr"><span id="nvfzr"></span></var>
<cite id="nvfzr"><noframes id="nvfzr"><cite id="nvfzr"></cite><ins id="nvfzr"><noframes id="nvfzr">
<ins id="nvfzr"><noframes id="nvfzr"><cite id="nvfzr"></cite>
<var id="nvfzr"><noframes id="nvfzr">
<del id="nvfzr"><noframes id="nvfzr"><del id="nvfzr"></del>
<ins id="nvfzr"></ins>
<var id="nvfzr"><noframes id="nvfzr"><ins id="nvfzr"><noframes id="nvfzr"><cite id="nvfzr"></cite><var id="nvfzr"><span id="nvfzr"><menuitem id="nvfzr"></menuitem></span></var><ins id="nvfzr"></ins>
<cite id="nvfzr"><span id="nvfzr"></span></cite>
<del id="nvfzr"><noframes id="nvfzr"><del id="nvfzr"></del><del id="nvfzr"><noframes id="nvfzr">
<ins id="nvfzr"><span id="nvfzr"></span></ins><ins id="nvfzr"></ins><ins id="nvfzr"><noframes id="nvfzr"><var id="nvfzr"><noframes id="nvfzr">
彩票网 一定牛彩票网