要想在現代社會做一個有文化的人,你必須對博弈論有一個大致的了解。——諾貝爾獎得主保羅·薩繆爾森第一課 不一樣的博弈哈佛的博弈課程先從與博弈相關的幾個話題開始,就如何應對現實中的難題提供一些初步的思路。我們意在指出:類似的情形普遍存在,而且形成了一係列相互關聯的問題,係統地思考這些問題能夠讓大家在處事時取得事半功倍的效果。綁住自己的手在希臘神話中,遙遠的海麵上有一座島嶼,石崖邊居住著吟唱魔歌的海妖塞壬三姐妹。半人半鳥的塞壬姐妹,坐在花叢裏唱著蠱惑人心的歌謠,美妙的歌聲把過往的船隻引向該島,它們撞上礁石便船毀人亡。過往的海員和船隻都受到迷惑走向毀滅,無一幸免。奧德修斯事先得知塞壬那令凡人無法抗拒的致命歌聲,於是命令水手用蠟封住耳朵,並將自己用繩索綁在桅杆上。他還告誡手下,在通過死亡島時不要理會他的任何命令和手勢。在船隻駛經海島的時候,迷人的歌聲如期傳出。那歌聲是如此令人神往,奧德修斯完全沉浸其中,他絕望地掙紮著想要解除束縛,並向水手們叫喊著要求他們駛向塞壬姐妹,但沒人理他。海員們駕駛船隻一直向前,直到最後再也聽不到歌聲才給奧德修斯鬆綁,取出他們耳朵中的蠟。這次塞壬三姐妹白費力氣,算是開了一場免費的演唱會。而且三姐妹中的老大帕耳塞洛珀深深地愛上了奧德修斯,當他的船隻過去之後,她就投海自盡了。奧德修斯的選擇是在和未來的自己對抗。奧德修斯知道,如果他允許未來的自己聽塞壬唱歌,未來的自己就會把船開向礁石。所以,他綁住了自己的手。但生活中,很多人在麵對類似的問題時,通常都任由未來的自己獲勝,因為人們總是最後才行動,不懂得預先做出安排。解決這一問題的方法是,改變對未來自己的激勵,從而改變自己的行為。螞蟻和獅子的策略我們可以用博弈論來研究動物的行為,如果持某種基因的獅子或螞蟻數量壯大了,這並不是說它們選擇了這種策略,隻是說明帶有該基因的獅子或螞蟻能繁衍出很多的後代而已。我們假設博弈主體是一個巨大的種群,種群中所有個體都采用相同的策略s,這是與生俱來的。假設突然間出現了一種變異,有那麽一小部分個體開始采用別的策略,比如是s’。那麽這個采用s’的突變小群體會不斷繁衍還是滅絕呢?如果對於任何可能出現的突變情況,即任何采用s’的突變小群體最後都滅絕了,那麽原始策略s就是進化穩定的,不過前提是它對所有可能的突變都成立。有一點要注意,開始時變異個體很少,因此進行隨機配對的時候,大多數情況下它們是和s進行配對的,偶爾才會遇到別的突變個體。因此大多數情況下我們隻需要研究突變個體在現有種群中的生存狀況即可。假設一群螞蟻與生俱來地選擇策略s,都進行隨機配對。兩隻配對的螞蟻與生俱來地選擇合作,它們各自收益為2(為了便於說明收益情況,我們采用這種用數字代替收益的模式)。從基因的適應性上來說,它們的選擇很好。兩隻螞蟻生出另一隻螞蟻,整個種群中合作型的螞蟻互相配對,就會繁殖出更多的合作型螞蟻。現在再假設突然產生了一個突變個體,這個小小的突變產生了一種不合作的螞蟻。合作型的螞蟻是占大多數的,但現在有一小部分的螞蟻突變後不合作了,采用策略s’。大多數合作型的螞蟻相互配對,大家互利共生。但如果一個突變個體和一個合作型螞蟻隨機配對,接下來會發生什麽呢?對於合作型螞蟻來說這很不幸,它和一隻不太友善的螞蟻進行了配對。假設這隻合作型螞蟻叫尼克,選策略s,不合作型螞蟻拉胡爾選擇策略s’。尼克的收益為0,也就是說它被淘汰了。而拉胡爾的收益是3,這樣就不僅僅隻有一個拉胡爾了,突變個體的數量將增多並繼續配對。每一次配對時,合作型螞蟻中的一部分會跟其他合作型螞蟻配對。但是,有時候合作型螞蟻會和某一個突變個體配對,而且其概率越來越大,這些突變個體的數量會不斷增長。如果合作策略是進化穩定的,那麽突變小群體就會慢慢消失而不產生更多的突變個體。但是現在這種突變個體不但沒有滅絕反而不斷繁衍,在隨機配對中,突變個體的收益更大,這也就意味著突變個體不會滅絕,而將不斷壯大。由此我們可以得出,合作不是進化穩定策略。在這個例子中,我們把基因當作策略,把遺傳適應性當作收益。這裏的重點就是,帶有適合基因的個體會繁衍,帶有不適合基因的個體會滅絕,即好的策略會使種群不斷壯大。我們從中得出的結論就是,自然選擇的進化結果是糟糕而低效的。整體與聯盟的較量一個原始部落共有100個獵人,部落規定:獵人們每天早出晚歸地打獵,並把打到的所有獵物帶回部落,所有獵物在這100個獵人中平均分配。日複一日,年複一年,一直以來都是如此。設想某個年代,其中一個獵人富有政治頭腦,並具有與生俱來的領袖氣質與領導才能。他采用各種方法,拉攏了50個人,組成一個利益集團,並和這50個人協商,要求進行投票以確定每個獵人的打獵技術高低,並以此來確定獵物的分配比例。很自然地,這個集體會以51:49的過半數優勢獲勝。此後,我們不妨假設獵物的95%被51人集團平均分享,那麽剩下的49人分到的獵物自然很少。這個獵人當然不會就此滿足,他仍然會采用同樣的方式來左右投票表決。於是他又組成了26人的小集團,重新分配這90%的獵物。接著不妨假設26人集團分到了85%的獵物。如果那被排擠的25人中膽敢有人表示不滿,這個富有謀略的獵人就可以威脅冒犯者:如果不滿意就通過投票讓他得到的獵物更少(當然也是投票操縱,26人集團當然是支持,而被排擠的剩下的24人被告知說他們可以投票分享這個冒犯者的應得獵物,自然他們也會持支持態度)。在這種情況下,那25個人都將屈服於這種分配方案,結果獵物的絕大部分就被這26人的聯盟分享。以此類推,26人轉化為14人……最終的結果就變成極少數人甚至是這個領導者占有獵物的絕大部分。此時,這個領導者可以把手中的獵物當成誘餌來招募武士保衛其特權和地位,擁有這樣的特權以後,領導者還可以分得更多的獵物,有了更多的獵物就可以招募更多的武士來維護自己的特權。民主中“少數服從多數”的原則最終變成了一個人的大多數,眾人追求的民主最終卻選出了獨裁者。這似乎是天大的諷刺,然而的確是事實。如果投票中的所有人都是理性人,那麽私下協商的存在必然會導致這樣的結果。困擾nba的高薪難題高水平的職業聯賽都需要用優秀的運動員來吸引觀眾,所以盡管全球經濟低迷,但nba球員們的平均年薪依舊能夠達到驚人的530萬美元。而在2010年4月3日與湖人續約三年的科比·布萊恩特,今後三年的薪水總額更是高達令人咋舌的8400萬美元。很多人認為,職業聯賽的本質就是用高薪吸引最優秀的運動員。需要進一步討論的問題是,當能夠以適當的理由給一位運動員支付10萬美元的年薪時,是否意味著沒有適當的理由給他一個年薪數百萬美元的合同?比如,nba曆史上最偉大的球員邁克爾·喬丹,籃球技術登峰造極,但在1993年第一次退役之後打棒球期間,他並未取得如何令人印象深刻的成就。他的籃球專業技術並不能轉換成打棒球的技術,或者其他運動的職業技術。這樣看來,雖然球隊必須用高薪才能吸引某位特定的球員,但讓同一個人成為職業運動員所需的工資並不是太高。如果所有球隊提供的薪水都很低,同樣也能吸引最優秀的隊員,因為這些隊員除了打本專業外不會做其他事。每支球隊在他們的球員的薪水方麵都麵臨著類似的困境。如果其他球隊提供的薪水都非常低,你的球隊支付高薪水就能夠獲得很大的收益,你會得到最優秀的球員,贏得所有聯賽冠軍,而且總有買票支持你們球隊的觀眾。如果其他球隊都提供高薪水,你還是必須提供高薪水,否則,你的隊員就可能是最差的,這樣你們隊的票房收入就會很低。因此,給球員提供高薪水是每個球隊的優勢策略。對球隊來說,不幸的是,它們全部支付高薪水會使它們比隻支付低薪水時情況更糟。職業聯賽委員會明白自身所麵對的困境,並且試圖限製運動員的薪水。比如nba聯盟,各俱樂部已經在執行薪水上限,以限製一個球隊所支付薪水的總量,但這並未能阻止一些財大氣粗的球隊一擲千金。比如,2011年6月剛奪得球隊曆史上首個總冠軍的達拉斯小牛隊的老板馬克·庫班,就是一位瘋狂的球迷兼老板。為了打造豪華之師,他不惜向聯盟繳納巨額奢侈稅。而且對於球員來說,他們會從其球隊所處的薪水困境中受益,因此球員工會也反對設定薪水上限。非合作的選擇四位男士正坐在吧台前喝酒聊天,這時,走進來四位美女和一位絕色美人。四位男士目不轉睛地盯著她們,隨後,其中一個叫納什的男士便跟他另外三個同學解釋,他們該怎樣去追求這些女生。納什說,在正常情況下,四位男士會同時對這個絕色美人展開攻勢。但納什認為,采取這種策略並不聰明,因為如果所有的男士都追求那位絕色美人,他們就會互相牽製,到頭來沒有一個人能如願以償。而如果四位男士被這個絕色美女拒絕後再去找那些姿色稍遜的美女,她們就會因為自己成為別人的第二選擇而惱羞成怒,於是也會把這些男士一腳踢開。因此,納什提議說,為了避免兩頭落空,他們四人應該一起冷落絕色美女,轉而去追求那些姿色稍遜一些的美女。這是奧斯卡獲獎影片《美麗心靈》中的一個情節,那位叫納什的男士即是該片的主人公,他的同名原型是普林斯頓大學的約翰·納什教授——1994年的諾貝爾經濟學獎得主。納什是普林斯頓的數學天才,1950年,他將自己的研究成果寫成題為《非合作博弈》的長篇博士論文。該論文在美國全國科學院每月公報上一經刊登,立即引起轟動。在這篇論文中,納什提出了後來為其帶來巨大聲譽的“非合作博弈均衡的概念”,即後來眾所周知的“納什均衡”。第二課 這,就是博弈我們常常陷入不知該如何選擇的兩難境地,這也好,那也不錯,到底應該如何選擇呢?有些事情錯了可以重新來過,而有的事情一旦決定就無法更改。如何讓自己更有機會遠離後悔的痛苦深淵?你我都需要一種可以讓我們更好地進行選擇的方法——這,就是博弈。策略性的互動決策“所謂博弈,就是策略性的互動決策。”這是2005年因博弈論而獲得諾貝爾經濟學獎的羅伯特·奧曼教授給博弈所下的定義。互動性是博弈的最大特色。無論是下棋、賭博,還是為謀取利益而進行競爭,實質都是在做策略性的互動決策。參與者都不能單純地從自己的意願出發采取行動,還必須充分考慮到其他博弈參與者會采取何種策略,並針對他們可能的策略選擇,選擇最有利於自己的應對策略。博弈的目的就是為了實現自身利益的最大化。為了幫助大家理解博弈及博弈最優策略的選擇,我們用下麵這樣一個小例子加以說明:在風光旖旎的馬爾代夫海灘上,均勻地分布著為數不多的幾位遊客,每個遊客將消費一瓶水。現在假設哈佛大學的兩位經濟學教授來此做賣飲料的小販。如果每個遊客都隻在靠自己最近的那個小販那裏買水,那麽兩位教授將如何布置他們的攤位呢?兩位教授的競爭,就形成了一個簡單的博弈。在這樣一個博弈中,兩位教授其實都明白,自己擺在海灘中點以左或右的任何位置都不是最優選擇,因為對方擺在緊鄰自己的右(左)邊即可獲得超過1/2的遊客消費者,而自己隻能獲得少於1/2的遊客消費者。那麽,隻有將自己的攤位安置在沙灘的正中點,這才是最好的,此時,無論對方緊鄰自己左邊還是右邊,自己始終可以得到1/2的遊客消費者。基於這種考慮,兩位教授無疑都會把攤位緊挨著擺在沙灘的中心點上。在“沙灘賣飲料”的博弈中,兩位哈佛教授的最優策略就是將攤位都布置在海灘的中心點上。由此,我們也可以得出,所謂最優策略,就是無論其他博弈參與者如何選擇,我們做出的策略選擇都是最佳的。通俗來說即是,不管你怎麽做,我所做的都是我能做的策略中最好的。我們在第一章提到了“納什均衡”的概念,其內涵是,給定其他人的選擇之後,沒有人對自己的策略感到後悔。這就意味著一旦達到納什均衡,每個博弈參與者都選擇了自己的最優策略。納什均衡就是所有博弈參與者最優策略的組合。既然在納什均衡狀態下,所有參與人都選擇了自己的最優策略,那麽我們就可以通過判斷博弈參與者的策略是否為各自的最優策略,來確認當前局麵是否已達成納什均衡。這個“沙灘賣飲料”的博弈模型,可以解釋為什麽賣同類物品的商家總是緊挨著布局,還可以用於政治選舉中拉票的分析。關於政治選舉中拉票這一點,我們會在後麵討論“換位思考”時詳細論述。博弈的構成要素2010年公映的英國電影《百夫長》,情節非常簡單,主要就是圍繞一場令人緊張到幾乎忘記呼吸的逃亡與追殺的博弈展開。在這場殊死搏鬥中,博弈雙方除了向我們展示了粗獷、野蠻以及冷酷的敵對氣氛,還為我們異常鮮活地演繹了博弈對局的基本構成要素。一場博弈的基本構成要素主要包括以下三點:1.參與者以昆圖斯·迪亞斯為首逃亡的羅馬戰士,悍女艾泰恩率領的皮克特追殺者。博弈對局存在一個必需的條件,就是要有兩個或兩個以上的參與者,自己跟自己玩不叫博弈。從經濟學的角度來看,如果不存在對手,隻是一個人做決策而不需要考慮他人如何行動,這就是一個傳統的最優化問題,也就是在一個既定的局麵或情況下如何決策的問題。比如氣溫驟降,出門必須多穿衣服,隻要有“氣溫驟降”這樣一種既定情況的存在,你要出門時的最優策略選擇就是多穿衣服,而不用考慮其他人是否多穿衣服。這種隻有你一個人做出決策的情形不能構成博弈。2.策略昆圖斯·迪亞斯通過采取迂回戰術和各種迷惑追蹤者的策略來躲避追殺,追上羅馬軍隊;艾泰恩則通過其神秘的近似獵犬的追蹤本領,總是能夠感應到羅馬人的逃跑路線。如果沒有艾泰恩嗜血般的瘋狂追殺,昆圖斯·迪亞斯率領的幾名羅馬士兵就沒必要在逃跑的過程中千方百計地隱蔽逃跑路線;同樣,如果昆圖斯·迪亞斯等人不知道後邊有追殺者,艾泰恩就沒必要不斷地施展其追蹤技術。雙方如果沒有策略選擇的交鋒,就根本構不成一場博弈。就像四個人坐在牌桌前麵對著一堆牌而不打,那自然無法構成牌局一樣。因此在博弈中,參與者必須“出招兒”,也就是做出策略選擇,直接、實用地針對某一個具體問題采取應對方法。3.收益昆圖斯爭取率領羅馬士兵逃出生天,艾泰恩則要將羅馬人留下做異鄉亡魂。博弈的結果就是雙方的收益。在這場異常血腥的博弈中,艾泰恩率領的追殺者在最後的決戰中全軍覆沒,而羅馬人一方隻有昆圖斯和博特霍什追上了羅馬軍隊。但博特霍什在欣喜若狂之餘被羅馬守城士兵射死,昆圖斯也差點死於意圖掩蓋真相的羅馬高官手中,最後一個人逃了出來。他沒有留在羅馬領地,而是回到了逃亡途中結識且互生情愫的“女巫”那裏。在這場博弈對局中,可以說沒有真正的勝者,因為雙方都未能實現預期的收益。即使殘存的昆圖斯算是僅有的勝利者,他也並沒有得到真正希望的勝利。在參與者自利動機的驅使下,每個人都希望自己在博弈中實現利益最大化。這就是博弈論的第三個基本要素:參與者要有預期收益。就像賭博,每個參與者都希望自己賺得盆滿缽滿,而不是輸得傾家蕩產。在“人都是理性的”這一假定前提下,博弈的參與者都是為了獲取利益而參與博弈,預期將來所獲得利益的大小直接影響到博弈的吸引力和參與者的關注程度。預期收益越大,博弈對參與者的吸引力就越強。在此處必須說明,博弈雖由參與者、策略和收益三個基本要素構成,但並不是說博弈中隻包括這三個要素,可能還會有更多的要素,比如參與者的出招順序、參與者擁有的信息量等,但文中所論述的三個要素,是任何博弈都必備的,因此我們稱這個要素為博弈構成的基本要素。什麽叫做理性一個人跟著一位魔法師來到一座二層樓裏,在進入一層的時候,他發現裏麵有一張長長的大桌子,桌子旁圍坐著一圈人,桌子上擺滿豐盛的佳肴。他們不停地嚐試著去吃到食物,但每次都失敗了,沒有一個人能把美食放進口中,因為大家的手臂受到魔法師詛咒,手肘難以彎曲,隻能空對著滿桌美食,一籌莫展。這時,他聽到樓上傳來了歡笑聲,便好奇地上樓去看個究竟。樓上的場景讓他大吃一驚。二樓同樣也有一群人,他們的手肘也不能彎曲,但是,大家都吃得興高采烈。原來他們每個人都與對麵的人彼此協助,互相喂食,所以每個人都吃得十分盡興。魔法師設定了同樣的博弈環境,然而兩層樓的人們博弈的結果截然不同。這種差別主要源於博弈論的基本假設,這一點在上節我們已經提到,就是所有博弈參與者都是理性的,隻要參與博弈,就是為了實現自己收益的最大化。在博弈中,“所有的人都是理性的”用一個經濟學術語表達叫做“理性經濟人”。所謂“理性經濟人”原本是經濟學的一個基本假設,即假定人都是利己的,而且在麵臨兩種以上選擇時,總會選擇對自己更有利的方案。通俗來說就是大家都是明白人,誰也不比誰更傻,你能想到的別人也想得到,別人能想到的你也能想到。關於經濟學中的“理性”,有幾點需要說明:第一,理性的人一定是自利的。經濟學和博弈論中的自利和社會學中的自私不是一回事。在博弈論中,“自利”是一個中性詞。博弈論假設參與者都是純粹理性的,他們以自身利益最大化為目標。上述故事中的人都有明顯的自利性,麵對滿桌佳肴,他們的共同目標就是盡可能地享用,選擇自顧自的人如此,選擇互相合作的人亦是如此。第二,理性和道德不是一回事。理性選擇的結果是最有可能實現自己的目標,而不一定最合乎道德,理性和道德有時會發生衝突。當然,理性的人也不一定就是不道德的。第三,理性和自由不一定一致。這一點,很多人都深有體會。小孩子對學習感到厭倦,但父母認為隻有好好學習將來才能有出息,於是,家長和孩子之間展開博弈:父母會根據孩子的行動采取各種各樣的激勵方案,孩子也會根據父母的行動尋找對策。文章開始的故事中被下了詛咒的人們,顯然是不自由的,但他們心裏享用美食的欲望仍然是理性的,這一點毫無疑問,這就是理性與自由的悖論。當然,現實並非完全如此,有些理性的選擇和自由的選擇也會達成一致,這是最理想的狀態了。理性人的主要特征就是“目標明確”四個字,博弈的參與者十分清晰、明確地知道自己的目的,並為此進行各種理性的選擇。無處不在的對局博弈論並不僅限於經濟或政治領域,人們的工作和生活,甚至生命的演化,都可以看作是永不停息的博弈決策過程。哈佛大學的博弈論教學,就擯棄了傳統的枯燥數學模型分析,通過關注我們實際生活中的方方麵麵,引領大家自然而然地進入無處不在的博弈對局。人們每天從一早醒來就必須不斷地做決定,日複一日決定早餐要吃什麽;要不要到超市瘋狂采購一番;要不要看場電影、散散步,甚至讀一本書……這些都是小事情,更重大的則比如:報考哈佛還是耶魯,選擇什麽專業,如何選擇伴侶,從事什麽樣的工作,如何開展一項研究,如何打理生意,該與誰合作,做不做兼職,要不要競爭總裁的職位,要不要競選總統……幾乎你能想到的所有人生場景,都會有博弈的參與。在這些決策中,有些是完全由你一人做決定的(比如去不去散步),但決定的空間不可能是完全封閉的。你不可能在一個毫無幹擾的真空世界裏做決定,相反,你的身邊全是和你一樣的決策者,他們的選擇與你的選擇相互作用。這種互動關係自然會對你的思維和行動產生重要的影響,而且別人的選擇和決策直接影響著你的決策結果,這種相互影響你有時甚至覺察不到。時至今日,我們已經很難擺脫這種相互影響了,因為我們都生活在一個聯係緊密的社會中,是一張大網上的一個個結。為了解釋和理解博弈決策的相互影響,我們不妨看看一個石匠的決策和一個拳擊手的決策有什麽區別。當石匠考慮怎樣開鑿石頭的時候,如果地質情況清楚,他不必擔心石頭主動跳起來跟他過不去——他的“對象”原則上是被動和中立的,不會對他表現出策略對抗。然而,當一名拳擊手打算攻擊對手的時候,不僅他的每一招進攻都會招致抵抗,而且他還麵臨對方的主動出擊。在人與人的博弈中,你必須意識到,你的商業對手、未來伴侶乃至你的孩子都是聰明而有主見的人,是關心自己利益的活生生的“明白人”,而不是被動的、中立的角色。一方麵,他們的目標常常與你的目標發生衝突;另一方麵,他們當中包含潛在的合作因素。在你做決定的時候,必須將這些衝突考慮在內,同時注意充分發揮合作因素的作用。博弈論是一種決策的藝術。因為博弈無處不在,為了自己,也為了與他人更好地合作,掌握博弈的策略思維對你無疑是有很大幫助的。正因為如此,著名經濟學家、哈佛大學博士保羅·薩繆爾森說:“要想在現代社會做一個有文化的人,你必須對博弈論有一個大致的了解。”第三課 博弈給我們帶來什麽哈佛博弈課程並非脫離實際的理論講解,它有很強的實用性。掌握博弈論的一些基本原理,你的思維方式也會隨之改變,以前在你看來百思不得其解的問題,或者生活中稀奇古怪的現象,都可以從中找到解答。實現均衡我們在前麵說過,博弈是一種策略性的互動決策,在這一過程中,參與者的決策相互依賴,你選擇什麽樣的策略,取決於其他參與者的策略選擇。哈佛有很多學生體形比較“豐滿”,這大概是他們經常光顧麥當勞或肯德基造成的。這些學生應該都注意到這樣一種現象,麥當勞與肯德基通常會在同一條街上選址,或相隔不到100米的對麵或同街相鄰門麵。而大多數超級市場和購物中心的布局也存在類似現象。照常理來說,同類商家聚集在一起意味著更激烈的競爭,那為什麽他們偏偏喜歡聚合經營,在一個商圈中爭奪市場呢?這樣選址會不會造成資源的巨大浪費?會不會造成各超市或商家利潤的下降呢?聚合選址不可避免地導致更為激烈的競爭,其結果是企業要生存和發展就必須提升自己的競爭力。企業有個性,才有競爭力。以超市為例,在超市經營上要有特色,就要明確市場定位、深入研究消費者的需求,從產品、服務、促銷等多方麵進行改善,樹立起區別於其他門店的品牌形象。如果每一個連鎖超市都能夠做到這一點,就可以發揮互補優勢,形成“磁鐵”效果,這樣不僅能夠維持現有的消費群,而且能夠吸引新的消費者。另外,商業的聚集會產生“規模效應”。一方麵,是所謂的“一站式”消費,豐富的商品種類滿足了消費者降低購物成本的需求,而且同業大量聚集實現了區域差異最小化,為消費者實現比較購物建立了良好基礎;另一方麵,經營者為適應激烈的市場競爭環境,謀求相對競爭優勢,會不斷進行自身調整,在通過競爭提升自己的同時讓普通消費者受益。正因為上麵的幾個原因,像麥當勞、肯德基這種聚合選址能使商家充分發揮自己的優勢,從而促成自身利益最大化,選擇聚合經營也就是商家的占優策略。在這種博弈中,每一方在選擇策略時都沒有“共謀”,他們隻是選擇對自己最有利的策略,而不考慮其他人的利益,然而這種追求自身利益最大化的本能恰好促成了雙方最終實現納什均衡。這就是一種相互依存的博弈,而相互依存的策略就會促成均衡。同一博弈中,所有博弈參與者的策略都有相互依存的關係。每一個博弈參與者從博弈中所得結果不僅取決於自身的策略選擇,同時也取決於其他參與者的策略選擇。均衡可以說是博弈論中最重要的思想之一,但本質並不複雜。我們在前麵章節中已經多次論述了納什均衡的內涵,此處介紹一下一般均衡的概念:在博弈達到均衡時,博弈中的每一個參與者都不可能因為單方麵改變自己的策略而增加收益,於是各方為了自身利益的最大化而選擇某種最優策略,並與其他參與者達成某種暫時的平衡。在外界環境沒有變化的情況下,倘若有關各方堅持原有的利益最大化原則並理性地麵對現實,那麽這種平衡狀況就能夠長期保持穩定。在所有均衡中,納什均衡是一個基礎性的概念。納什均衡是所有參與者最優策略的組合,不一定所有選擇都能實現各人收益的最大化,但能使所有人的收益都達到最大化的均衡狀態。在現實生活中,有相當多的博弈我們無法使用嚴格優勢策略均衡(指不論對方采取何種策略,我們采取此策略總比采取其他任何都好的策略)或重複剔除嚴格劣勢策略均衡的方法找出均衡解。比如在房地產開發中,假定市場需求有限,隻能滿足一定規模的開發量,a、b兩個開發商都想開發這一規模的房地產,而且,每個房地產商必須一次性開發這一規模的房地產才能獲利。在這種情形下,無論對開發商a還是b來說,都既不存在嚴格優勢策略,也不存在嚴格劣勢策略(嚴格劣勢策略是指在博弈中,不論其他人采取什麽策略,某一參與者可能采取策略中對自己嚴格不利的策略)。如果a選擇開發,則b的最優策略是不開發;如果a選擇不開發,則b的最優策略是開發。a與b在做出策略選擇的時候,顯然是相互依存的。研究這類博弈的均衡解,就需要引入納什均衡。在納什均衡中,每個參與者都對自己的策略感到滿意,構成納什均衡的策略一定是重複剔除嚴格劣勢策略過程中不能被剔除的策略。與重複剔除的占優策略均衡一樣,納什均衡不僅要求所有博弈參與者都是理性的,而且要求每個參與者了解所有其他參與者也都是理性的。在占優策略均衡中,不論所有其他參與者選擇什麽策略,一個參與者的占優策略都是他的最優策略。因此,占優策略均衡一定是納什均衡。而在重複剔除的占優策略均衡中,最後剩下的唯一策略組合,一定是在重複剔除嚴格劣勢策略過程中無法被剔除的策略組合。因此,重複剔除的占優策略均衡也一定是納什均衡。需要注意的是,博弈的結果並不都能成為均衡。博弈的均衡是穩定的,因此可以預測。零和博弈在哈佛大學經濟係,流傳著這樣一則著名的笑話:麥克和查爾斯是兩個經濟學家,他們經常在一起交流學術問題。一次,他們邊散步邊討論。麥克看到一堆狗屎,就對查爾斯說:“你吃了這堆狗屎,我給你100萬美元。”查爾斯猶豫了一會兒,但最終還是經不住誘惑吃了那堆狗屎。麥克果然兌現承諾,給了查爾斯100萬美元。走不多遠,查爾斯也看見了一堆狗屎,他對麥克說:“吃了這一堆,我也給你100萬美元。”麥克也是先猶豫,但最終還是倒在了金錢麵前,於是查爾斯又把麥克給他的100萬美元還了回去。故事並未到此為止。走著走著,查爾斯忽然緩過神來了,對麥克說:“不對啊,我們倆誰都沒賺到錢,卻幫環衛工人清理了兩堆狗屎。”麥克也感覺很不對勁,但他辯解說:“我們是都沒賺到錢,但我們創造了200萬美元的gnp!”這則笑話雖是對經濟學家的嘲弄,但它反映了零和博弈的基本道理。在零和博弈中,所有參與者的獲利與虧損之和正好等於零,贏家的利潤來自於輸家的虧損。博弈根據是否可以達成具有約束力的協議分為合作博弈和非合作博弈。合作博弈也稱為正和博弈,采取的是一種合作的方式,或者說是一種妥協,博弈雙方的利益都有所增加,或者至少是一方的利益增加,而另一方的利益不受損害,因而整個社會的利益有所增加。非合作博弈是指參與者不可能達成具有約束力的協議的一種博弈類型,具有一種互不相容的味道,包括負和博弈與零和博弈。零和博弈屬於非合作博弈,參與博弈的各方,在嚴格競爭下,一方的收益必然意味著另一方的損失,博弈各方的收益和損失相加總和永遠為“零”,雙方不存在合作的可能。零和博弈的結果是一方吃掉另一方,一方的所得正是另一方的所失,整個社會的利益並不會因此而增加一分。也可以說,零和博弈中自己的幸福建立在他人的痛苦之上。零和博弈現在廣泛應用於有贏家必有輸家的競爭,“零和遊戲規則”也越來越受到重視,因為人類社會中有許多與“零和遊戲”相似的局麵。如果用一種最簡單的現象來幫助人們理解零和博弈,那就是賭博:賭桌上贏家贏得的錢就是輸家輸掉的。法國作家拉封丹有一則寓言講的就是狐狸和狼之間的零和博弈。一天晚上,狐狸來到水井旁,低頭看到井底的月亮圓圓的,它以為這是塊大奶酪。井邊有兩隻吊桶,人們用來一上一下交替汲水。這隻餓得發昏的狐狸馬上跨進一隻水桶下到井底,另一隻水桶則升到了井麵。到了井底,它才明白水中的圓月是吃不到的,自己已鑄成大錯,處境十分不利,長久下去就隻有等死了。如果沒有另一個饑餓的替死鬼來打這水中月亮的主意,坐井口的另外一隻水桶下來,它就別指望活著回到地麵上了。兩天兩夜過去了,沒有誰光顧水井。沮喪的狐狸正無計可施時,剛好一隻口渴的狼途經此地。此時月亮高掛,狐狸不禁喜上眉梢,它抬起頭跟狼打招呼:“喂,夥計,我免費招待你一頓美餐怎麽樣?你看到這個了嗎?”它指著井底的月亮對狼說:“這可是塊非常美味的幹酪,就算主神朱庇特病了,隻要嚐到這美味可口的食物都會胃口大開。我已吃掉了這奶酪的一半,剩下的這半也夠你吃一頓的了。就委屈你鑽到我特意為你準備好的桶裏下到井裏來吧。”這隻狼果然中了它的奸計。狼下到井裏,它的重量使狐狸升到了井口,這隻被困了兩天的狐狸終於得救了。狐狸上來得救,狼下去受困,得與失相等,這就屬於零和博弈。生活中的遊戲通常都是一場零和博弈,因為遊戲總有輸贏,一方贏了,另一方就是輸了。為什麽在賭場賭博總是輸的多呢?這就是因為賭博是一場零和博弈,而開賭場的老板是要賺錢的,他賺的錢從哪裏來呢?顯然隻能靠賭徒輸錢了。在屬於非合作博弈的零和博弈中,雙方是沒有合作機會的。各博弈方決策時都以自己的最大利益為目標,結果是既無法實現集體的最大利益,也無法實現個體的最大利益。零和博弈是利益對抗程度最高的博弈,甚至可以說是你死我活的博弈。在社會生活的各個方麵都能發現與零和博弈類似的局麵,勝利者的光榮後麵往往隱藏著失敗者的辛酸和苦澀。從個人到國家,從政治到經濟,到處都有零和博弈的影子。比如籃球、拳擊等體育比賽,美國民主、共和兩黨的總統競選等,都屬於零和博弈。非零和博弈電影《美麗心靈》中有這樣一個情節:一個烈日炎炎的下午,約翰·納什教授給學生上課。樓下有幾個工人正施工,機器的轟鳴聲非常刺耳,於是納什走到窗前狠狠地把窗戶關上。馬上有同學提出意見:“教授,請別關窗戶,實在太熱了!”而納什一臉嚴肅地回答:“課堂的安靜比你舒不舒服重要得多!”然後轉過身一邊在嘴裏叨叨著:“給你們來上課,在我看來不但耽誤了你們的時間,也耽誤了我的寶貴時間……”一邊在黑板上寫著數學公式。此時,一位叫阿麗莎的漂亮女同學(她後來成了納什的妻子)走到窗前打開了窗戶,她對窗外的工人說道:“打擾一下,嗨!我們有點小小的問題,關上窗戶,這裏會很熱;開著,卻又太吵。我想能不能請你們先修別的地方,大約45分鍾就好了。”正在幹活的工人愉快地說:“沒問題!”又回頭對自己的夥伴們說:“夥計們,讓我們先休息一下吧!”阿麗莎回過頭來快活地看著納什教授,納什教授也微笑地看著阿麗莎,既像是講課,又像是在評論她的做法地對同學們說:“你們會發現在多變性的微積分中,往往一個難題會有多種解答。”阿麗莎對“開窗難題”的解答,使得原本的零和博弈變成了另外一種結果:同學們既不必忍受密閉室內的高溫,教授也可以在安靜的環境中講課,結果不再是“0”,而成了“2”。由此我們可以看到,很多看似無法調和的矛盾,其實並不一定是你死我活的僵局,那些看似零和博弈或者是負和博弈的問題,也會因為參與者的巧妙設計而轉為正和博弈。這一點無論是在生活中還是工作上都給我們以有益的啟示。非零和博弈既可能是正和博弈,也可能是負和博弈。該理論的代表人物,是哈佛大學企業管理學教授亞當·布蘭登勃格和耶魯大學管理學教授巴裏·奈爾伯夫。他們在合著的《合作競爭》一書中提出,企業經營活動是一種特殊的博弈,是一種可以實現雙贏的非零和博弈。在非零和博弈中,對局各方不再是完全對立的,一個局中人的所得並不一定意味著其他局中人要遭受同樣數量的損失。博弈參與者之間不存在“你之得即我之失”這樣一種簡單的關係,參與者之間可能存在某種共同的利益,能夠實現“雙贏”或者“多贏”,這是正和博弈;與之相對的則是負和博弈,即博弈參與者最終無人獲利,兩敗俱傷。對於正和博弈與負和博弈,可以舉一個簡單的例子加以說明,譬如一對情侶,雙方可能一起得到精神的滿足,這是正和博弈;戀愛中一方受傷的時候,對方並不一定得到滿足,雙方也許都很受傷,這種情況則是負和博弈。負和博弈博弈的理論承認人人都有利己動機,人的一切行為都是為了實現個人利益最大化,但同時,博弈策略的本質在於參與者的決策相互依存,幫助別人有時就是幫助自己,這樣反而更能促成個人收益最大化。市場經濟中,崇尚的道德應該是利己又利他,這兩點並不矛盾。如果市場上每個人都隻為自己,自私自利,甚至損人利己,最終結果還是損害自己,而能夠為別人考慮的往往也會為自己帶來好處。當你從利己的角度出發去幫助別人的時候,就會起到“利己又利他”的效果。反之,為了利己而做傷害別人的事,自己雖然會得一時之益,但從長遠來看,必定得不償失。2009年12月31日,冰島總統格裏姆鬆表示,將推遲簽署議會批準的償付協議——償付在冰島icesave銀行破產中遭受損失的英國及荷蘭儲戶,該協議遭到冰島民眾的普遍反對。議會30日批準的支出計劃遭到普遍的反對,格裏姆鬆稱,正如此前預計,他“今天將不對此做出決定”。3天後,他收到32萬冰島居民中接近4萬人簽署的反對該協議的請願書。如果總統拒絕支持該議案,該問題將訴諸全民投票表決。冰島議會29日晚些時間授權向英國和荷蘭政府支付38億歐元,這些資金中部分用來補償在冰島icesave銀行倒閉中逾32萬個損失儲蓄的儲戶。31日早些時候,評級公司標準普爾曾稱讚冰島議會的決定,並在一份聲明中將冰島的信用等級前景從“負麵”上調至“穩定”。冰島總統格裏姆鬆說,他不會簽署賠償英荷兩國存戶38億歐元存款損失的議案。他說,他將改而讓全民投票,決定是否作出賠償。這引起英國和荷蘭的不滿。荷蘭說,冰島的做法讓人“無法接受”;英國財政部則希望冰島履行其“責任”。英國金融服務部長麥納斯警告,冰島倘若這麽做,不僅將麵臨金融孤立的危險,其通往歐盟的道路也可能受阻。在冰島同英國和荷蘭的這場博弈中,如果冰島真的賴賬,那麽冰島和英荷兩國將陷入雙輸的局麵:英荷兩國儲戶會遭受巨額損失,而冰島則會有受到歐洲其他國家金融孤立的危險,這無疑會讓本來就已風雨飄搖的冰島經濟雪上加霜。如果冰島真的采用這一策略,那麽這就是一場典型的負和博弈,雙方都沒有獲利。正和博弈小溪邊有三處灌木叢,每處灌木叢中都居住著一群蜜蜂。附近的一個農夫總覺得這些灌木叢沒有多大用處,便決定鏟除它們。當農夫動手清除第一處灌木叢的時候,住在裏麵的蜜蜂苦苦地哀求:“善良的主人,看在我們每天為您的農田傳播花粉的情分上,求您放過我們的家吧!”農夫看看這些無用的灌木叢,搖了搖頭說:“沒有你們,別的蜜蜂也會傳播花粉的。”很快,農夫就毀掉了第一群蜜蜂的家。沒過幾天,農夫又來砍第二處灌木叢,從中衝出一大群蜜蜂,對農夫嗡嗡大叫:“殘暴的地主,你要敢毀壞我們的家園,我們絕不會善罷甘休的!”農夫的臉上被蜜蜂蜇了好幾下,他一怒之下,一把火把整個灌木叢燒得幹幹淨淨。當農夫把目標鎖定在第三處灌木叢的時候,蜂王飛了出來,它對農夫柔聲說道:“睿智的投資者啊,請您看看這處灌木叢給您帶來的利益吧!您看看我們的蜂窩,每年我們都能生產出很多的蜂蜜,還有最有營養價值的蜂王漿,這可都能給您帶來不菲的經濟效益啊。如果您把這些灌木叢給除了,您將什麽也得不到,您想想吧!”農夫聽了蜂王的介紹,覺得有道理,於是放下了斧頭,與蜂王合作,做起了經營蜂蜜的生意。在這場人與蜂的博弈中,麵對農夫,三群蜜蜂運用了三種策略——懇求、對抗、合作,隻有第三群蜜蜂保住了自己的家園,農夫也從中獲益匪淺,雙方實現了雙贏。這則寓言告訴我們,如果博弈的結果是“零和”或“負和”,那麽,一方得益就意味著另一方受損或雙方都受損,這些顯然都不是最優結果。人與人之間如果都能爭取合作,把一味利己的競爭博弈變成雙贏的正和博弈,就能使人際關係和個人成長向著更健康的方向發展。雙贏是最佳的合作效果,合作是利益最大化的有效武器。很多情況下,對手並不僅僅是對手,正如矛盾雙方可以轉化一樣,對手也可以變為助手和盟友,微軟公司對蘋果公司慷慨解囊就是一個最好的案例。如同國際關係一樣,商場中也不存在永遠的敵人,利益才是永恒的。皮爾斯和傑夫同時進入美國加利福尼亞州一家電力公司,他們的工作能力不相上下。皮爾斯是電力公司總經理的親屬,而傑夫則毫無後台背景。他們都是部門負責人,但傑夫並沒有因為自己沒有皮爾斯那樣的關係而表現消極。在工作中,傑夫經常與皮爾斯相互協作,完成工作中的難點,互相配合非常默契。皮爾斯也願意同傑夫編在一組,相互促進。在完成11萬伏高壓輸電線路安裝過程中,皮爾斯與傑夫一起晚上看圖紙,安排工序,白天幹活,比預定工期提前1/3完成任務,因此受到表彰。曾經有朋友勸傑夫,皮爾斯本來就有關係,現在你幫他的忙相當於斷了自己的升遷之路。傑夫對朋友說:“第一,我佩服的是皮爾斯的能力和人品,皮爾斯能成功,靠的是自己的實力;第二,如果自己能力不強,即使領導不會看重皮爾斯,自己也不會有什麽出息,我現在也是向他學習本事;第三,一旦皮爾斯升遷,自己與他配合默契,工作起來也順手。”通過相互之間的配合,他們取得了很大的成績。上級通過皮爾斯也認識了傑夫,認為兩個人的能力同樣突出。在皮爾斯被提為安裝公司經理之後,傑夫理所當然地成了副經理。皮爾斯心裏也明白,沒有傑夫的幫助,僅靠自己也不會有這樣突出的成績。不久之後,通過關係,皮爾斯將傑夫調到另一部門擔任正職。這樣,傑夫的路子也寬廣起來。同時,兩個人在兩個部門相互協調,工作就更加好幹了。展示自己的才能,配合他人的工作,在工序流程中能夠獨挑大梁,在團體運作中具有團結精神,都是能夠得到別人賞識的。當然,協助別人工作同給別人當下手不一樣,協助別人要有自己的思想,有自己獨到的見解。沒有獨到的見解,總是像跟屁蟲似的人雲亦雲,幫助別人做打雜的活兒,是永遠成不了氣候的。多次博弈與單次博弈休斯敦火車站廣場邊上的一家小賣店,出售飲料、漢堡包等商品,店門口的一個玻璃櫃子中擺著各種香煙。“我馬上就要上火車了,你在達拉斯車站接我。老板,來包萬寶路。”凱爾打著電話,給店主遞過錢去後,買了一包萬寶路煙匆匆離開。但凱爾突然又回過身來問:“老板,你的煙不會有假吧?”“怎麽可能,這些煙都是從煙草公司進的,正規渠道,怎麽會有假。”“真的嗎?”“你要不要,不要走開!”看到店主凶巴巴的樣子,凱爾苦笑著走向站裏。經常出差或旅行的人,在車站或景點等地購物時,會注意到這些人群流動性很大的地方,不但服務質量差,而且假貨橫行。這是因為在商家和顧客之間存在的是“一次性博弈”。在博弈中,每個參與者在輪到自己決策時,必須思考自己的行動將會給其他博弈參與者以及自己未來的行動造成什麽影響。也就是說,相繼行動的博弈中,每個參與者必須預計其他參與者接下來會有什麽反應,據此盤算自己的最佳策略。但在一次性博弈中,因缺乏強烈的道德與情感因素的約束,參與人僅為自己當前的最大收益而奮鬥。他不太關心自己未來的利益,因為他確信今後自己不會再和對方進行博弈,從而會盡可能地施展所有手段爭取當前利益的最大化。所以,凱爾遇到的那位老板才如此態度惡劣,他賣的萬寶路香煙真假如何,不用猜都知道。假如市場交易都是一次性的,那麽市場上肯定假冒偽劣商品泛濫,因為銷售者出賣假冒偽劣商品可以獲得更多的收益。但生活中更多的是重複性博弈,與一次性博弈完全不同,它遏製了人們的絕對功利性,每一個參與者的行動都必須小心翼翼,因為他們需要為將來考慮。如果有誰在第一次博弈中就耍盡欺詐手段,或者背叛,那麽在未來的博弈中,他將付出代價,顯然采取這種策略對他來說是不明智的。因此,在重複性博弈中,不誠信的情況比較少。我們也可以借用重複博弈的理論來解釋夫妻之間的一些行為。夫妻之間鬧別扭,妻子一般不敢鬧得太過分,丈夫也不會一直記恨在心,因為他們都明白,僅為一時意氣而嚴重傷害對方,最終對雙方都沒有好處。對於夫妻而言,博弈的目的不是為了在分手時能得到更多的“好處”,而是希望能更好地“維持合作的穩定性”,白頭偕老。通常來說,在經曆多次博弈之後,會達到一個納什均衡。在納什均衡點上,每個參與者的策略都是最好的,此時如果任何一個參與者改變策略,他的收益都會降低,任何一個理性的參與者都不會有單獨改變策略的衝動,沒有人願意先改變或主動改變自己的策略。這種相對穩定的結構會一直持續下去,直到博弈的終點。重複博弈可以有效地防止背叛策略的出現,隻要博弈繼續下去,博弈的雙方就不得不考慮自己背叛後對方會采取什麽樣的策略來對付自己。此外,重複博弈還有另外一個作用,它可能無限放大一次性博弈的結果。員工和雇用他的公司就處在重複博弈當中。因此,員工往往會為了將來的利益而抑製自己的背叛行為,公司也同樣會因為希望提高員工的忠誠度而表現出好的姿態,這是一種合作的博弈。將來的博弈,不僅僅是一種防止背叛的手段,也是一種可以寄予希望的手段。當將來存在時,人們會因為考慮長遠而更理性地處理眼前的問題。