30天让你精通博弈学-第1部分
按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
什么是博弈 ?
从囚徒困境说起
… 页面 2…
田忌赛马的故事在中国妇孺 皆知,说的是战国时期齐威
王和大将 田忌赛马,参赛的马被分成上中下三等,齐王的马
在每一等级上都比田忌的马好。齐王原本是稳操胜券的,但
军师孙膑给 田忌出了个主意,要 田忌用下等马输给齐王的上
等马,然后用上等马和中等马分别赢了齐王的中等马和下等
马,三局两胜,最后是处在劣势的田忌赢了齐威王。这中间
包含的道理就是 “博弈论”。
博弈论又称对策论,是研究两人或多人之间竞争合作关
系的一门科学,它使用严谨的数学模型来解决现实生活中的
各种冲突问题。
博弈论 由美国数学家约翰 冯 诺伊曼 (
创立,并与经济学家奥斯卡 摩根斯坦合作于 年发表
弈论与经济行为》,把博弈论引入了经济领域。人们都把
冯 诺伊曼和摩根斯坦的这部巨著看做是现代博弈理论诞生
的标志 。冯 诺伊曼是当代最伟大的数学家,是现代计算机
科学和数理经济学特别是博弈论的奠基人。可惜,这位天才
… 页面 3…
的学者在 年 岁的时候就英年早逝,无缘 年开始
每年颁发的经济学诺贝尔奖。
年,数学家塔克任斯坦福大学客座教授,在给一些
心理学家做讲演时,他用两个囚犯的故事,将当时专家们正
研究的一类博弈论问题,做了形象化的解释。从此以后,类
似的博弈问题便有了一个专 门名称 “囚徒 困境 ”。借着 这
个故事和名称, “囚徒困境”广为人知,在哲学、伦理学、社
会学、政治学、经济学乃至生物学等学科中,获得了极为广
泛的应用。
所谓的 “囚徒困境”,大意是这样的:甲、乙两个人一起
携枪准备作案,被警察发现抓了起来。警方怀疑,这两个人
可能还犯有其他重罪,但没有证据 。于是分别进行审讯,为
了分化瓦解对方,警方告诉他们,如果主动坦 白,可以减轻
处罚;顽抗到底,一旦同伙招供,就要受到严惩。当然,如
果两人都坦 白,那么所谓 “主动交代”就不那么值钱了,在
这种情况下,两人还是要受到严惩,只不过比一人顽抗到底
要轻一些。在这种情形下,两个囚犯都可以作出自己的选择:
或者供出他的同伙,即与警察合作,从而背叛他的同伙;或
者保持沉默,也就是与他的同伙合作,而不是与警察合作。
这样就会出现 以下几种情况 (为了更清楚地说明问题,我们
给每种情况设定具体刑期):
如果两人都不坦 白,警察会 以非法携带枪支罪而将二人
各判刑 年 ;
… 页面 4…
如果其中一人招供而另一人不招,坦 白者作为证人将不
会被起诉,另一人将会被重判 年 ;
如果两人都招供,则两人都会因罪名各判 年 。
这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?
从表面上看,他们应该互相合作,保持沉默,因为这样他们
俩都能得到最好的结果 只判刑 年。但他们不得不仔细
考虑对方可能采取什么选择。问题就这样开始了,甲、乙两
个人都十分精明,而且都只关心减少 自己的刑期,并不在乎
对方被判多少年(人都是有私心的)。
甲会这样推理:假如乙不招,我只要一招供,马上可以
获得 自由,而不招却要坐牢 年,显然招比不招好;假如乙
招 了,我若不招 ,则要坐牢 年,招了只坐 年 ,显然还
是以招认为好。无论乙招与不招,我的最佳选择都是招认。
还是招了吧。
自然,乙也同样精明,也会如此推理。于是两人都作出
招供的选择,这对他们两个人来说都是最佳的,即最符合他
们个体理性的选择。照博弈论的说法,这是本 问题的唯一平
衡点。只有在这一点上,任何一人单方面改变选择,他只会
得到较差的结果。而在别的点,比如两人都拒认的场合,都
有一人可以通过单方面改变选择,来减少 自己的刑期。
也就是说,对方背叛,你也背叛将会更好些。这意味着,
无论对方如何行动,如果你认为对方将合作,你背叛能得到
更多;如果你认为对方将背叛,你背叛也能得到更多。你背
… 页面 5…
叛总是好的。这是一个有些让人寒心的结论。
为什么聪明的囚犯,却无法得到最好的结果?两个人都
招供,对两个人而言并不是集体最优的选择。无论对哪个人
来说,两个人都不招供,要比两个人都招供好得多。
“囚徒 困境 ”这个
问题为我们探讨合作 两人下棋 ,甲出子的时候,为了
赢棋 ,得仔细考虑乙的想法,而乙出
是怎样形成的,提供
子时也得考虑 甲的想法 ,所以甲还得
了极为形象的解说方
想到乙在想他的想法 ,乙当然也知道
式,产生不 良结局 的
甲想到了他在想 甲的想法。
原因是 因为囚犯二人
都基于 自私的角度开
始考虑,这最终导致合作没有产生。
如果你处于这个困境中,你将如何做呢?设想你认为对
方将合作,你可以选合作,那么你将得到 “对双方合作的奖
励”。当然,你也可以选背叛,得到 “对双方背叛的惩罚”。
换言之,如果你认为对方合作,那么你背叛将能得到更
多的好处。反过来,如果你认为对方将背叛,那么你也有两
个选择,你选择合作,那么你就是 “笨蛋”;你选择背叛,就
会得到 “对双方背叛的惩罚”。因此,对方背叛,你也背叛将
会更好些。这就是说,无论对方如何行动,你背叛总是好的。
到现在为止,你似乎知道该怎样做;但是,要知道相同的逻
辑对另一个人也同样适用。
因此,另一个人也将背叛而不管你如何做。这样,你们
… 页面 6…
将是双方背叛,只能一起坐牢很久,这比你们双方合作所能
得到的 “奖励” (只需短期服刑)差很多。个体的理性导致双
方得到的比可能得到的少,这就是 “困境”。
说到这里,你可能对博弈论有一个基本的了解,那么下
面我再简单讲讲博弈论的基本知识。
博弈论最基本的分类有两个:
一种分类方式是按照博弈各方是否同时决策,分为静态
博弈和动态博弈,同时决策或者同时行动的叫做静态博弈,
决策或行动有先后次序的叫做动态博弈。这里要注意的是,
即使决策或行动有先后,但是只要局中人在决策时都还不知
道对手的决策是什么,也算静态博弈。这是很容易理解的。
比方说工程招标,截止 日期是 月 日,那么尽管有些投标
者在四月上旬就投了标,有些到 月下旬才投标,虽然本来
决策时间有先后,但效果与同时决策并无二致。这里,我们
当然排斥标书泄密这样违规的事情。
另一种分类方式是按照大家是否都清楚各种对局情况下
每个局中人的得益,分为完全信息博弈和不完全信息博弈。
我们 已经讲过的所有博弈,都是完全信息博弈,因为博弈矩
阵已经把各种对局情况下每个局中人的得益写得非常清楚。
博弈论把完全信息这种情况,概括为 “各种对局情况下每个
局中人的得益多少,是所有局中人都清楚的”。
静态和动态、完全信息与不完全信息,组合起来一共有
四大类博弈。现在世界各国的经济学教育,基本上都只是在
… 页面 7…
研究生水平才讲博弈论,典型的研究生博弈论教材就包括这
四类博弈: )完全信息静态博弈; 完全信息动态博弈;
不完全信息静态博弈; 不完全信息动态博弈。这四类
博弈一个比一个精彩,也一个比一个难。
… 页面 8…
另外一个类似囚徒困境的经典博弈案例是哈佛大学 巴罗
教授提出的著名的 “旅行者困境”:
两个旅行者从一个以出产细瓷花瓶著称的地方旅行回来,
他们都买了花瓶。提取行李的时候,发现花瓶被摔坏了,于
是他们 向航空公司索赔。航空公 知道花瓶的价格大概在八
九十元的价位浮动,但是不知道两位旅客买的时候的确切价
格是多少。于是,航空公司请两位旅客在 元以内自己写
下花瓶的价格。如果两人写的一样,航空公司将认为他们讲
真话,就按照他们写的数额赔偿;如果两人写的不一样,航
空公司就认定写得低的旅客讲的是真话,并 原则 照这个
低的价格赔偿,同时,航空公司对讲真话的旅客奖励 元钱,
对讲假话的旅客罚款 元 。
就为了获取最大赔偿而言,本来 甲乙双方最好的策略,
就是都写 元,这样两人都能够获赔 元。可是不,甲
很聪 明,他想 :如果我少写 元变成 元,而 乙会写
元 ,这样我将得到 元 。何乐而不为?所 以他准备写
… 页面 9…
元 。
可是乙更加聪明,他算计到甲要算计他写 元,于是他
准备写 元。想不到甲还要更聪明一个层次,估计到乙要写
元来坑他,于是他准备写 元……大家知道,下象棋的
时候,不是说要多 “看”几步吗, “看”得越远,胜算越大。
你多看两步,我比你更强多看三步,你多看四步,我比
你更老谋深算多看五步。在花瓶索赔的例子中,如果两个人
都 “彻底理性”,都能看透十几步甚至几十步上百步,那么上
面那样 “精明比赛”的结果,最后落到每个人都只写一两元
的地步。事实上,在彻底理性的假设之下,这个博弈唯一的
纳什均衡,是两人都写 。
巴罗教授提出这个案例 旨在警世:一方面,它有启示人
们在为私利考虑的时候不要太 “精明”,告诫人们精明不等于
高明,太精明往往会坏事;另一方面,它对于理性行为假设
的适用性提出了警告。
… 页面 10…
有了这个假设,我们就可以按照这个明确的比较取舍标
准