30天让你精通博弈学-第1部分

小说： 30天让你精通博弈学字数：每页4000字

按键盘上方向键 ← 或 → 可快速上下翻页，按键盘上的 Enter 键可回到本书目录页，按键盘上方向键 ↑ 可回到本页顶部！
————未阅读完？加入书签已便下次继续阅读！

　　　　　　　　　　　　　　　什么是博弈　？　

从囚徒困境说起　

…　页面　2…

　　　　　　田忌赛马的故事在中国妇孺　皆知，说的是战国时期齐威　

王和大将　田忌赛马，参赛的马被分成上中下三等，齐王的马　

在每一等级上都比田忌的马好。齐王原本是稳操胜券的，但　

军师孙膑给　田忌出了个主意，要　田忌用下等马输给齐王的上　

等马，然后用上等马和中等马分别赢了齐王的中等马和下等　

马，三局两胜，最后是处在劣势的田忌赢了齐威王。这中间　

包含的道理就是　“博弈论”。　

　　　　　　博弈论又称对策论，是研究两人或多人之间竞争合作关　

系的一门科学，它使用严谨的数学模型来解决现实生活中的　

各种冲突问题。　

　　　　　　博弈论　由美国数学家约翰　　　　　　　　　　　　　　　　　　　　　　　　冯　　　　　诺伊曼　　（　

创立，并与经济学家奥斯卡　　　　　　　　　　　　　　　　　　　　　　　　　　　　摩根斯坦合作于　　　　　　　　　　　　　　　　　　　　　　年发表　

　　　　　弈论与经济行为》，把博弈论引入了经济领域。人们都把　

冯　　　　　诺伊曼和摩根斯坦的这部巨著看做是现代博弈理论诞生　

　的标志　。冯　　　　　　　　　　　诺伊曼是当代最伟大的数学家，是现代计算机　

科学和数理经济学特别是博弈论的奠基人。可惜，这位天才　

…　页面　3…

的学者在　　　　　　　　　　　　　　　年　　　　　　岁的时候就英年早逝，无缘　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　年开始　

每年颁发的经济学诺贝尔奖。　

　　　　　　　　　　　　年，数学家塔克任斯坦福大学客座教授，在给一些　

心理学家做讲演时，他用两个囚犯的故事，将当时专家们正　

研究的一类博弈论问题，做了形象化的解释。从此以后，类　

似的博弈问题便有了一个专　门名称　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　“囚徒　困境　”。借着　这　

个故事和名称，　“囚徒困境”广为人知，在哲学、伦理学、社　

会学、政治学、经济学乃至生物学等学科中，获得了极为广　

泛的应用。　

　　　　　　所谓的　“囚徒困境”，大意是这样的：甲、乙两个人一起　

携枪准备作案，被警察发现抓了起来。警方怀疑，这两个人　

可能还犯有其他重罪，但没有证据　。于是分别进行审讯，为　

了分化瓦解对方，警方告诉他们，如果主动坦　白，可以减轻　

处罚；顽抗到底，一旦同伙招供，就要受到严惩。当然，如　

果两人都坦　白，那么所谓　“主动交代”就不那么值钱了，在　

这种情况下，两人还是要受到严惩，只不过比一人顽抗到底　

要轻一些。在这种情形下，两个囚犯都可以作出自己的选择：　

或者供出他的同伙，即与警察合作，从而背叛他的同伙；或　

者保持沉默，也就是与他的同伙合作，而不是与警察合作。　

这样就会出现　以下几种情况　　（为了更清楚地说明问题，我们　

给每种情况设定具体刑期）：　

　　　　　　如果两人都不坦　白，警察会　以非法携带枪支罪而将二人　

各判刑　　　　　　　　　年　；　

…　页面　4…

　　　　　　如果其中一人招供而另一人不招，坦　白者作为证人将不　

会被起诉，另一人将会被重判　　　　　　　　　　　　　　　　　　　　　　　　　　　　　年　；　

　　　　　　如果两人都招供，则两人都会因罪名各判　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　年　。　

　　　　　　这两个囚犯该怎么办呢？是选择互相合作还是互相背叛？　

从表面上看，他们应该互相合作，保持沉默，因为这样他们　

俩都能得到最好的结果　　　　　　　　　　　　　　　　　　　　　　　　　　只判刑　　　　　　　　　年。但他们不得不仔细　

考虑对方可能采取什么选择。问题就这样开始了，甲、乙两　

个人都十分精明，而且都只关心减少　自己的刑期，并不在乎　

对方被判多少年（人都是有私心的）。　

　　　　　　甲会这样推理：假如乙不招，我只要一招供，马上可以　

获得　自由，而不招却要坐牢　　　　　　　　　　　　　　　　　　　　　　　　　　年，显然招比不招好；假如乙　

招　了，我若不招　，则要坐牢　　　　　　　　　　　　　　　　　　　　　　　　　　年，招了只坐　　　　　　　　　　　　　　　　　年　，显然还　

是以招认为好。无论乙招与不招，我的最佳选择都是招认。　

还是招了吧。　

　　　　　　自然，乙也同样精明，也会如此推理。于是两人都作出　

招供的选择，这对他们两个人来说都是最佳的，即最符合他　

们个体理性的选择。照博弈论的说法，这是本　问题的唯一平　

衡点。只有在这一点上，任何一人单方面改变选择，他只会　

得到较差的结果。而在别的点，比如两人都拒认的场合，都　

有一人可以通过单方面改变选择，来减少　自己的刑期。　

　　　　　　也就是说，对方背叛，你也背叛将会更好些。这意味着，　

无论对方如何行动，如果你认为对方将合作，你背叛能得到　

更多；如果你认为对方将背叛，你背叛也能得到更多。你背　

…　页面　5…

叛总是好的。这是一个有些让人寒心的结论。　

　　　　　　为什么聪明的囚犯，却无法得到最好的结果？两个人都　

招供，对两个人而言并不是集体最优的选择。无论对哪个人　

来说，两个人都不招供，要比两个人都招供好得多。　

　　　　　“囚徒　困境　”这个　

问题为我们探讨合作　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　两人下棋　，甲出子的时候，为了　

　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　赢棋　，得仔细考虑乙的想法，而乙出　

是怎样形成的，提供　

　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　子时也得考虑　甲的想法　，所以甲还得　

了极为形象的解说方　

　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　想到乙在想他的想法　，乙当然也知道　

式，产生不　良结局　的　

　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　甲想到了他在想　甲的想法。　

原因是　因为囚犯二人　

都基于　自私的角度开　

始考虑，这最终导致合作没有产生。　

　　　　　　如果你处于这个困境中，你将如何做呢？设想你认为对　

方将合作，你可以选合作，那么你将得到　“对双方合作的奖　

励”。当然，你也可以选背叛，得到　“对双方背叛的惩罚”。　

　　　　　　换言之，如果你认为对方合作，那么你背叛将能得到更　

多的好处。反过来，如果你认为对方将背叛，那么你也有两　

个选择，你选择合作，那么你就是　“笨蛋”；你选择背叛，就　

会得到　“对双方背叛的惩罚”。因此，对方背叛，你也背叛将　

会更好些。这就是说，无论对方如何行动，你背叛总是好的。　

到现在为止，你似乎知道该怎样做；但是，要知道相同的逻　

辑对另一个人也同样适用。　

　　　　　　　因此，另一个人也将背叛而不管你如何做。这样，你们　

…　页面　6…

将是双方背叛，只能一起坐牢很久，这比你们双方合作所能　

得到的　“奖励”　（只需短期服刑）差很多。个体的理性导致双　

方得到的比可能得到的少，这就是　“困境”。　

　　　　　　说到这里，你可能对博弈论有一个基本的了解，那么下　

面我再简单讲讲博弈论的基本知识。　

　　　　　　博弈论最基本的分类有两个：　

　　　　　　一种分类方式是按照博弈各方是否同时决策，分为静态　

博弈和动态博弈，同时决策或者同时行动的叫做静态博弈，　

决策或行动有先后次序的叫做动态博弈。这里要注意的是，　

即使决策或行动有先后，但是只要局中人在决策时都还不知　

道对手的决策是什么，也算静态博弈。这是很容易理解的。　

比方说工程招标，截止　日期是　　　　　　　　　　　　　　　　　　　　　　　　　　　　月　　　　　　日，那么尽管有些投标　

者在四月上旬就投了标，有些到　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　月下旬才投标，虽然本来　

决策时间有先后，但效果与同时决策并无二致。这里，我们　

当然排斥标书泄密这样违规的事情。　

　　　　　　另一种分类方式是按照大家是否都清楚各种对局情况下　

每个局中人的得益，分为完全信息博弈和不完全信息博弈。　

我们　已经讲过的所有博弈，都是完全信息博弈，因为博弈矩　

阵已经把各种对局情况下每个局中人的得益写得非常清楚。　

博弈论把完全信息这种情况，概括为　“各种对局情况下每个　

局中人的得益多少，是所有局中人都清楚的”。　

　　　　　　静态和动态、完全信息与不完全信息，组合起来一共有　

四大类博弈。现在世界各国的经济学教育，基本上都只是在　

…　页面　7…

研究生水平才讲博弈论，典型的研究生博弈论教材就包括这　

　四类博弈：　　　　　　　　　　　　）完全信息静态博弈；　　　　　　　　　　　　　　　　　　　　　　　　完全信息动态博弈；　

　　　　　　不完全信息静态博弈；　　　　　　　　　　　　　　　　　　　　　　　不完全信息动态博弈。这四类　

博弈一个比一个精彩，也一个比一个难。　

…　页面　8…

　　　　　　另外一个类似囚徒困境的经典博弈案例是哈佛大学　巴罗　

教授提出的著名的　“旅行者困境”：　

　　　　　　两个旅行者从一个以出产细瓷花瓶著称的地方旅行回来，　

他们都买了花瓶。提取行李的时候，发现花瓶被摔坏了，于　

是他们　向航空公司索赔。航空公　　　　　　　　　　　　　　　　　　　　　　　　　　　　　知道花瓶的价格大概在八　

九十元的价位浮动，但是不知道两位旅客买的时候的确切价　

格是多少。于是，航空公司请两位旅客在　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　元以内自己写　

下花瓶的价格。如果两人写的一样，航空公司将认为他们讲　

真话，就按照他们写的数额赔偿；如果两人写的不一样，航　

空公司就认定写得低的旅客讲的是真话，并　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　原则　　　　　　　照这个　

低的价格赔偿，同时，航空公司对讲真话的旅客奖励　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　元钱，　

对讲假话的旅客罚款　　　　　　　　　　　　　　　　　　　　元　。　

　　　　　　就为了获取最大赔偿而言，本来　甲乙双方最好的策略，　

就是都写　　　　　　　　　　　　　元，这样两人都能够获赔　　　　　　　　　　　　　　　　　　　　　　　　　　　　元。可是不，甲　

很聪　明，他想　：如果我少写　　　　　　　　　　　　　　　　　　　　　　　　　　元变成　　　　　　　　　　元，而　乙会写　

元　，这样我将得到　　　　　　　　　　　　　　　　　　　　　元　。何乐而不为？所　以他准备写　

…　页面　9…

元　　。　

　　　　　　可是乙更加聪明，他算计到甲要算计他写　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　元，于是他　

准备写　　　　　　　　　　元。想不到甲还要更聪明一个层次，估计到乙要写　

　　　　元来坑他，于是他准备写　　　　　　　　　　　　　　　　　　　　　　　　　　　元……大家知道，下象棋的　

时候，不是说要多　“看”几步吗，　“看”得越远，胜算越大。　

　　　　　　你多看两步，我比你更强多看三步，你多看四步，我比　

你更老谋深算多看五步。在花瓶索赔的例子中，如果两个人　

都　“彻底理性”，都能看透十几步甚至几十步上百步，那么上　

面那样　“精明比赛”的结果，最后落到每个人都只写一两元　

　的地步。事实上，在彻底理性的假设之下，这个博弈唯一的　

纳什均衡，是两人都写　　。　

　　　　　　巴罗教授提出这个案例　旨在警世：一方面，它有启示人　

们在为私利考虑的时候不要太　“精明”，告诫人们精明不等于　

高明，太精明往往会坏事；另一方面，它对于理性行为假设　

　的适用性提出了警告。　

…　页面　10…

　　　　　　有了这个假设，我们就可以按照这个明确的比较取舍标　

准

第1部分

30天让你精通博弈学-第1部分

你可能喜欢的