博弈论的诡计(1)-第25部分
按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
的动力了。如果目的是想让猪们去多踩踏板,这个游戏规则的设计也是失败
的。
改变方案二:增量方案。投食量为原来的两倍。结果是小猪、大猪都会
去踝踏板。谁想吃,谁就会去踩踏板。反正对方不会一次把食物吃完。小猪
和大猪相当于生活在物质相对丰富的“共产主义”社会,都有足够的食物,
所以竞争意识都不会很强。对于游戏规则的设计者来说,这个规则的成本相
当高(每次提供双份的食物);而且因为竞争不强烈.想让猪去多踩踏板的目
的没有达到。
改变方案三:减量加移位方案。投食量仅为原来的一半,但同时将投食
口移到踏板附近。结果呢,小猪和大猪都在拼命地抢着踩踏板。等待者不得
食,而多劳者多得。对于游戏设计者来说,减量移位方案是一个最好的方案。
成本不高,而收获最大.可以说是一个最佳的方案。
我们用智猪博弈来分析一下公司的激励制度设计。如果奖励力度太大,
又是持股,又是期权,公司职员个个都成了百万富翁,成本高不说,员工的
积极性并不一定很高。这相当于增量方案所描述的情形。但是如果奖励力度
不大,而且见者有份(不劳动的“小猪”也有),一度十分努力的“大猪”也
不会有动力了——就像减量方案所描述的情形。
最好的激励机制设计就得像改变方案三——减量加移位的办法.奖励并非
人人有份,而是直接针对个人(如业务接比例提成),既节约了成本(对公司
而言),又消除了“搭便车”现象,能实现有效的激励。这个办法的总体思路
就是提高“小猪”的投机成本。
许多人并未读过“智猪博弈”的故事.但是却在自觉地使用“小猪”的
策略。股市上等待庄家抬轿的散户;等待产业市场中出现具有赢利能力的新
产品,继而大举仿制牟取暴利的游资;公司里不创造效益但分享成果的人,
5。I
等等。
然而,世上的事不会总是这么简单。譬如股市“小猪”特别多,都想让
“大猪”来拉动股价以从中获利。而股市里的“大猪”往往却是“大鳄”.他
们“踩动踏板”的同时会设置大量的陷阱,以提高“小猪”们的游戏成本。
如此一来,又会引出许许多多的阃题.稍有不慎.大的动荡随之而来。
除了杜绝搭便车以外,如何平衡“大猪”和“小猪”之间的利益关系.
也是需要各个领域中的专家们深入思索的问题。因此,对于制定各种经济管
理的辨戏规则的人来说,必须深谙“智猪博奔”指标改变的个中机关。
第1 O章
警察与小偷博弈:猜猜猜与换换换
每颗心都在猜猜猜
谁舍带采伟大爱情
每个人都在换换换
挨了他她他还是不行
——杜德伟《绕绕绕》歌词
从防小偷地图谈起
据报道,2006年初.杭州市民孙海涛在该市各大知名论坛上建立了一个
电子版“防小偷地图”,点开该地图网页,只要动动鼠标,就能知道杭州哪里
最容易遭贼。这张地图问世以来,点击率迅速飙升。
这张电子版的“防小偷地图”是一个三维的杭州方位图.上面较准确地
反映了杭州各条大街小巷及商场建筑。通过点击标注,网民们可以看到放大
的该路段,具体可以细到某一幢大楼的名称。
除了地图上已标注的那些易被盗的地点外,网民还可以把自己知道的小
偷出没的地方.随意地进行标注。截至2006年3月被广泛报道时为止.已经
有40多人在该地图上添加新的防盗点。不仅地段标注特别详细,而且连小偷
的活动时间、作案惯用手法都列得一清二楚。
针对网民的防盗地图。《南京晨报》的文章却问:“为何没有‘警方版防
偷图”’,按说,小偷的情况,警察了解的肯定比普通市民多,他们怎么就没
有想到设计一个防偷图呢々
实际上,问题并没有这么简单。《时代商报》的评论就指出,警方如果公
布类似的“小偷地图”.很可能打草惊蛇。当小偷也看到地图的时候,肯定会
转移战场。这个回答指出了问题的另一个侧面,但是并不足够。要想真正把
这个问题说清楚,我们需要用到博弈论中的一个模型——警察与小偷博弈。
某个小镇上只有一名警察,他负责整个镇舶治安。瑰在我们假定,小镇
的一头有一家酒馆,另一头有一家银行。再假定该地只有一个小偷。因为分
身乏术,警察一次只能在一个地方巡逻;而小偷也只能去一个地方。若警察
选择了小偷偷盗的地方巡逻,就能把小偷抓住;而如果小偷选择了没有警察
巡逻的地方偷盗,就能够偷窃成功。假定银行需要保护的财产价格为2万元.
酒馆的财产价格为l万元。警察怎么巡逻才能使效果最好?
一种最容易被警察采用而且确实也更为常见的做法是.警察对银行进行
巡逻。这样,警察可以保住2万元的财产不被偷窃。但是假如小偷去了酒馆,
偷窃一定成功。这种做法是警察的最好做法吗?答案是否定的.因为我们完
全可以通过博弈论的知识,对这种策略加以改进。
警察的一个最好的策略是,抽签决定去银行还是酒馆。因为银行的价值
是酒馆的两倍,所以用两个签代表,比如抽到l、2号签去银行,抽到3号签
去酒馆。这样警察有2,3的机会去银行进行巡逻,l,3的机会去酒馆。
而在这种情况下,小偷的最优策略是:以同样抽签的办法决定去银行还
是去酒馆偷盗.与警察不同的是抽到1、2号签去酒馆,抽到3号签去银行。
这样小偷有v3的机会去银行,2,3的机会去酒馆。
警察与小偷之间的博弈,提供了混合策略的思路,但更形象的样板是“剪
刀、石头、布”的游戏。在这样一个游戏中,不存在纯策略均衡。对每个小
孩来说,出“剪刀”、“布”还是“石头”的策略应当是随机的.不能让对方
知道自己的策略,甚至是策略的倾向性。一旦对方知道自己出某个策略的可
能性增大,那么在游戏中输的可能性也就增大了。因此,每个小孩的堆优策
略是采取每个策略的可能性是¨。在这样的博弈中.每个小孩各取三个策略
的l,'是纳什均衡。
有想到设计一个防偷图呢々
实际上,问题并没有这么简单。《时代商报》的评论就指出,警方如果公
布类似的“小偷地图”.很可能打草惊蛇。当小偷也看到地图的时候,肯定会
转移战场。这个回答指出了问题的另一个侧面,但是并不足够。要想真正把
这个问题说清楚,我们需要用到博弈论中的一个模型——警察与小偷博弈。
某个小镇上只有一名警察,他负责整个镇舶治安。瑰在我们假定,小镇
的一头有一家酒馆,另一头有一家银行。再假定该地只有一个小偷。因为分
身乏术,警察一次只能在一个地方巡逻;而小偷也只能去一个地方。若警察
选择了小偷偷盗的地方巡逻,就能把小偷抓住;而如果小偷选择了没有警察
巡逻的地方偷盗,就能够偷窃成功。假定银行需要保护的财产价格为2万元.
酒馆的财产价格为l万元。警察怎么巡逻才能使效果最好?
一种最容易被警察采用而且确实也更为常见的做法是.警察对银行进行
巡逻。这样,警察可以保住2万元的财产不被偷窃。但是假如小偷去了酒馆,
偷窃一定成功。这种做法是警察的最好做法吗?答案是否定的.因为我们完
全可以通过博弈论的知识,对这种策略加以改进。
警察的一个最好的策略是,抽签决定去银行还是酒馆。因为银行的价值
是酒馆的两倍,所以用两个签代表,比如抽到l、2号签去银行,抽到3号签
去酒馆。这样警察有2,3的机会去银行进行巡逻,l,3的机会去酒馆。
而在这种情况下,小偷的最优策略是:以同样抽签的办法决定去银行还
是去酒馆偷盗.与警察不同的是抽到1、2号签去酒馆,抽到3号签去银行。
这样小偷有v3的机会去银行,2,3的机会去酒馆。
警察与小偷之间的博弈,提供了混合策略的思路,但更形象的样板是“剪
刀、石头、布”的游戏。在这样一个游戏中,不存在纯策略均衡。对每个小
孩来说,出“剪刀”、“布”还是“石头”的策略应当是随机的.不能让对方
知道自己的策略,甚至是策略的倾向性。一旦对方知道自己出某个策略的可
能性增大,那么在游戏中输的可能性也就增大了。因此,每个小孩的堆优策
略是采取每个策略的可能性是¨。在这样的博弈中.每个小孩各取三个策略
的l,'是纳什均衡。
障弈论的雄计
还有一种常见的混合策略样板就是猜硬币游戏。比如在足球比赛开场.
裁判将手中的硬币抛掷到空中,让双方队长猜硬币落下后朝上的是正面还是
反面。由于硬币落下地的正反是随机的,概率都是1,2。那么.猜硬币游戏的
参与者选择正反的概率都是1,2,这时博弈达到混合策略纳什均衡。
这一类博弈与囚徒困境博弈辜例有一个很大的差别.就是投有纯策略纳
什均衡点,只有混合策略均衡点。这个均衡点下的策略选择是每个参与者的
最优(混台)策略选择。
所谓纯策略是指参与者在他的策略空间中选取唯一确定的策略,是参与
者一次性选取并且一直坚持的策略;而混合策略是指参与者在各种备选策略
中采取随机方式选取并且可以改变,而使之满足一定的概率的策略。
在每个参与者都有优势策略的情况下,纯策略均衡是非常合乎逻辑的。
一个优势策略优于其他任何箫略,同样。一个劣势策略则劣于其他任何策略。
假如你有一个优势策略.你可以选择采用,并且知道你的对手若是有一个优
势策略他也会照办;同样,假如休有一个劣势策略,你应该避免采用,并且
知道你的对手若是有一个劣势策略他也会规避。
但通过警察与小偷博弈我们看到,并非所有博奔都有这样优势策略.哪
怕这个博弈只有两个参与者。实际上,纯策略只是博弈论的一种特例。特别
是当博奔是零和博弈,即一方所得是另一方的所失时,只有混合策略均衡。
对于任何一方来说,都不可能有纯粹的占优策略。
看到这里,我们就可以明白,“警方版”的肪小偷地图.从博弈策略的角
度来考察并不是一个很好的方案。
当电话打到一半时
在警察与小偷的博弈中,双方采取混合策略的目的是为了战胜对方。是
一种对立者之间的斗智斗勇。实际上,即便在双方打算合作的时候.往往也
会会出现混合策略博奔。
小汪和小花是大学校园里的一对恋人,有一次电话打到一半突然断了,
两人该怎么办,假如小汪马上再给小花打电话.那么小花应该留在电话旁等
r
艇‰
警察与小偷博弈:猜猜猜与换换换
待,好把自家电话的线路空出来。可是,假如这时小汪也在等待,那么他们
的甜言蜜语就没有机会继续下去。
一方的最佳策略取决于另一方会罘取什么行动。这里又有两个均衡,一
个是小汪打电话而小花等在一边,另一个则是小花打电话而小汪等在一边。
这两个人需要进行一次沟通,以帮助他们确定彼此一致的策略.就应该
选择哪一个均衡达成共识。一个解决方案是,原来打电话的一方再次打电话,
而原来接电话的一方则等待电话铃响。这么做的好处是原来打电话的一方知
道另一方的电话号码,反过来却未必如此。
另一种可能性是,假如一方可以免费打电话或者电话费用比另一方低廉,
比如小汪的电话是包月的,而小花用的是计时收费电话.那么.解决方案是
由前者负责第二次拨打电话。
但是在更多的情况下,双方并没有上面的约定或条件,那就只有依靠投
硬币决定是不是应该拨打电话。这种随机行动的组合成为第三个均衡:假如
我打算给你打电话,我有一半机会可以打通,还有一半机会发现电话占线,
因为这时你也在给我打电话;假如我等你打电话.那么.我同样会有一半机
会接到休的电话,还有一半机会接不到你的电话,因为你也在等我的电话。
在这些例子中,选择怎样的协定并不重要,只要大家同意遵守同一协定
即可。不过,有些时候一个协定会比另一个协定好得多。但这并不表示更好
的协定一定会被采纳。如果一个协定已经存在了很长时间,现在环境的变化
使得另一个协定更可取,这时要想改革仍然并不容易。
对混合策略的传统解释是,局中人应用一种随机方法来决定所选择的策