巨星小说网 www.jxjwly.com,哈佛博弈课无错无删减全文免费阅读!
要想在现代社会做一个有文化的人,你必须对博弈论有一个大致的了解。——诺贝尔奖得主保罗·萨缪尔森第一课 不一样的博弈哈佛的博弈课程先从与博弈相关的几个话题开始,就如何应对现实中的难题提供一些初步的思路。我们意在指出:类似的情形普遍存在,而且形成了一系列相互关联的问题,系统地思考这些问题能够让大家在处事时取得事半功倍的效果。绑住自己的手在希腊神话中,遥远的海面上有一座岛屿,石崖边居住着吟唱魔歌的海妖塞壬三姐妹。半人半鸟的塞壬姐妹,坐在花丛里唱着蛊惑人心的歌谣,美妙的歌声把过往的船只引向该岛,它们撞上礁石便船毁人亡。过往的海员和船只都受到迷惑走向毁灭,无一幸免。奥德修斯事先得知塞壬那令凡人无法抗拒的致命歌声,于是命令水手用蜡封住耳朵,并将自己用绳索绑在桅杆上。他还告诫手下,在通过死亡岛时不要理会他的任何命令和手势。在船只驶经海岛的时候,迷人的歌声如期传出。那歌声是如此令人神往,奥德修斯完全沉浸其中,他绝望地挣扎着想要解除束缚,并向水手们叫喊着要求他们驶向塞壬姐妹,但没人理他。海员们驾驶船只一直向前,直到最后再也听不到歌声才给奥德修斯松绑,取出他们耳朵中的蜡。这次塞壬三姐妹白费力气,算是开了一场免费的演唱会。而且三姐妹中的老大帕耳塞洛珀深深地爱上了奥德修斯,当他的船只过去之后,她就投海自尽了。奥德修斯的选择是在和未来的自己对抗。奥德修斯知道,如果他允许未来的自己听塞壬唱歌,未来的自己就会把船开向礁石。所以,他绑住了自己的手。但生活中,很多人在面对类似的问题时,通常都任由未来的自己获胜,因为人们总是最后才行动,不懂得预先做出安排。解决这一问题的方法是,改变对未来自己的激励,从而改变自己的行为。蚂蚁和狮子的策略我们可以用博弈论来研究动物的行为,如果持某种基因的狮子或蚂蚁数量壮大了,这并不是说它们选择了这种策略,只是说明带有该基因的狮子或蚂蚁能繁衍出很多的后代而已。我们假设博弈主体是一个巨大的种群,种群中所有个体都采用相同的策略S,这是与生俱来的。假设突然间出现了一种变异,有那么一小部分个体开始采用别的策略,比如是S’。那么这个采用S’的突变小群体会不断繁衍还是灭绝呢?如果对于任何可能出现的突变情况,即任何采用S’的突变小群体最后都灭绝了,那么原始策略S就是进化稳定的,不过前提是它对所有可能的突变都成立。有一点要注意,开始时变异个体很少,因此进行随机配对的时候,大多数情况下它们是和S进行配对的,偶尔才会遇到别的突变个体。因此大多数情况下我们只需要研究突变个体在现有种群中的生存状况即可。假设一群蚂蚁与生俱来地选择策略S,都进行随机配对。两只配对的蚂蚁与生俱来地选择合作,它们各自收益为2(为了便于说明收益情况,我们采用这种用数字代替收益的模式)。从基因的适应性上来说,它们的选择很好。两只蚂蚁生出另一只蚂蚁,整个种群中合作型的蚂蚁互相配对,就会繁殖出更多的合作型蚂蚁。现在再假设突然产生了一个突变个体,这个小小的突变产生了一种不合作的蚂蚁。合作型的蚂蚁是占大多数的,但现在有一小部分的蚂蚁突变后不合作了,采用策略S’。大多数合作型的蚂蚁相互配对,大家互利共生。但如果一个突变个体和一个合作型蚂蚁随机配对,接下来会发生什么呢?对于合作型蚂蚁来说这很不幸,它和一只不太友善的蚂蚁进行了配对。假设这只合作型蚂蚁叫尼克,选策略S,不合作型蚂蚁拉胡尔选择策略S’。尼克的收益为0,也就是说它被淘汰了。而拉胡尔的收益是3,这样就不仅仅只有一个拉胡尔了,突变个体的数量将增多并继续配对。每一次配对时,合作型蚂蚁中的一部分会跟其他合作型蚂蚁配对。但是,有时候合作型蚂蚁会和某一个突变个体配对,而且其概率越来越大,这些突变个体的数量会不断增长。如果合作策略是进化稳定的,那么突变小群体就会慢慢消失而不产生更多的突变个体。但是现在这种突变个体不但没有灭绝反而不断繁衍,在随机配对中,突变个体的收益更大,这也就意味着突变个体不会灭绝,而将不断壮大。由此我们可以得出,合作不是进化稳定策略。在这个例子中,我们把基因当作策略,把遗传适应性当作收益。这里的重点就是,带有适合基因的个体会繁衍,带有不适合基因的个体会灭绝,即好的策略会使种群不断壮大。我们从中得出的结论就是,自然选择的进化结果是糟糕而低效的。整体与联盟的较量一个原始部落共有100个猎人,部落规定:猎人们每天早出晚归地打猎,并把打到的所有猎物带回部落,所有猎物在这100个猎人中平均分配。日复一日,年复一年,一直以来都是如此。设想某个年代,其中一个猎人富有政治头脑,并具有与生俱来的领袖气质与领导才能。他采用各种方法,拉拢了50个人,组成一个利益集团,并和这50个人协商,要求进行投票以确定每个猎人的打猎技术高低,并以此来确定猎物的分配比例。很自然地,这个集体会以51:49的过半数优势获胜。此后,我们不妨假设猎物的95%被51人集团平均分享,那么剩下的49人分到的猎物自然很少。这个猎人当然不会就此满足,他仍然会采用同样的方式来左右投票表决。于是他又组成了26人的小集团,重新分配这90%的猎物。接着不妨假设26人集团分到了85%的猎物。如果那被排挤的25人中胆敢有人表示不满,这个富有谋略的猎人就可以威胁冒犯者:如果不满意就通过投票让他得到的猎物更少(当然也是投票操纵,26人集团当然是支持,而被排挤的剩下的24人被告知说他们可以投票分享这个冒犯者的应得猎物,自然他们也会持支持态度)。在这种情况下,那25个人都将屈服于这种分配方案,结果猎物的绝大部分就被这26人的联盟分享。以此类推,26人转化为14人……最终的结果就变成极少数人甚至是这个领导者占有猎物的绝大部分。此时,这个领导者可以把手中的猎物当成诱饵来招募武士保卫其特权和地位,拥有这样的特权以后,领导者还可以分得更多的猎物,有了更多的猎物就可以招募更多的武士来维护自己的特权。民主中“少数服从多数”的原则最终变成了一个人的大多数,众人追求的民主最终却选出了独裁者。这似乎是天大的讽刺,然而的确是事实。如果投票中的所有人都是理性人,那么私下协商的存在必然会导致这样的结果。困扰NBA的高薪难题高水平的职业联赛都需要用优秀的运动员来吸引观众,所以尽管全球经济低迷,但NBA球员们的平均年薪依旧能够达到惊人的530万美元。而在2010年4月3日与湖人续约三年的科比·布莱恩特,今后三年的薪水总额更是高达令人咋舌的8400万美元。很多人认为,职业联赛的本质就是用高薪吸引最优秀的运动员。需要进一步讨论的问题是,当能够以适当的理由给一位运动员支付10万美元的年薪时,是否意味着没有适当的理由给他一个年薪数百万美元的合同?比如,NBA历史上最伟大的球员迈克尔·乔丹,篮球技术登峰造极,但在1993年第一次退役之后打棒球期间,他并未取得如何令人印象深刻的成就。他的篮球专业技术并不能转换成打棒球的技术,或者其他运动的职业技术。这样看来,虽然球队必须用高薪才能吸引某位特定的球员,但让同一个人成为职业运动员所需的工资并不是太高。如果所有球队提供的薪水都很低,同样也能吸引最优秀的队员,因为这些队员除了打本专业外不会做其他事。每支球队在他们的球员的薪水方面都面临着类似的困境。如果其他球队提供的薪水都非常低,你的球队支付高薪水就能够获得很大的收益,你会得到最优秀的球员,赢得所有联赛冠军,而且总有买票支持你们球队的观众。如果其他球队都提供高薪水,你还是必须提供高薪水,否则,你的队员就可能是最差的,这样你们队的票房收入就会很低。因此,给球员提供高薪水是每个球队的优势策略。对球队来说,不幸的是,它们全部支付高薪水会使它们比只支付低薪水时情况更糟。职业联赛委员会明白自身所面对的困境,并且试图限制运动员的薪水。比如NBA联盟,各俱乐部已经在执行薪水上限,以限制一个球队所支付薪水的总量,但这并未能阻止一些财大气粗的球队一掷千金。比如,2011年6月刚夺得球队历史上首个总冠军的达拉斯小牛队的老板马克·库班,就是一位疯狂的球迷兼老板。为了打造豪华之师,他不惜向联盟缴纳巨额奢侈税。而且对于球员来说,他们会从其球队所处的薪水困境中受益,因此球员工会也反对设定薪水上限。非合作的选择四位男士正坐在吧台前喝酒聊天,这时,走进来四位美女和一位绝色美人。四位男士目不转睛地盯着她们,随后,其中一个叫纳什的男士便跟他另外三个同学解释,他们该怎样去追求这些女生。纳什说,在正常情况下,四位男士会同时对这个绝色美人展开攻势。但纳什认为,采取这种策略并不聪明,因为如果所有的男士都追求那位绝色美人,他们就会互相牵制,到头来没有一个人能如愿以偿。而如果四位男士被这个绝色美女拒绝后再去找那些姿色稍逊的美女,她们就会因为自己成为别人的第二选择而恼羞成怒,于是也会把这些男士一脚踢开。因此,纳什提议说,为了避免两头落空,他们四人应该一起冷落绝色美女,转而去追求那些姿色稍逊一些的美女。这是奥斯卡获奖影片《美丽心灵》中的一个情节,那位叫纳什的男士即是该片的主人公,他的同名原型是普林斯顿大学的约翰·纳什教授——1994年的诺贝尔经济学奖得主。纳什是普林斯顿的数学天才,1950年,他将自己的研究成果写成题为《非合作博弈》的长篇博士论文。该论文在美国全国科学院每月公报上一经刊登,立即引起轰动。在这篇论文中,纳什提出了后来为其带来巨大声誉的“非合作博弈均衡的概念”,即后来众所周知的“纳什均衡”。第二课 这,就是博弈我们常常陷入不知该如何选择的两难境地,这也好,那也不错,到底应该如何选择呢?有些事情错了可以重新来过,而有的事情一旦决定就无法更改。如何让自己更有机会远离后悔的痛苦深渊?你我都需要一种可以让我们更好地进行选择的方法——这,就是博弈。策略性的互动决策“所谓博弈,就是策略性的互动决策。”这是2005年因博弈论而获得诺贝尔经济学奖的罗伯特·奥曼教授给博弈所下的定义。互动性是博弈的最大特色。无论是下棋、赌博,还是为谋取利益而进行竞争,实质都是在做策略性的互动决策。参与者都不能单纯地从自己的意愿出发采取行动,还必须充分考虑到其他博弈参与者会采取何种策略,并针对他们可能的策略选择,选择最有利于自己的应对策略。博弈的目的就是为了实现自身利益的最大化。为了帮助大家理解博弈及博弈最优策略的选择,我们用下面这样一个小例子加以说明:在风光旖旎的马尔代夫海滩上,均匀地分布着为数不多的几位游客,每个游客将消费一瓶水。现在假设哈佛大学的两位经济学教授来此做卖饮料的小贩。如果每个游客都只在靠自己最近的那个小贩那里买水,那么两位教授将如何布置他们的摊位呢?两位教授的竞争,就形成了一个简单的博弈。在这样一个博弈中,两位教授其实都明白,自己摆在海滩中点以左或右的任何位置都不是最优选择,因为对方摆在紧邻自己的右(左)边即可获得超过1/2的游客消费者,而自己只能获得少于1/2的游客消费者。那么,只有将自己的摊位安置在沙滩的正中点,这才是最好的,此时,无论对方紧邻自己左边还是右边,自己始终可以得到1/2的游客消费者。基于这种考虑,两位教授无疑都会把摊位紧挨着摆在沙滩的中心点上。在“沙滩卖饮料”的博弈中,两位哈佛教授的最优策略就是将摊位都布置在海滩的中心点上。由此,我们也可以得出,所谓最优策略,就是无论其他博弈参与者如何选择,我们做出的策略选择都是最佳的。通俗来说即是,不管你怎么做,我所做的都是我能做的策略中最好的。我们在第一章提到了“纳什均衡”的概念,其内涵是,给定其他人的选择之后,没有人对自己的策略感到后悔。这就意味着一旦达到纳什均衡,每个博弈参与者都选择了自己的最优策略。纳什均衡就是所有博弈参与者最优策略的组合。既然在纳什均衡状态下,所有参与人都选择了自己的最优策略,那么我们就可以通过判断博弈参与者的策略是否为各自的最优策略,来确认当前局面是否已达成纳什均衡。这个“沙滩卖饮料”的博弈模型,可以解释为什么卖同类物品的商家总是紧挨着布局,还可以用于政治选举中拉票的分析。关于政治选举中拉票这一点,我们会在后面讨论“换位思考”时详细论述。博弈的构成要素2010年公映的英国电影《百夫长》,情节非常简单,主要就是围绕一场令人紧张到几乎忘记呼吸的逃亡与追杀的博弈展开。在这场殊死搏斗中,博弈双方除了向我们展示了粗犷、野蛮以及冷酷的敌对气氛,还为我们异常鲜活地演绎了博弈对局的基本构成要素。一场博弈的基本构成要素主要包括以下三点:1.参与者以昆图斯·迪亚斯为首逃亡的罗马战士,悍女艾泰恩率领的皮克特追杀者。博弈对局存在一个必需的条件,就是要有两个或两个以上的参与者,自己跟自己玩不叫博弈。从经济学的角度来看,如果不存在对手,只是一个人做决策而不需要考虑他人如何行动,这就是一个传统的最优化问题,也就是在一个既定的局面或情况下如何决策的问题。比如气温骤降,出门必须多穿衣服,只要有“气温骤降”这样一种既定情况的存在,你要出门时的最优策略选择就是多穿衣服,而不用考虑其他人是否多穿衣服。这种只有你一个人做出决策的情形不能构成博弈。2.策略昆图斯·迪亚斯通过采取迂回战术和各种迷惑追踪者的策略来躲避追杀,追上罗马军队;艾泰恩则通过其神秘的近似猎犬的追踪本领,总是能够感应到罗马人的逃跑路线。如果没有艾泰恩嗜血般的疯狂追杀,昆图斯·迪亚斯率领的几名罗马士兵就没必要在逃跑的过程中千方百计地隐蔽逃跑路线;同样,如果昆图斯·迪亚斯等人不知道后边有追杀者,艾泰恩就没必要不断地施展其追踪技术。双方如果没有策略选择的交锋,就根本构不成一场博弈。就像四个人坐在牌桌前面对着一堆牌而不打,那自然无法构成牌局一样。因此在博弈中,参与者必须“出招儿”,也就是做出策略选择,直接、实用地针对某一个具体问题采取应对方法。3.收益昆图斯争取率领罗马士兵逃出生天,艾泰恩则要将罗马人留下做异乡亡魂。博弈的结果就是双方的收益。在这场异常血腥的博弈中,艾泰恩率领的追杀者在最后的决战中全军覆没,而罗马人一方只有昆图斯和博特霍什追上了罗马军队。但博特霍什在欣喜若狂之余被罗马守城士兵射死,昆图斯也差点死于意图掩盖真相的罗马高官手中,最后一个人逃了出来。他没有留在罗马领地,而是回到了逃亡途中结识且互生情愫的“女巫”那里。在这场博弈对局中,可以说没有真正的胜者,因为双方都未能实现预期的收益。即使残存的昆图斯算是仅有的胜利者,他也并没有得到真正希望的胜利。在参与者自利动机的驱使下,每个人都希望自己在博弈中实现利益最大化。这就是博弈论的第三个基本要素:参与者要有预期收益。就像赌博,每个参与者都希望自己赚得盆满钵满,而不是输得倾家荡产。在“人都是理性的”这一假定前提下,博弈的参与者都是为了获取利益而参与博弈,预期将来所获得利益的大小直接影响到博弈的吸引力和参与者的关注程度。预期收益越大,博弈对参与者的吸引力就越强。在此处必须说明,博弈虽由参与者、策略和收益三个基本要素构成,但并不是说博弈中只包括这三个要素,可能还会有更多的要素,比如参与者的出招顺序、参与者拥有的信息量等,但文中所论述的三个要素,是任何博弈都必备的,因此我们称这个要素为博弈构成的基本要素。什么叫做理性一个人跟着一位魔法师来到一座二层楼里,在进入一层的时候,他发现里面有一张长长的大桌子,桌子旁围坐着一圈人,桌子上摆满丰盛的佳肴。他们不停地尝试着去吃到食物,但每次都失败了,没有一个人能把美食放进口中,因为大家的手臂受到魔法师诅咒,手肘难以弯曲,只能空对着满桌美食,一筹莫展。这时,他听到楼上传来了欢笑声,便好奇地上楼去看个究竟。楼上的场景让他大吃一惊。二楼同样也有一群人,他们的手肘也不能弯曲,但是,大家都吃得兴高采烈。原来他们每个人都与对面的人彼此协助,互相喂食,所以每个人都吃得十分尽兴。魔法师设定了同样的博弈环境,然而两层楼的人们博弈的结果截然不同。这种差别主要源于博弈论的基本假设,这一点在上节我们已经提到,就是所有博弈参与者都是理性的,只要参与博弈,就是为了实现自己收益的最大化。在博弈中,“所有的人都是理性的”用一个经济学术语表达叫做“理性经济人”。所谓“理性经济人”原本是经济学的一个基本假设,即假定人都是利己的,而且在面临两种以上选择时,总会选择对自己更有利的方案。通俗来说就是大家都是明白人,谁也不比谁更傻,你能想到的别人也想得到,别人能想到的你也能想到。关于经济学中的“理性”,有几点需要说明:第一,理性的人一定是自利的。经济学和博弈论中的自利和社会学中的自私不是一回事。在博弈论中,“自利”是一个中性词。博弈论假设参与者都是纯粹理性的,他们以自身利益最大化为目标。上述故事中的人都有明显的自利性,面对满桌佳肴,他们的共同目标就是尽可能地享用,选择自顾自的人如此,选择互相合作的人亦是如此。第二,理性和道德不是一回事。理性选择的结果是最有可能实现自己的目标,而不一定最合乎道德,理性和道德有时会发生冲突。当然,理性的人也不一定就是不道德的。第三,理性和自由不一定一致。这一点,很多人都深有体会。小孩子对学习感到厌倦,但父母认为只有好好学习将来才能有出息,于是,家长和孩子之间展开博弈:父母会根据孩子的行动采取各种各样的激励方案,孩子也会根据父母的行动寻找对策。文章开始的故事中被下了诅咒的人们,显然是不自由的,但他们心里享用美食的欲望仍然是理性的,这一点毫无疑问,这就是理性与自由的悖论。当然,现实并非完全如此,有些理性的选择和自由的选择也会达成一致,这是最理想的状态了。理性人的主要特征就是“目标明确”四个字,博弈的参与者十分清晰、明确地知道自己的目的,并为此进行各种理性的选择。无处不在的对局博弈论并不仅限于经济或政治领域,人们的工作和生活,甚至生命的演化,都可以看作是永不停息的博弈决策过程。哈佛大学的博弈论教学,就摈弃了传统的枯燥数学模型分析,通过关注我们实际生活中的方方面面,引领大家自然而然地进入无处不在的博弈对局。人们每天从一早醒来就必须不断地做决定,日复一日决定早餐要吃什么;要不要到超市疯狂采购一番;要不要看场电影、散散步,甚至读一本书……这些都是小事情,更重大的则比如:报考哈佛还是耶鲁,选择什么专业,如何选择伴侣,从事什么样的工作,如何开展一项研究,如何打理生意,该与谁合作,做不做兼职,要不要竞争总裁的职位,要不要竞选总统……几乎你能想到的所有人生场景,都会有博弈的参与。在这些决策中,有些是完全由你一人做决定的(比如去不去散步),但决定的空间不可能是完全封闭的。你不可能在一个毫无干扰的真空世界里做决定,相反,你的身边全是和你一样的决策者,他们的选择与你的选择相互作用。这种互动关系自然会对你的思维和行动产生重要的影响,而且别人的选择和决策直接影响着你的决策结果,这种相互影响你有时甚至觉察不到。时至今日,我们已经很难摆脱这种相互影响了,因为我们都生活在一个联系紧密的社会中,是一张大网上的一个个结。为了解释和理解博弈决策的相互影响,我们不妨看看一个石匠的决策和一个拳击手的决策有什么区别。当石匠考虑怎样开凿石头的时候,如果地质情况清楚,他不必担心石头主动跳起来跟他过不去——他的“对象”原则上是被动和中立的,不会对他表现出策略对抗。然而,当一名拳击手打算攻击对手的时候,不仅他的每一招进攻都会招致抵抗,而且他还面临对方的主动出击。在人与人的博弈中,你必须意识到,你的商业对手、未来伴侣乃至你的孩子都是聪明而有主见的人,是关心自己利益的活生生的“明白人”,而不是被动的、中立的角色。一方面,他们的目标常常与你的目标发生冲突;另一方面,他们当中包含潜在的合作因素。在你做决定的时候,必须将这些冲突考虑在内,同时注意充分发挥合作因素的作用。博弈论是一种决策的艺术。因为博弈无处不在,为了自己,也为了与他人更好地合作,掌握博弈的策略思维对你无疑是有很大帮助的。正因为如此,著名经济学家、哈佛大学博士保罗·萨缪尔森说:“要想在现代社会做一个有文化的人,你必须对博弈论有一个大致的了解。”第三课 博弈给我们带来... -->>
要想在现代社会做一个有文化的人,你必须对博弈论有一个大致的了解。——诺贝尔奖得主保罗·萨缪尔森第一课 不一样的博弈哈佛的博弈课程先从与博弈相关的几个话题开始,就如何应对现实中的难题提供一些初步的思路。我们意在指出:类似的情形普遍存在,而且形成了一系列相互关联的问题,系统地思考这些问题能够让大家在处事时取得事半功倍的效果。绑住自己的手在希腊神话中,遥远的海面上有一座岛屿,石崖边居住着吟唱魔歌的海妖塞壬三姐妹。半人半鸟的塞壬姐妹,坐在花丛里唱着蛊惑人心的歌谣,美妙的歌声把过往的船只引向该岛,它们撞上礁石便船毁人亡。过往的海员和船只都受到迷惑走向毁灭,无一幸免。奥德修斯事先得知塞壬那令凡人无法抗拒的致命歌声,于是命令水手用蜡封住耳朵,并将自己用绳索绑在桅杆上。他还告诫手下,在通过死亡岛时不要理会他的任何命令和手势。在船只驶经海岛的时候,迷人的歌声如期传出。那歌声是如此令人神往,奥德修斯完全沉浸其中,他绝望地挣扎着想要解除束缚,并向水手们叫喊着要求他们驶向塞壬姐妹,但没人理他。海员们驾驶船只一直向前,直到最后再也听不到歌声才给奥德修斯松绑,取出他们耳朵中的蜡。这次塞壬三姐妹白费力气,算是开了一场免费的演唱会。而且三姐妹中的老大帕耳塞洛珀深深地爱上了奥德修斯,当他的船只过去之后,她就投海自尽了。奥德修斯的选择是在和未来的自己对抗。奥德修斯知道,如果他允许未来的自己听塞壬唱歌,未来的自己就会把船开向礁石。所以,他绑住了自己的手。但生活中,很多人在面对类似的问题时,通常都任由未来的自己获胜,因为人们总是最后才行动,不懂得预先做出安排。解决这一问题的方法是,改变对未来自己的激励,从而改变自己的行为。蚂蚁和狮子的策略我们可以用博弈论来研究动物的行为,如果持某种基因的狮子或蚂蚁数量壮大了,这并不是说它们选择了这种策略,只是说明带有该基因的狮子或蚂蚁能繁衍出很多的后代而已。我们假设博弈主体是一个巨大的种群,种群中所有个体都采用相同的策略S,这是与生俱来的。假设突然间出现了一种变异,有那么一小部分个体开始采用别的策略,比如是S’。那么这个采用S’的突变小群体会不断繁衍还是灭绝呢?如果对于任何可能出现的突变情况,即任何采用S’的突变小群体最后都灭绝了,那么原始策略S就是进化稳定的,不过前提是它对所有可能的突变都成立。有一点要注意,开始时变异个体很少,因此进行随机配对的时候,大多数情况下它们是和S进行配对的,偶尔才会遇到别的突变个体。因此大多数情况下我们只需要研究突变个体在现有种群中的生存状况即可。假设一群蚂蚁与生俱来地选择策略S,都进行随机配对。两只配对的蚂蚁与生俱来地选择合作,它们各自收益为2(为了便于说明收益情况,我们采用这种用数字代替收益的模式)。从基因的适应性上来说,它们的选择很好。两只蚂蚁生出另一只蚂蚁,整个种群中合作型的蚂蚁互相配对,就会繁殖出更多的合作型蚂蚁。现在再假设突然产生了一个突变个体,这个小小的突变产生了一种不合作的蚂蚁。合作型的蚂蚁是占大多数的,但现在有一小部分的蚂蚁突变后不合作了,采用策略S’。大多数合作型的蚂蚁相互配对,大家互利共生。但如果一个突变个体和一个合作型蚂蚁随机配对,接下来会发生什么呢?对于合作型蚂蚁来说这很不幸,它和一只不太友善的蚂蚁进行了配对。假设这只合作型蚂蚁叫尼克,选策略S,不合作型蚂蚁拉胡尔选择策略S’。尼克的收益为0,也就是说它被淘汰了。而拉胡尔的收益是3,这样就不仅仅只有一个拉胡尔了,突变个体的数量将增多并继续配对。每一次配对时,合作型蚂蚁中的一部分会跟其他合作型蚂蚁配对。但是,有时候合作型蚂蚁会和某一个突变个体配对,而且其概率越来越大,这些突变个体的数量会不断增长。如果合作策略是进化稳定的,那么突变小群体就会慢慢消失而不产生更多的突变个体。但是现在这种突变个体不但没有灭绝反而不断繁衍,在随机配对中,突变个体的收益更大,这也就意味着突变个体不会灭绝,而将不断壮大。由此我们可以得出,合作不是进化稳定策略。在这个例子中,我们把基因当作策略,把遗传适应性当作收益。这里的重点就是,带有适合基因的个体会繁衍,带有不适合基因的个体会灭绝,即好的策略会使种群不断壮大。我们从中得出的结论就是,自然选择的进化结果是糟糕而低效的。整体与联盟的较量一个原始部落共有100个猎人,部落规定:猎人们每天早出晚归地打猎,并把打到的所有猎物带回部落,所有猎物在这100个猎人中平均分配。日复一日,年复一年,一直以来都是如此。设想某个年代,其中一个猎人富有政治头脑,并具有与生俱来的领袖气质与领导才能。他采用各种方法,拉拢了50个人,组成一个利益集团,并和这50个人协商,要求进行投票以确定每个猎人的打猎技术高低,并以此来确定猎物的分配比例。很自然地,这个集体会以51:49的过半数优势获胜。此后,我们不妨假设猎物的95%被51人集团平均分享,那么剩下的49人分到的猎物自然很少。这个猎人当然不会就此满足,他仍然会采用同样的方式来左右投票表决。于是他又组成了26人的小集团,重新分配这90%的猎物。接着不妨假设26人集团分到了85%的猎物。如果那被排挤的25人中胆敢有人表示不满,这个富有谋略的猎人就可以威胁冒犯者:如果不满意就通过投票让他得到的猎物更少(当然也是投票操纵,26人集团当然是支持,而被排挤的剩下的24人被告知说他们可以投票分享这个冒犯者的应得猎物,自然他们也会持支持态度)。在这种情况下,那25个人都将屈服于这种分配方案,结果猎物的绝大部分就被这26人的联盟分享。以此类推,26人转化为14人……最终的结果就变成极少数人甚至是这个领导者占有猎物的绝大部分。此时,这个领导者可以把手中的猎物当成诱饵来招募武士保卫其特权和地位,拥有这样的特权以后,领导者还可以分得更多的猎物,有了更多的猎物就可以招募更多的武士来维护自己的特权。民主中“少数服从多数”的原则最终变成了一个人的大多数,众人追求的民主最终却选出了独裁者。这似乎是天大的讽刺,然而的确是事实。如果投票中的所有人都是理性人,那么私下协商的存在必然会导致这样的结果。困扰NBA的高薪难题高水平的职业联赛都需要用优秀的运动员来吸引观众,所以尽管全球经济低迷,但NBA球员们的平均年薪依旧能够达到惊人的530万美元。而在2010年4月3日与湖人续约三年的科比·布莱恩特,今后三年的薪水总额更是高达令人咋舌的8400万美元。很多人认为,职业联赛的本质就是用高薪吸引最优秀的运动员。需要进一步讨论的问题是,当能够以适当的理由给一位运动员支付10万美元的年薪时,是否意味着没有适当的理由给他一个年薪数百万美元的合同?比如,NBA历史上最伟大的球员迈克尔·乔丹,篮球技术登峰造极,但在1993年第一次退役之后打棒球期间,他并未取得如何令人印象深刻的成就。他的篮球专业技术并不能转换成打棒球的技术,或者其他运动的职业技术。这样看来,虽然球队必须用高薪才能吸引某位特定的球员,但让同一个人成为职业运动员所需的工资并不是太高。如果所有球队提供的薪水都很低,同样也能吸引最优秀的队员,因为这些队员除了打本专业外不会做其他事。每支球队在他们的球员的薪水方面都面临着类似的困境。如果其他球队提供的薪水都非常低,你的球队支付高薪水就能够获得很大的收益,你会得到最优秀的球员,赢得所有联赛冠军,而且总有买票支持你们球队的观众。如果其他球队都提供高薪水,你还是必须提供高薪水,否则,你的队员就可能是最差的,这样你们队的票房收入就会很低。因此,给球员提供高薪水是每个球队的优势策略。对球队来说,不幸的是,它们全部支付高薪水会使它们比只支付低薪水时情况更糟。职业联赛委员会明白自身所面对的困境,并且试图限制运动员的薪水。比如NBA联盟,各俱乐部已经在执行薪水上限,以限制一个球队所支付薪水的总量,但这并未能阻止一些财大气粗的球队一掷千金。比如,2011年6月刚夺得球队历史上首个总冠军的达拉斯小牛队的老板马克·库班,就是一位疯狂的球迷兼老板。为了打造豪华之师,他不惜向联盟缴纳巨额奢侈税。而且对于球员来说,他们会从其球队所处的薪水困境中受益,因此球员工会也反对设定薪水上限。非合作的选择四位男士正坐在吧台前喝酒聊天,这时,走进来四位美女和一位绝色美人。四位男士目不转睛地盯着她们,随后,其中一个叫纳什的男士便跟他另外三个同学解释,他们该怎样去追求这些女生。纳什说,在正常情况下,四位男士会同时对这个绝色美人展开攻势。但纳什认为,采取这种策略并不聪明,因为如果所有的男士都追求那位绝色美人,他们就会互相牵制,到头来没有一个人能如愿以偿。而如果四位男士被这个绝色美女拒绝后再去找那些姿色稍逊的美女,她们就会因为自己成为别人的第二选择而恼羞成怒,于是也会把这些男士一脚踢开。因此,纳什提议说,为了避免两头落空,他们四人应该一起冷落绝色美女,转而去追求那些姿色稍逊一些的美女。这是奥斯卡获奖影片《美丽心灵》中的一个情节,那位叫纳什的男士即是该片的主人公,他的同名原型是普林斯顿大学的约翰·纳什教授——1994年的诺贝尔经济学奖得主。纳什是普林斯顿的数学天才,1950年,他将自己的研究成果写成题为《非合作博弈》的长篇博士论文。该论文在美国全国科学院每月公报上一经刊登,立即引起轰动。在这篇论文中,纳什提出了后来为其带来巨大声誉的“非合作博弈均衡的概念”,即后来众所周知的“纳什均衡”。第二课 这,就是博弈我们常常陷入不知该如何选择的两难境地,这也好,那也不错,到底应该如何选择呢?有些事情错了可以重新来过,而有的事情一旦决定就无法更改。如何让自己更有机会远离后悔的痛苦深渊?你我都需要一种可以让我们更好地进行选择的方法——这,就是博弈。策略性的互动决策“所谓博弈,就是策略性的互动决策。”这是2005年因博弈论而获得诺贝尔经济学奖的罗伯特·奥曼教授给博弈所下的定义。互动性是博弈的最大特色。无论是下棋、赌博,还是为谋取利益而进行竞争,实质都是在做策略性的互动决策。参与者都不能单纯地从自己的意愿出发采取行动,还必须充分考虑到其他博弈参与者会采取何种策略,并针对他们可能的策略选择,选择最有利于自己的应对策略。博弈的目的就是为了实现自身利益的最大化。为了帮助大家理解博弈及博弈最优策略的选择,我们用下面这样一个小例子加以说明:在风光旖旎的马尔代夫海滩上,均匀地分布着为数不多的几位游客,每个游客将消费一瓶水。现在假设哈佛大学的两位经济学教授来此做卖饮料的小贩。如果每个游客都只在靠自己最近的那个小贩那里买水,那么两位教授将如何布置他们的摊位呢?两位教授的竞争,就形成了一个简单的博弈。在这样一个博弈中,两位教授其实都明白,自己摆在海滩中点以左或右的任何位置都不是最优选择,因为对方摆在紧邻自己的右(左)边即可获得超过1/2的游客消费者,而自己只能获得少于1/2的游客消费者。那么,只有将自己的摊位安置在沙滩的正中点,这才是最好的,此时,无论对方紧邻自己左边还是右边,自己始终可以得到1/2的游客消费者。基于这种考虑,两位教授无疑都会把摊位紧挨着摆在沙滩的中心点上。在“沙滩卖饮料”的博弈中,两位哈佛教授的最优策略就是将摊位都布置在海滩的中心点上。由此,我们也可以得出,所谓最优策略,就是无论其他博弈参与者如何选择,我们做出的策略选择都是最佳的。通俗来说即是,不管你怎么做,我所做的都是我能做的策略中最好的。我们在第一章提到了“纳什均衡”的概念,其内涵是,给定其他人的选择之后,没有人对自己的策略感到后悔。这就意味着一旦达到纳什均衡,每个博弈参与者都选择了自己的最优策略。纳什均衡就是所有博弈参与者最优策略的组合。既然在纳什均衡状态下,所有参与人都选择了自己的最优策略,那么我们就可以通过判断博弈参与者的策略是否为各自的最优策略,来确认当前局面是否已达成纳什均衡。这个“沙滩卖饮料”的博弈模型,可以解释为什么卖同类物品的商家总是紧挨着布局,还可以用于政治选举中拉票的分析。关于政治选举中拉票这一点,我们会在后面讨论“换位思考”时详细论述。博弈的构成要素2010年公映的英国电影《百夫长》,情节非常简单,主要就是围绕一场令人紧张到几乎忘记呼吸的逃亡与追杀的博弈展开。在这场殊死搏斗中,博弈双方除了向我们展示了粗犷、野蛮以及冷酷的敌对气氛,还为我们异常鲜活地演绎了博弈对局的基本构成要素。一场博弈的基本构成要素主要包括以下三点:1.参与者以昆图斯·迪亚斯为首逃亡的罗马战士,悍女艾泰恩率领的皮克特追杀者。博弈对局存在一个必需的条件,就是要有两个或两个以上的参与者,自己跟自己玩不叫博弈。从经济学的角度来看,如果不存在对手,只是一个人做决策而不需要考虑他人如何行动,这就是一个传统的最优化问题,也就是在一个既定的局面或情况下如何决策的问题。比如气温骤降,出门必须多穿衣服,只要有“气温骤降”这样一种既定情况的存在,你要出门时的最优策略选择就是多穿衣服,而不用考虑其他人是否多穿衣服。这种只有你一个人做出决策的情形不能构成博弈。2.策略昆图斯·迪亚斯通过采取迂回战术和各种迷惑追踪者的策略来躲避追杀,追上罗马军队;艾泰恩则通过其神秘的近似猎犬的追踪本领,总是能够感应到罗马人的逃跑路线。如果没有艾泰恩嗜血般的疯狂追杀,昆图斯·迪亚斯率领的几名罗马士兵就没必要在逃跑的过程中千方百计地隐蔽逃跑路线;同样,如果昆图斯·迪亚斯等人不知道后边有追杀者,艾泰恩就没必要不断地施展其追踪技术。双方如果没有策略选择的交锋,就根本构不成一场博弈。就像四个人坐在牌桌前面对着一堆牌而不打,那自然无法构成牌局一样。因此在博弈中,参与者必须“出招儿”,也就是做出策略选择,直接、实用地针对某一个具体问题采取应对方法。3.收益昆图斯争取率领罗马士兵逃出生天,艾泰恩则要将罗马人留下做异乡亡魂。博弈的结果就是双方的收益。在这场异常血腥的博弈中,艾泰恩率领的追杀者在最后的决战中全军覆没,而罗马人一方只有昆图斯和博特霍什追上了罗马军队。但博特霍什在欣喜若狂之余被罗马守城士兵射死,昆图斯也差点死于意图掩盖真相的罗马高官手中,最后一个人逃了出来。他没有留在罗马领地,而是回到了逃亡途中结识且互生情愫的“女巫”那里。在这场博弈对局中,可以说没有真正的胜者,因为双方都未能实现预期的收益。即使残存的昆图斯算是仅有的胜利者,他也并没有得到真正希望的胜利。在参与者自利动机的驱使下,每个人都希望自己在博弈中实现利益最大化。这就是博弈论的第三个基本要素:参与者要有预期收益。就像赌博,每个参与者都希望自己赚得盆满钵满,而不是输得倾家荡产。在“人都是理性的”这一假定前提下,博弈的参与者都是为了获取利益而参与博弈,预期将来所获得利益的大小直接影响到博弈的吸引力和参与者的关注程度。预期收益越大,博弈对参与者的吸引力就越强。在此处必须说明,博弈虽由参与者、策略和收益三个基本要素构成,但并不是说博弈中只包括这三个要素,可能还会有更多的要素,比如参与者的出招顺序、参与者拥有的信息量等,但文中所论述的三个要素,是任何博弈都必备的,因此我们称这个要素为博弈构成的基本要素。什么叫做理性一个人跟着一位魔法师来到一座二层楼里,在进入一层的时候,他发现里面有一张长长的大桌子,桌子旁围坐着一圈人,桌子上摆满丰盛的佳肴。他们不停地尝试着去吃到食物,但每次都失败了,没有一个人能把美食放进口中,因为大家的手臂受到魔法师诅咒,手肘难以弯曲,只能空对着满桌美食,一筹莫展。这时,他听到楼上传来了欢笑声,便好奇地上楼去看个究竟。楼上的场景让他大吃一惊。二楼同样也有一群人,他们的手肘也不能弯曲,但是,大家都吃得兴高采烈。原来他们每个人都与对面的人彼此协助,互相喂食,所以每个人都吃得十分尽兴。魔法师设定了同样的博弈环境,然而两层楼的人们博弈的结果截然不同。这种差别主要源于博弈论的基本假设,这一点在上节我们已经提到,就是所有博弈参与者都是理性的,只要参与博弈,就是为了实现自己收益的最大化。在博弈中,“所有的人都是理性的”用一个经济学术语表达叫做“理性经济人”。所谓“理性经济人”原本是经济学的一个基本假设,即假定人都是利己的,而且在面临两种以上选择时,总会选择对自己更有利的方案。通俗来说就是大家都是明白人,谁也不比谁更傻,你能想到的别人也想得到,别人能想到的你也能想到。关于经济学中的“理性”,有几点需要说明:第一,理性的人一定是自利的。经济学和博弈论中的自利和社会学中的自私不是一回事。在博弈论中,“自利”是一个中性词。博弈论假设参与者都是纯粹理性的,他们以自身利益最大化为目标。上述故事中的人都有明显的自利性,面对满桌佳肴,他们的共同目标就是尽可能地享用,选择自顾自的人如此,选择互相合作的人亦是如此。第二,理性和道德不是一回事。理性选择的结果是最有可能实现自己的目标,而不一定最合乎道德,理性和道德有时会发生冲突。当然,理性的人也不一定就是不道德的。第三,理性和自由不一定一致。这一点,很多人都深有体会。小孩子对学习感到厌倦,但父母认为只有好好学习将来才能有出息,于是,家长和孩子之间展开博弈:父母会根据孩子的行动采取各种各样的激励方案,孩子也会根据父母的行动寻找对策。文章开始的故事中被下了诅咒的人们,显然是不自由的,但他们心里享用美食的欲望仍然是理性的,这一点毫无疑问,这就是理性与自由的悖论。当然,现实并非完全如此,有些理性的选择和自由的选择也会达成一致,这是最理想的状态了。理性人的主要特征就是“目标明确”四个字,博弈的参与者十分清晰、明确地知道自己的目的,并为此进行各种理性的选择。无处不在的对局博弈论并不仅限于经济或政治领域,人们的工作和生活,甚至生命的演化,都可以看作是永不停息的博弈决策过程。哈佛大学的博弈论教学,就摈弃了传统的枯燥数学模型分析,通过关注我们实际生活中的方方面面,引领大家自然而然地进入无处不在的博弈对局。人们每天从一早醒来就必须不断地做决定,日复一日决定早餐要吃什么;要不要到超市疯狂采购一番;要不要看场电影、散散步,甚至读一本书……这些都是小事情,更重大的则比如:报考哈佛还是耶鲁,选择什么专业,如何选择伴侣,从事什么样的工作,如何开展一项研究,如何打理生意,该与谁合作,做不做兼职,要不要竞争总裁的职位,要不要竞选总统……几乎你能想到的所有人生场景,都会有博弈的参与。在这些决策中,有些是完全由你一人做决定的(比如去不去散步),但决定的空间不可能是完全封闭的。你不可能在一个毫无干扰的真空世界里做决定,相反,你的身边全是和你一样的决策者,他们的选择与你的选择相互作用。这种互动关系自然会对你的思维和行动产生重要的影响,而且别人的选择和决策直接影响着你的决策结果,这种相互影响你有时甚至觉察不到。时至今日,我们已经很难摆脱这种相互影响了,因为我们都生活在一个联系紧密的社会中,是一张大网上的一个个结。为了解释和理解博弈决策的相互影响,我们不妨看看一个石匠的决策和一个拳击手的决策有什么区别。当石匠考虑怎样开凿石头的时候,如果地质情况清楚,他不必担心石头主动跳起来跟他过不去——他的“对象”原则上是被动和中立的,不会对他表现出策略对抗。然而,当一名拳击手打算攻击对手的时候,不仅他的每一招进攻都会招致抵抗,而且他还面临对方的主动出击。在人与人的博弈中,你必须意识到,你的商业对手、未来伴侣乃至你的孩子都是聪明而有主见的人,是关心自己利益的活生生的“明白人”,而不是被动的、中立的角色。一方面,他们的目标常常与你的目标发生冲突;另一方面,他们当中包含潜在的合作因素。在你做决定的时候,必须将这些冲突考虑在内,同时注意充分发挥合作因素的作用。博弈论是一种决策的艺术。因为博弈无处不在,为了自己,也为了与他人更好地合作,掌握博弈的策略思维对你无疑是有很大帮助的。正因为如此,著名经济学家、哈佛大学博士保罗·萨缪尔森说:“要想在现代社会做一个有文化的人,你必须对博弈论有一个大致的了解。”第三课 博弈给我们带来... -->>
本章未完,点击下一页继续阅读