课程大纲

核心思想：Tit-for-Tat重复博弈

前言

用博弈的思维看世界，我不希望读者被烦琐的公式和推理所淹没而忘却了博弈的精髓。我特别希望读者看到，是游戏规则决定了人们在博弈中选择竞争还是合作。因此，如果我们对博弈的结果不满意，希望有更好的结果，就需要改变彼此的策略（行动）；而要改变彼此的策略，就必须要改变游戏的规则。如果我们不希望生活在一个尔虞我诈的丛林世界，不希望我们的下一代还生活在彼此投毒的社会里，努力创建一种更好的游戏规则就是历史赋予我们这代人的光荣使命。

知人者智，自知者明；

胜人者力，自胜者强；

小胜者术，大胜者德。

第一讲博弈论概述

博：博览全局

弈：对弈棋局

谋定而后动

博弈，只需领先一步，高人一筹！

博弈，就是换位思考！

博弃就是你中有我，我中有你。由于直接相互作用（互动），每个博弃参与者的得益不仅取决于自己的策咯（行动），还取决于其他参与者的策咯（行动）。博弃的核心在于整体思维基础上的理性换位思考，用他人的得益去推测他人的策略（行动），从而选择最有利于自己的策略（行动）。

知人者智，自知者明；
胜人者力，自胜者强；
小胜者术，大胜者德。

1.博弈是指在一定的游戏规则约束下，基于直接相互作用的环境条件，各参与人依据所掌握的信息，选择各自的策略（行动），以实现利益最大化的过程。

2.博弈要清楚对手是谁，以及未来的对手。

例如小故事：两人同行打猎，忽遇一猛狮，一人卸下身上物品狂奔，同伴不解，问道：“汝能胜狮？”答曰：“非需胜狮，只需胜汝！”

3.博弈，既可以是竞争关系，也可以是合作关系。不要局限于竞争，可以实现win-win即共赢。

4.博弈，必须学会换位思考。

由于直接的相互作用（互动），每个博弈参与者的得意不仅取决于自己的策略，还取决于其他参与者的策略（行动）。

博弈的核心在于整体思维基础上的理性换位思考，用他人的得意去推测他人的策略，从而选择最有利于自己的策略（行动）。

罗塞尔松蜈蚣博弈

罗塞尔松蜈蚣实验是博弈论中一种经典的实验，用来说明合作与背叛之间的博弈策略。

背景：在博弈论中，合作和背叛是两种常见的博弈策略。合作可以带来双赢，而背叛则可能导致双输。罗塞尔松蜈蚣实验通过一个简单的博弈情境，让参与者在合作和背叛之间做出选择，从而观察他们的决策过程和结果。

过程：在罗塞尔松蜈蚣实验中，参与者分成两组，每组有两个成员。每个人都被赋予一定数量的积分，然后被要求决定是合作还是背叛。如果两个人都选择合作，他们将分得一定数量的积分；如果有一个人选择背叛，而另一个选择合作，那么背叛者将得到更多的积分，而合作者将失去积分；如果两个人都选择背叛，他们将失去一定数量的积分。

结论：通过观察参与者的选择和结果，罗塞尔松蜈蚣实验发现，虽然合作可以带来更好的结果，但在实际情况下，人们往往更倾向于背叛，因为他们想要最大化自己的利益。这说明在博弈中，合作与背叛之间存在着复杂的权衡关系，而个人的利益追求可能会导致整体利益的损失。因此，了解不同博弈策略的影响是十分重要的。

5.来自蒋老师的特别提示：

如果因为对方眼中的你的傻，而让对方更愿意和你合作，何乐而不为呢？

表现得太精明，往往会让别人避免与其合作。

不要在一个充分竞争的市场去追求成功。（比如彩票）

选对市场（对手）比选对策略更重要。（比如行业、股票、房产、导师）

博弈之前，博弈就已经开始了。

博弈，只需比别人领先一步，高人一筹。

李嘉诚让利一分原则是指在商业交易中，双方应该互相让利一分，建立长期稳定的合作关系。这个原则强调双方合作互惠互利，共同发展，而不是以牟取暂时的利益为目的。

买彩票、买股票，充分计算与随机买卖效果差不多，所罗门公司，《说谎者的扑克牌》

股票市场充分竞争

不要在一个充分竞争的市场去追求成功！很难获得暴利！充其量获得平均利润。

选对市场（对手）比选对策略更重要！股市和房市

学习博弈论的收益：

一、当局者清：更有利的选择，更快速的反应

二、旁观者更清：理解历史与现实，预测未来的发展

三、提出完善游戏规则（制度）的建议

第一章何为“博弈”

一、从一个简单的故事说起

有一个故事是这么说的：两人同行打猎，忽遇一猛狮。一人卸下身上物品狂奔。同伴不解，问道：“汝能胜狮？”答：“非需胜狮，只需胜汝！”

……

以上分析表明，一个人的选择既与外部的环境条件（什么样的狮子）有关，也与对手的状况（跑得快还是慢）有关。在此条件下，每个人作出对自己最有利的策略（行为）选择。这就是所谓的“博弈”！

博弈（game）是指在一定的游戏规则约束下，基于直接相互作用的环境条件，各参与者依据各自所掌握的信息，选择各自的策略（行动），以实现利益最大化的过程。

博弈论（game theory）是一种研究人们怎么做策略（行动）选择，及其最后的均衡结果会是什么的理论。

二、博弈的渊源

在日常生活中，“博”有多种含义，如博学、博士、博古通今、博览群书、博闻强记，用来表明“大”、“广”、“通”、“多”的含义。用作动词时，意为“换取、取得”，如“以博欢心”、“搏击长空”、“聊博一笑”等。在古文中，“博”的本意指用六支筷子和十二个棋子进行赌输赢的一种游戏，谓之“六箸十二棋”。《论语•阳货》中有“不有博弈者乎”，其中“博”乃指“六箸十二棋”。因此，“博”作为动词还隐含有“下棋”之意。“弈”指的是“围棋”。东汉许慎《说文解字》中称：“弈，围棋也。”从字面上看，“博弈”是指“下围棋”。在英文里，“博弈”对应的是“game”，一般翻译成“游戏”，既有“娱乐或消遣”之意，也有“按规则进行的体力或智力竞赛”之意。

有关围棋起源的传说甚多，相传最早起源于尧帝。晋代张华《博物志》曰：“尧造围棋，以教丹朱。”迄今所知关于围棋的最早文字记载是《左传•襄公二十五年》载：“棋者所执之子，以子围而相杀，故谓之围棋。”《左传•鲁襄公二十五年》还记载：“今宁子视君不如弈棋，其何以免乎？弈者举棋不定，不胜其耦，而况置君而弗定乎？必不免矣。”春秋时期，围棋成为一种游戏在社会上流行。战国时期，围棋已发展成一种专门学问，《孟子•告子上》：“奕秋，通国之善奕者也，使奕秋诲二人奕。”到东汉时期，围棋进一步发展，出现了班固（《弈旨》）、李尤（《围棋铭》）、黄宪（《机论》）、马融（《围棋赋》）等一批围棋理论的奠基者，使围棋逐渐为士大夫所重视。三国时期，魏、吴两国盛行围棋。魏以曹氏家族、“建安七子”为代表，曹操的围棋水平可以与高手相媲美。东吴围棋风靡一时，名手辈出，也就出现了对局的记录，这就是围棋史上有名的“吴图”。隋朝时期，十九道棋盘确定了主导地位，取代了早先的十七道棋盘。盛唐时期，唐玄宗大力倡导围棋，创立了翰林棋待诏（待命供奉内廷的人）制度，这是围棋走向专业化、职业化的标志。

围棋的产生和流行，据说和古代的战争有密切的关系。古代的军事家借助围棋来排兵布阵、演练队伍，达到围而杀之的目的。至今围棋下子的战略战术、胜负计算方法，也都符合古代作战方略。汉代刘向在《围棋赋》中对围棋胜负的关键做了十分精辟的阐述：“略观围棋，法于用兵，怯者无功，贪者先亡。”

最简化的棋盘（纵横各19条线编织成的一张网），最简化的棋子（只分黑白两色），最简单的规则（轮流下子，两气活棋，空多者胜，再加上一些“劫争”之类的补充规定），一个对围棋一无所知的人也能在几分钟内学会，可是它的玄妙深奥和招数变化却几乎超过了任何一种棋类游戏。

对“博弈”的理解，中外基本一致的地方是：博弈是一种双方（多方）的对抗（比赛），对抗总是在一定的规则下进行，参与者必然会考虑运用相应的策略（计谋），并尽可能让自己获胜。有所不同的是，从“下围棋”引发的博弈，因其规则简单明了，下法千变万化，人们更侧重于对棋术（计谋）的钻研。从“游戏”引发的博弈，因其规则有简有繁，运气有好有坏，人们更侧重于对规则的探讨。换言之，中国人看到“博弈”，首先想的是用“什么策略（行动）”，而西方人看到“game”，首先要问的是用“什么规则”。

三、学习博弈论的收益

中国人常说，“当局者迷，旁观者清”，那么学习博弈论带给你的收益就是：“当局者清，旁观者更清”，并在此基础上帮助我们建立更好的合作关系，共享美好未来。

收益之一：当局者清。通过博弈论的学习，可以让你作出对自己更有利的选择。

通过博弈论的学习还可以让你更快地作出对自己有利的选择。

本书会告诉你一些策略与行为选择的普遍原则与技巧，并让你学会如何将这些原则和技巧运用到各种不同的博弈中去。本书会告诉你：如何让自己的策略和行为变得难以被预测或者容易被预测（因为有时候你希望对方尽快地了解你，这一点对于恋爱中的青年男女特别有用）？在什么情况下你会被对手的真话所欺骗？是否应该相信他人的承诺或威胁？如何使你的承诺或威胁能够让对手相信？如何让自己早日脱离诸多陷阱（如囚犯困境、万元陷阱等）？此外，博弈论也可将许多不确定性和不完全信息的情况纳入你的决策范围，让你在一个充满未知、极度概率性的世界中安居乐业。

收益之二：旁观者更清。通过博弈论的学习可以让你做一个更清醒的旁观者，更好地理解历史与现实，预测未来的发展。在多方博弈中，可用博弈预测各参与方将可能采取的策略（行动）以及可能的最终结果。试想，如果你能够从中央政府、地方政府、房地产开发商、购房者四方博弈的角度去理解商品房市场的运行机制和房价变动，那么对房价在近些年的持续上涨就会有更清醒的认识。如果你能够从机构与散户之间的博弈来理解证券市场的价格波动，就不会对散户们经常性的普遍亏损感到奇怪了。如果你懂得了“逆向选择”的道理，就不会奇怪为什么一些地方的酒店服务员竟然对你称其为“小姐”怒目而视。如果你知道了“信号传递博弈”，就不会奇怪为什么购买一个墓穴竟然要数以万计、数以几十万计。总之，博弈论能够给你一双慧眼，更清晰、更理性地理解历史、看待现实、展望未来。

当然，博弈论不可能让你把一切都看得一清二楚。就算我们不考虑每个参与者会在现实的博弈中出错（误判或者误选），本书后续的分析会告诉你，一个人对未来结果的预见性还会受两个方面的制约：一是许多博弈中的策略均衡是混合策略的均衡，每个人在一次博弈中会选哪个具体的策略是未知的，因此你预测出的只是一个双方策略的概率分布；二是策略均衡可能是多重均衡，你无法断定最后的均衡结果一定会是哪一个。想象一下，你和亲人在火车站广场或者公园里走散了后，最后会在哪个位置相见呢？因此，当我们去预测结果的时候，一定要记住“随机性”的广泛存在。上帝也会扔骰子的。

收益之三：提出完善游戏规则（制度）的建议，避免无谓的争斗和战乱，共建人类的美好未来。博弈论与其他理论的区别在于它研究“理性人的互动行为”。人与人之间的互动必然是在一定的游戏规则下进行的，因此博弈论提供给每个人一种从游戏规则（制度）到策略（行为）选择再到博弈均衡（结局）的分析框架，并由这个框架告诉人们游戏规则对结局的影响作用。这种影响作用很多时候是决定性的，从而为人们如何完善现有的游戏规则提供了理论依据和评判标准。特别是对一个有权力制定规则的人，博弈论的学习有利于其制定出更完善的游戏规则。从这点来看，一个组织的管理者（如企业家或政府官员）更能从博弈论的学习中获益。

总之，博弈论的学习既能够让你更清醒地看待身处的世界，又能够让你作出对自己更有利的选择，还能够让你对制度建设与社会发展提出更有实效性的改革建议，从而改善我们以及我们的子孙后代们所要生活的世界。

第二章发展简史

一、最初的探索和应用

早在1848年，法国经济学家古诺（Antoine Augustin Cournot，1801—1877）就对双寡头市场进行了模型分析，建立了博弈论的第一个经典模型：古诺模型。古诺模型假定一种产品在市场上只有两个卖者，并且相互间没有任何勾结和串谋行为，但都知道对方将怎样行动，从而各自确定怎样的产量来实现企业利润最大化。在古诺模型中，参加博弈的双方以各自在同一时间内相互独立的产量作为决策的变量，是一个产量竞争模型。

另一个法国经济学家伯川德（Joseph Bertrand）于1883年建立了不同于古诺模型的伯川德模型。该模型与古诺模型的不同之处在于，企业把其产品的价格而不是产量作为竞争手段和决策变量，通过制定一个最优的销售价格来实现利润最大化。应该说，这是一个更接近于市场真实情况的模型，对于彼此竞争的企业来说，更容易了解对方的市场定价，而不是对方的产量。用博弈论的术语来说：价格更容易成为一个共同知识，而产量往往是一个私人信息。根据伯川德模型，谁的价格低谁就将赢得整个市场，而谁的价格高谁就将失去整个市场，因此寡头之间会相互削价，直至价格等于各自的边际成本为止。伯川德模型最让人惊讶的结论是，哪怕市场中的企业数目只有2个，一旦打起价格战来，其结果就和一个完全竞争市场的竞争结果一样。当然，这显然与人们的日常观察和实际经验不符，后人称之为“伯川德悖论”。如果考虑到企业生产能力的有限性、企业产品的差异性，特别是博弈的重复性，两败俱伤式的价格竞争在很多时候还是可以避免的。

德国经济学家斯塔克尔伯格（H.von Stackelberg）在20世纪30年代提出的斯塔克尔伯格模型比早先的古诺模型和伯川德模型更进一步地考虑了企业竞争的动态性和不对称性。该模型分析的是这么一种市场竞争：企业A先决定一个产量，然后企业B可以观察到这个产量，并根据所观察到的产量来决定它自己的产量。这里特别要注意的是企业A在决定自己产量的时候，会预期到自己决定的产量对企业B的影响。正是在考虑到这种影响的情况下，企业A制定了一个对自己最有利的产量，然后企业B再在此基础上做自身的产量决策。斯塔克尔伯格模型更好地体现了“理性人的直接相互作用”。博弈的魅力就在于每个人在做决策的时候，必须考虑对手的反应（甚至反应的反应的反应），并把该反应（甚至反应的反应的反应）作为决策的依据之一。

20世纪40年代以前，对寡头市场的分析并不是经济学家们关注的重点，博弈论更多地为数学家所研究，经济学家则忙于关注那只“看不见的手”，争论它的有效或失灵，期待着政府对市场的干预让经济从大萧条中走出来。从经济学自身的演变看，当消费者和生产者面对的是完全竞争市场时，博弈论并没有用武之地。每个行为主体要做的只是在给定价格和自身状况的条件下，选择自己的决策变量，以使自己的利益最大化，最后的均衡结果让那只“看不见的手”来完成。在此，别人的行为选择是一只“黑箱”，你看到的只是他们选择后所最终呈现的结果，那就是谁也没有力量改变的各物品的市场价格，它们作为一个参数摆在每个人的面前。至于你的选择也仅仅是你自己的选择，既不会对价格产生影响，更不会对他人的行为产生影响。如果说有影响，那也是微不足道的，并且是间接的，是通过价格机制来实现的。

总之，在20世纪40年代之前，博弈论尚处于萌芽阶段，还没有建立起一套可以称之为理论的东西。虽然，用以构建该理论的数学工具早已成熟，但是对该理论的广泛的现实需求还没有产生。西方社会的知识界还没有感受到对该理论的强烈现实需要。

二、理论的诞生与发展

20世纪40年代以后，情况才发生了重大的变化。一方面，两次世界大战都是大国之间的博弈，战争的胜负决定了成千上万人的性命和人类的前途。另一方面，小生产者之间的充分竞争被大企业之间的寡头竞争所替代，很多行业的市场集中度不断提高。企业之间直接的相互作用取代了间接的以价格为机制的相互作用。在数学家和经济学家的持续努力和共同合作下，博弈理论横空出世，这就是数学家冯•诺依曼和经济学家摩根斯坦在1944年合作出版的《博弈论和经济行为》一书。该书的出版标志着博弈论经典学科体系的诞生，“博弈”一词从此超越了下棋和玩牌之类的益智游戏，而泛指的互动条件下的策略选择。有人称之为这是20世纪最伟大的科学成就之一。

第三章术语解读

一、博弈的术语

每个博弈（game）都是基于一组规则展开，这组规则包括以下内容：

（1）“谁”在参与—一组参与者（players）；

（2）可以利用哪些信息（information），采取何种行动（action）；

（3）可以何种方式参与—每个参与者所采取的策略（strategies）；

（4）参与者会得到（或失去）多少—损益（payoff）；

（5）最后的结局（outcome）如何—是否达到某种均衡（equilibrium）。

术语详解

1.参与人（players）：理性选择的主体。

2.信息（information）：参与者有关博弈的知识。“知己知彼，百战不殆”。

3.行动（action）：参与者能够选择的变量。

4.策略（strategies）：参与者在行动之前所准备好的一套完整的行动方案（预案）。

具有以下三种特点：（1）完整性（2）多样性（3）不可观察性

例如：人不犯我，我不犯人；人若犯我，我必犯人。

策略是博弈论中最核心的概念之一，因此博弈论也被称为“策略思维”。策略是指参与者在行动之前所准备好的一套完整的行动方案（预案）。通俗地说，就是在行动之前就先想好，一旦遇见什么情况，准备采取什么行动。如在“人不犯我，我不犯人；人若犯我，我必犯人”的策略中，人和我是博弈的参与者，犯与不犯是行动，对方是否来犯是我所得到的信息，如果对方来犯了我该怎么办，如果对方没有来犯我该怎么办，便是策略。由此可见，在整个博弈的过程中，策略建立起了从信息到行动的关系，即参与者首先选择的是策略，然后才是根据最新的信息（如对方是否已经来犯）作出行动的选择。有了策略，意味着建立了从信息到行动的快速反应机制，从而能够以最快的速度作出行动选择。不难想象，在瞬息万变的现代战争中，策略显得尤为重要。

策略不同于行动，行动是具体的做法，策略是对行动的预想，因此，行动是可观察的，策略却是不可观察的。你可以看到对方怎么做，但是不一定了解对方是怎么想的。

好的策略是建立在对于可见事实的洞察与不可见变数的预见之上的。我们往往面临很多问题、很多事实、很多信息，但是对那些现象之间的联系以及何为关键联系，决定了能否精炼出有效的策略。我们需要对于未来最有可能的变化元素以及影响变化的条件因素的趋向进行预测与模拟，预备是形成策略应变能力的基本心理要求。在百米竞技中，必须先有一个预备的动作要求，以实现枪响后的快速启动，并导致抢跑事件的频频发生。一般来说，策略依托四个相关的认识论要素：多种多样的知识与经验，丰富和全面的想象力，出奇甚至超强的联系构建能力，合理地在现实条件下梳理与过滤策略可操作性的能力。如果把博弈理解为人与人之间的比拼，那么运筹帷幄的能力决定了千里之外的胜负！

5.损益（payoff）：参与者的得与失。

6.结局（outcome）：所有参与者选择各自策略后的结果。

在一个博弈中，结局会有很多个，如果是指策略的组合，那么，N个参与者，每个人有M个策略，则总共有（N-1）×M×M个可能的结局。

7.均衡（equilibrium）：所有参与者的最优策略组合。

均衡是指所有博弈参与者的最优策略组合。它是特指某类结局，在该类结局中，参与者已经无法通过改变自身的策略（及其行为）选择来增加收益（效用）。基于纳什对博弈论的巨大贡献，我们在博弈论的分析中经常把均衡称之为纳什均衡。纳什均衡的含义就是：给定你的策略，我的策略就是对我而言的最好策略（或之一）；给定我的策略，你的策略也是对你来说是最好的策略（或之一），即双方在对方给定的策略下已经没有积极性调整自己已选的策略。换言之，这是一种“没有人愿意偏离”的状态，因为缺乏偏离的激励，因此，只要约束条件不变，均衡的状态就不会变。由此可见，均衡是一种相对稳固的状态，但也因此会出现所谓的“现状的暴政”（tyranny of the status quo），即维持现状已成为一种常态或习惯，它的力量非常强大，以至于改变现状往往很难。这就不难理解，为什么改革需要理由，不改革却不需要任何理由。如果你想推动一个组织的变革，请先找好一个能够打动人的理由。因此，改革往往需要强有力的推动力。也因此，很多社会改革往往是由危机推动的。

均衡是我们唯一能够认知的状态。并没有所谓的“均衡”和“非均衡”的区别，只有某个均衡持续时间的差异。证券交易过程中的每个成交价都是一个均衡价格。直到被新的买卖力量所打破。

8.博弈的规则（rules of the game）：参与者、行动和结果合起来称为博弈的规则。

9.博弈论（game theory）：是一种研究人们怎么做策略（行动）选择及其最后的均衡结果会是什么的理论。

附录《三十六计》

第一套胜战计

处于绝对优势地位之计谋。君御臣、大国御小国之术也。亢龙有悔。

胜战计包括：第一计瞒天过海、第二计围魏救赵、第三计借刀杀人、第四计以逸待劳、第五计趁火打劫、第六计声东击西

第二套敌战计

处于势均力敌态势之计谋。或跃于渊。

敌战计包括：第七计无中生有、第八计暗度陈仓、第九计隔岸观火、第十计笑里藏刀、第十一计李代桃僵、第十二计顺手牵羊。

第三套攻战计

处于进攻态势之计谋。飞龙在天。

攻战计包括：第十三计打草惊蛇、第十四计借尸还魂、第十五计调虎离山、第十六计欲擒故纵、第十七计抛砖引玉、第十八计擒贼擒王。

第四套混战计

处于不分敌友、军阀混战态势之计谋。见龙在野。

混战计包括：第十九计釜底抽薪、第二十计混水摸鱼、第二十一计金蝉脱壳、第二十二计关门捉贼、第二十三计远交近攻、第二十四计假道伐虢。

第五套并战计

对付友军反为敌态势之计谋。终日乾乾。

并战计包括：第二十五计偷梁换柱、第二十六计指桑骂槐、第二十七计假痴不癫、第二十八计上屋抽梯、第二十九计树上开花、第三十计反客为主。

第六套败战计

处于败军态势之计谋，潜龙勿用。

败战计包括：第三十一计美人计、第三十二计空城计、第三十三计反间计、第三十四计苦肉计、第三十五计连环计、第三十六计走为上计。

二、博弈的分类

1.合作博弈和非合作博弈

博弈可以有很多种分类。如果按照博弈参与者是否能够达成一种具有约束力的协议来区分，可以分为合作博弈（cooperative solution）和非合作博弈（noncooperative solution）。合作博弈是指参与者能够达成一种具有约束力的协议，在协议范围内选择有利于双方的策略，譬如企业间的联合定价等。非合作博弈是指参与者无法达成这样一种协议，在该博弈中，参与人需要解决的问题是：“当其他参与者会对自己的策略选择作出最优反应时，我的最优策略选择是什么？”

本书所介绍的博弈一般是指非合作博弈。需要指出的是，非合作博弈不是说参与者之间一定不能合作或不会合作，而是说可以不合作。不难理解，如果每个参与人都发现合作比不合作要好时，是会选择合作的。何乐而不为？

2.静态博弈和动态博弈

如果按照博弈参与者作出策略或行动有无先后顺序来区分，博弈可以分为静态博弈和动态博弈。静态博弈是指在博弈中，参与者同时选择，或虽非同时选择，但后行动者并不知道先行动者采取了什么具体行动（虽然在物理时间上不是同时的，但是在逻辑时间上是同时的）；动态博弈是指在博弈中，参与者的行动有先后顺序，且后行动者能够观察到先行动者的行动。通俗地理解：像“石头剪子布”、罚点球（一攻一守）、投标活动之类是同时决策的，属于静态博弈；像棋牌类游戏、拍卖等决策（行动）是有先后次序的，属于动态博弈。

3.完全信息博弈与不完全信息博弈

如果按照博弈参与者对其他参与者的了解程度来区分，博弈可以分为完全信息博弈（games of complete information）和不完全信息博弈（games of incomplete information）。完全信息博弈是指在博弈过程中，每个参与者对其他参与者的类型、策略空间及损益函数有准确的信息。如果参与者对其他参与者的类型、策略空间及损益函数的信息了解得不够准确，或者不是对所有参与者的类型、策略空间及损益函数都有准确的信息，在这种情况下进行的博弈就是不完全信息博弈。更通俗地说，不完全信息博弈是指总有一些信息不是所有参与者都知道的。反之，如果每个参与者所了解到的信息是一样多的，那么就是完全信息博弈。生活中常常会出现信息不对称的现象，譬如假药、假烟、假酒就是生产商或经销商利用消费者缺乏对产品信息的充分了解而采取的欺骗行为。

如果将静态博弈与动态博弈、完全信息与不完全信息这两种分类进行组合，就会出现四种更为具体的博弈类型，它们分别是完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈、不完全信息动态博弈。与上述四种博弈相对应的均衡概念分别为：纳什均衡（Nash equilibrium）、子博弈精炼纳什均衡（subgame perfect Nash equilibrium）、贝叶斯纳什均衡（Bayesian Nash equilibrium）、精炼贝叶斯纳什均衡（perfect Bayesian Nash equilibrium）。

以上四类博弈，最容易分析的是完全信息静态博弈，其次是完全信息动态博弈，然后是不完全信息静态博弈，而最难分析的是不完全信息动态博弈。

在动态博弈中，由于行动有先后顺序，后行动者可以通过观察先行动者的行动，获得有关先行动者的信息，从而证实或修正自己对先行动者的判断。在不完全信息动态博弈中，一开始参与者根据其他参与者的不同类型及其所属类型的概率分布，建立自己的初步判断（信念）。当博弈开始后，该参与者就可以根据他所观察到的其他参与者的实际行动，来不断肯定或修正自己的初步判断，并根据这种不断变化的判断，选择对自己最有利的策略。

虽然现实中的博弈绝大多数是不完全信息动态博弈，但是本书中所涉及的博弈，还是以完全信息静态博弈为主，一则方便读者对博弈的理解，二则为笔者下本书的写作留下足够的空间。

4.零和博弈与非零和博弈

从博弈结果看，博弈分为零和博弈和非零和博弈。零和博弈是指博弈前的损益总和与博弈后的损益总和相等，博弈过程只是损益在不同博弈者之间的重新分配。在日常生活中，下棋、打牌以及赌博通常是零和博弈，即你所失去或得到的和对方得到或失去的是一样的。非零和博弈是博弈后的损益大于（或小于）博弈前的损益总和。

非零和博弈根据总和的正负又可分为“正和博弈”和“负和博弈”两种。正和博弈是指博弈双方的利益都有所增加，或者一方的利益有所增加，而另一方的利益不受损害，或者一方利益的增加超过了另一方利益的损失，因而整个社会的利益将有所增加。一般而言，市场经济中的交易行为是一种典型的正和博弈，每个人自由选择所需，作出对其而言边际收益大于边际成本的策略（行动），从而增加了每个人的收益水平，产生了大于零的社会利益，是一种最为典型的共赢合作的博弈关系。也正是基于此，市场经济制度创造了巨大的人类财富。

负和博弈，是指参与者博弈之后损益总和小于零的博弈，既可以是参与者都有不同程度的损失，也可以是一方的损失大于另一方的收益。

负和博弈最大的特点就是即便有人从中赚钱，也是参与者中的少数人。在负和博弈中，如何选择与多数人不同的策略就变得十分重要。股神巴菲特曾言，别人恐惧的时候你贪婪，别人贪婪的时候你恐惧，就是这个意思。

博弈论还可以按其他的方法来分类，比如：以博弈进行的次数或者持续长短可以分为有限博弈和无限博弈；以表现形式也可以分为一般型（策略型）或者展开型等。

老师提示：不玩负和游戏，少玩零和游戏，多玩正和游戏！

三、公共危机中的策略

第二讲基本假设

理性假设

特别提示

1.人虽然不是完全理性的（有限理性），但是一定不能被认为是完全非理性的。

2.愿意吃亏，与那些比你更愿意吃亏的人做朋友。

3.笑容让人类更容易建立合作关系。学会微笑，会让你受益匪浅。

4.顾客需要的不是便宜，而是感觉占到了便宜。（双十一）

5.如果不给对方您的两利让其相权，那么对方就很可能会把您的一利和他人的一利相权，从而离您而去。（多做选择题，少做判断题）

6.选择的窍门：

①让对方在2个或3个里面做选择。

②给对方的几个选项必须有明显区别。

参照要掌握在自己的手里

愿意吃亏，与那些比你更愿意吃亏的人做朋友===>不是为了占别人便宜，而是为了建立长期合作关系

结合科斯定理，更改利益分配方式

合作的信号很重要，可以引起更多的合作

7.在信息不对称的情况下，有时候博弈的结果不取决于大家是怎么想的，而取决于大家认为大家是怎么想的。

“打倒齐奥塞斯库（罗马尼亚共产党总书记）”就是一种共识。

附录锚定效应

行为经济学中的锚定效应是指人们在做决策时受到已知的信息或参考点的影响，导致他们作出的决策偏离理性预期。锚定效应在决策过程中起到了引导和影响人们判断的作用，并且往往会使人们对问题的认知产生偏差。

例如，当人们在购买商品时看到原价标签之后打折的价格，他们往往会认为这是一个很划算的交易，以至于可能会忽略掉自己对商品实际价值的认知。这种现象就是锚定效应在消费决策中的体现。

因此，行为经济学研究了这种行为背后的心理机制，并试图通过了解人们在决策中的错误倾向，帮助人们更好地做出理性的选择。

共同知识（common knowledge）假设

指各参与者在无穷递归意义上均知悉的事实。即每个人知道事件E，每个人知道每个人知道事件E，每个人知道每个人知道每个人知道事件E–一直到无穷层次。

我知道了，你知道了。我知道你知道了，你知道我知道了。我知道你知道我知道了…以致无穷递归。

特别提示：

达成共识是一件非常困难的事情。

未达成时，会造成一些误会。坦然面对。

第四章基本假设

任何一种理论都会有自己的理论基础或假设前提。了解这些基本假设是理论学习的第二步。只有你我之间对这些基本假设达成了共识，我们关于博弈的探讨才有了共同的基础，否则只能是“鸡同鸭讲”。本章首先介绍博弈论对参与者的第一个假设：理性人假设，然后再介绍第二个假设：共同知识假设。对于“假设”，你可以认为这是理论对现实的一种抽象，也可以理解为这是理论家对现实的一种信念，当然也可以理解为这就只是一种“假设”而已，当不了真的。

一、理性假设

“理性人假设”（hypothesis of rational man）是博弈论的基本理论假设或前提。它包含两层含义：第一是认知的理性，通俗地说，人是自我利益的判断者，只有他自己知道什么是他的最爱；第二是行为的理性，通俗地说，人是自我利益的追求者（行为者），在各种条件许可的情况下，他一定会选择自己的最爱。如果说，认知的理性是指“青菜萝卜，各有所爱”的话，那么行为的理性就是指“青菜萝卜，各有所选”。换言之，在博弈中，假设参与者都是理性的，每一方都能在决策时充分考虑到他当前面临的局势，也会顾及对方的行动对自己造成的影响与后果，根据各种推测选择使自己利益最大化的策略。

人的理性，可以理解为是对人类活动的抽象和总结，试图揭示各类现象背后的动因。正是基于对人的理性这一假设，才使得博弈论能够作为一门学科得以建立。如果你一定要问：“人真的是理性的吗？”博弈论的回答是：“是的，是这么假定的。”可以肯定的是，如果人是非理性的，人人都是精神病患者，那么所有的社会和社会科学都无法建立。如果你还要问：“人的理性从何而来？”我的回答是：“这是人类几百万年生存进化的结果！你只要想想你的周围有几个精神病患者能够有机会结婚生子，就一定会同意我的答案。”

对人的理性假设一种普遍批评认为，把人都看做是“经济人”，认为“人是自私的”或“利己的”，而事实上人是有情感的，人是社会的和道德的，人间处处充满着无私的爱，这其实是对博弈论的一种误解。博弈论只是假设人人都有自己的偏好，并依据自己的偏好作出选择。至于每个人的偏好是什么，并没有进行更多的限定。由此，理性的人既可能追求财富（金钱）的最大化，也可能追求财富以外的东西，如名声、荣誉、地位、公正、快乐等，哪怕会为此付出金钱的代价。一个人从纯利他中得到的快乐和从纯利己中得到的快乐，在博弈论看来并没有本质的区别。

二、共同知识假设

所谓共同知识（common knowledge），是指各参与者在无穷递归意义上均知悉的事实。即每个人知道事件E，每个人知道每个人知道事件E，每个人知道每个人知道每个人知道事件E……一直到无穷层次。这是博弈论中一个限制性极强的假定。

在博弈中，一般假设参与者已经就两方面内容达成了共识：一是对参与者的“理性”达成了共识，即：（1）A和B是理性的；（2）A知道B是理性的，B也知道A是理性的；（3）A知道“B知道他（A）是理性的”，B也知道“A知道他（B）是理性的”。如此循环无尽。二是对博弈的规则达成了共识，即：（1）A和B都知道博弈的规则；（2）A知道B知道博弈的规则，B也知道A知道博弈的规则；（3）A知道“B知道他知道博弈的规则”，B也知道“A知道他知道博弈的规则”。如此循环无尽。

共同知识对博弈论来说意义重大。奥曼强调：共同知识假设成为所有博弈理论和许多经济理论的基础。无论讨论的是什么模型，模型本身必须被假设为共同知识，否则模型就不能被充分地构建，并且分析也就不连贯了。共同知识奠定了人们对未来合理预期的可能性。试想，当人们的知识背景越来越脱离常识，人们的行为就越来越难以被预期。

例子：

1.永远完不成的任务

2.“黑脸”之谜

3.银行挤兑

下面的例子说明，即便大家都知道银行里缺钱不一定会发生经济危机，只有当银行缺钱成为共同知识以后，才会发生金融危机。

20世纪最大的一次经济萧条始于1929年10月24日。那天是星期四，天阴得非常厉害，纽约的证券市场崩溃了。其间经过几上几下，最后证券价格在1933年跌落到1929年那令人炫目的水平的六分之一。证券市场的崩溃固然重要，但它并不是萧条的开始。企业活动在1929年8月，即证券市场崩溃前两个月就已达到了其顶峰，到10月时已经大大减少。崩溃反映了经济困难的不断增加，反映了无法维持的投机活动的破产。当然，一旦发生崩溃，它就会在企业界人士和其他曾对新时代的到来寄予无限希望的人们中间散布疑虑。它使消费者和企业经营者都不愿花钱，而希望增加他们的流动储备以备急需。

直到1930年秋天，收缩虽然严重，但还没有发生银行业的困难或向银行挤兑的情况。当中西部和南部一系列银行倒闭破坏了人们对银行的信心并使人们广泛地想把存款变成通货时，衰退的性质就发生了剧烈的变化。银行倒闭的浪潮最后蔓延到了美国的金融中心纽约。

1930年12月11日是个非常关键的日子，那一天美国银行关了门。这是直到那时为止美国历史上倒闭的最大一家商业银行。此外，虽然它是一家普通的商业银行，它的名称却使国内外许多人误认为它是官方银行，因而它的倒闭对信心的打击特别严重。

美国银行是一家殷实的银行。尽管它是在萧条最严重的几年里被清算的，但最后还是为每1美元存款偿付了92.5美分。无疑，如果它当时能挺住，储户一分钱也不会损失的。

美国银行关门对它的所有人和储户来说都是悲剧。两个所有人受到审讯，据说违反了法律而被判处徒刑。储户的钱虽然最后得到了绝大部分偿还，但却被扣押了好多年。对于整个国家来说，其后果更为深远。全国各地的存款人担心他们存款的安全，加入了早先已经开始的零星的挤兑活动。银行成批倒闭，仅1930年12月一个月，就有352家银行倒闭。

如果没有建立联邦储备系统，那么当发生挤兑风潮时，毫无疑问，银行会采取1907年采取过的措施，即限制付款，这种限制会比1930年最后几个月实际实行的要严厉得多。但是它会防止银行储备金的流失，很可能会防止后来1931、1932和1933年的银行大倒闭，正如1907年的限制很快就制止了当时的银行倒闭扩散。的确，如果真是那样，美国银行也许会重新开业，就像聂克波克信托公司在1908年那样。恐慌过去，信心恢复，经济很可能在1931年年初就开始复苏，就像在1908年年初那样。

联邦储备系统的存在阻止了银行采取这种激烈的治疗措施：直接原因是大银行的担心减少了，它们相信向联邦储备系统借钱可以使它们克服可能发生的困难，事实证明它们错了；间接原因是整个社会特别是银行界相信，现在有联邦储备系统对付挤兑风潮，再也不需要采取这种严厉的措施了。

联邦储备系统本来可以提供好得多的解决办法，比如在公开市场上大规模买进政府公债，这将为银行提供额外的现金以应付它们储户的要求。这会制止大批银行倒闭，至少是急剧减少倒闭的银行数目，防止公众把存款换成通货，从而不致使货币数量减少。不幸的是，联邦储备系统犹豫不决，采取的行动很少。总的来说，它是袖手旁观的，听凭危机自由发展—在后来的两年中，它一再重复这种行动方式。

20世纪30年代的金融危机告诉我们：

（1）几乎所有的银行都无法抵御储户们的挤兑。

（2）储户是否挤兑，取决于对其他储户的预期。

（3）金融危机不在于金融是否真的出现危机，不在于大家是否认为金融是“危机”的，而在于是否对金融危机（无论是真危机还是假危机）达成了共识。

（4）信息的传播速度和信息交换的自由度对于共识的达成起到至关重要的作用。

（5）个体如何在均衡跳跃之前抢先一步而动，取决于个体对变化的敏感性。

（6）先知先觉者吃肉、后知后觉者喝汤、不知不觉者买单。

4.数字游戏

第三讲囚犯困境和破解之道

囚犯困境

占优策略：

是指无论其他参与者采取什么策略，某参与者采用该策略的结果都优于其他策略。

占优策略均衡：

是指由博弈中的所有参与者的占优策略组合所构成的均衡。

参照囚徒困境，在无法信任彼此的情况下，坦白是各自的占优策略。

特别提示：

很多时候均衡的结果跟事实真相没有关系。

游戏规则决定游戏的结局。

2.囚犯困境的定义及原因分析

囚徒困境的原因分析：

表面上看，囚犯对自身利益的追求是导致囚犯困境的原因，

其实，真正的原因是：囚犯们在追求自身利益的同时，以更多的损害他人利益为代价。

君子爱财，取之以道

囚犯困境的根本原因在于：私人成本与社会成本的差异，即个人行为的负外部性。

负外部性，也称外部成本或外部不经济，是指一个人的行为或企业的行为影响了其他人或企业，使之支付了额外的成本费用，但后者又无法获得相应补偿的现象。或是对交易双方之外的第三者所带来的未在价格中得以反映的成本费用。

例如：汽车废气，对车本身是好的，但是对于他人而言是烟雾。

相反的，还有正外部性。

例如：修复历史建筑

特别提示：

损人利已和损己利人本质上是一样的，是一个硬币的正反两面；从一方面来看是损己利人的行为，在另一方来看是损人利已的行为，问题的关键是所损（失）的部分和所利（得）的部分哪个更多。

盗窃与抢劫，一线之隔。

如果有一种制度，在该制度下，每个人都只能通过利人才能实现利己的目标，这一定是一种好的制度。（市场的逻辑）

真实世界中的囚犯困境

① 经济大萧条；

② 价格战（货比三家）；

③ 独裁与多数人的懦弱；

④ 民主与多数人的暴政（民主必须与法治（不是法制）相辅相成，才能避免多数人的暴政。法治：rule of law；法制：rule by law）

附录大跃进游戏规则和大饥荒

【234期】曹树基：大饥荒：1959-1961的中国人口

2010年3月23日13：30-15：00，在复旦大学经济学院710会议室，来自上海交通大学历史系的曹树基教授做了题为“大饥荒：1959-1961年的中国人口”的讲座。报告由复旦大学中国经济研究中心陈钊教授和范子英博士共同主持，章元副教授、吴建峰博士以及经济学院的部分学生参加了此次讲座。

关于1959-1961年中国人口的非正常死亡，有关研究非常之多，但是中国政府至今没有公布三年大饥荒中人口死亡的确切数据，学者们推测或估计得出的结论相差很大。曹树基教授首先对现有的研究进行了简短的说明与评论，并指出，中国政府公布的历年人口增长率和死亡率数据，需要得到地方数据的配合或支撑才能更具说服力。也就是说，只有将研究深入到省以下的政区，才有可能做到这一点，通过对区域死亡人口的认真求证，全国性的人口死亡数据才有坚实的基础。但是区域人口研究的过程更加复杂，需要考虑的因素也更多。有鉴于此，曹树基教授对现有研究方法进行了一些可行的修正，将其应用到省以下的区域研究当中去。

由于1953－1982年间中国县级政区有巨大变化，因此曹树基教授采用清代的“府”级单位作为分析的基本政区。这一方法目前在国内同类研究中尚属先例。他以1953年、1964年人口普查数据为基础，利用地方志所载资料求出各府灾前、灾后的人口增长速度，确定各府的灾前、灾后人口，藉此再求出各府非正常死亡人口。曹树基教授将人口普查资料和地方志资料配合应用，最大限度地消除了误差，尽可能精确地求出了大饥荒造成的各府人口损失，并藉此求得各省非正常死亡人口，进而求得全国非正常死亡人口。最后曹树基教授利用求得的全国各省非正常死亡人数和当地人均粮食产量进行回归，发现二者相关关系及其微弱，也就是说目前流行的关于大饥荒原因解释的“天灾”之说可能并不可靠。

注：上海交通大學歷史系曹樹基著有《大饑荒 1959-1961 年的中國人口》一书。

附录政治运动

据有关杂志中的一遍文章统计,历次运动排列如下:

1950年——清匪、反霸、减租、退押运动。镇压反革命运动(此项运动一直到1953年结束)。

1951年——爱国捐献运动。“三反”运动,即反贪污、反浪费、反官僚主义(1952年结束)运动。“土地改革”运动(1950年至迟1951年,全国范围内开展了“土地改革”运动,1952年底至1953年春对“土改”进行了复查)。

1952年——“五反”运动,即反行贿、反偷税漏税、反盗窃国家财产、反偷工减料、反盗窃国家经济情报运动。

1953年——“新三反”运动,即反官僚主义、反命令主义、反违法乱纪运动。

1954年——“一化三改造”运动,即一化是逐步实现社会主义工业化,这是总路线的主体；三改造即逐步实现对农业、手工业和资本主义工商业的社会主义改造(也叫过渡时期总路线)。

1955年——农业合作化运动。

1956年——肃反运动,即肃清一切暗藏反革命分子运动。

1957年——整风运动和反右斗争。社会主义教育运动。

1958年——大跃进运动。人民公社运动。爱国卫生运动,即除四害(老鼠、苍蝇、蚊子、麻雀)为中心的运动。放卫星运动。拔白旗运动。

1959年——反右倾运动。

1960年——反瞒产私分运动。新三反运动。即在财贸系统开展反对分散主义、反对投机倒把、反对贪污盗窃运动。

1961年——整风整社运动。

1962年——机关整风运动,即在反对分散主义、本位主义、多占多吃和商品走后门的运动。

1963年——新“五反”运动,即开展反对贪污盗窃、反对投机倒把、反对铺张浪费、反对分散主义、反对官僚主义运动。小“四清”运动,即在农村开展社会主义教育运动试点。

1964年——四清运动,即在城乡开展以清政治、清经济、清思想、清组织为中心的社会教育运动。

1965年——农业学大寨运动。

1966年——文化大革命。红卫兵运动。

1967年——夺权。三支两军,即由军队进入地方进行“支左、支工、支农、军管、军训”的运动。

1968年——上山下乡运动。1969年——学“红宝书”运动。

1970年——一打三反运动,即打击现行反革命、反贪污盗窃、反投机倒把、反铺张浪费为中心的运动。

1971年——一批双清运动,即批极左分子、清理五一六分子、清理三老会(老红军、老干部、老党员)成员。批陈整风运动,即批判陈伯达的运动。

1972年——批林整风运动,即批判林彪的运动。延续至1973年。

1974年——批林批孔运动。1976年——反击右倾翻案风运动。

1977年——揭批“四人帮”。工业学大庆运动。

1978年——开始平反冤假错案(1984年结束)。开展“实践是检验真理的唯一标准”的大讨论。

如何破解囚犯困境？

1 如何利用他人的囚犯困境

① 货比三家 –选择最优价格

② 分而治之 –保有权力

2 如何破解囚犯困境

① 道德教化（文化建设）

社会学基本定理

金迪斯（H. Gintis）：如果一个社会都是由自利主义者构成的，那么，长期而言，这个社会将消亡。而如果一个社会，通过“说服教育”以及其他说教机构的努力，长期保持一定比例的利他主义者，它就能够稳定地繁衍下去。（（罗森塞蜈蚣博弈（Rosenthsal，1981）））

② 财产私有（制度建设）

圈地运动（土地70年产权） <–> 人民公社的消亡（两个相反的案例）

③ 温故知新

让历史告诉未来（重复博弈）

特别提问：

1.你愿意被搭便车吗？

2.搭便车后，你愿意给对方费用吗？

3.如何让别人愿意和你合作？

第五章囚犯困境及原因

1776年，亚当•斯密在其《国民财富的性质和原因研究》一书中指出：“每个人改善自身境况的一致的、经常的、不断的努力是社会财富、国民财富和私人财富所赖以产生的重大因素。”为了说明这一点，他还特别指出：“我们每天所需的食品和饮料，不是出自屠户、酿酒家或烙面师的恩惠，而是出于他们自利的打算。”此外，他进一步指出：“每个个人通常既不打算促进公共的利益，也不知道自己是在什么程度上促进了那种利益——他受着一只看不见的手的指导，去尽力达到一个并非他本意想达到的目的。”这就是被后人广为流传的“看不见的手”，以此比喻协调社会资源配置的市场运行机制。基于对市场运行机制的深刻洞察，斯密提出了他自由放任的政策主张。然而，人们不禁要问，每个人的自利选择，一定能够达成对双方来说最好的结局吗？本章给出了一种类型的反例——囚犯困境。在一定的条件下，每个人的自利选择，却带来了对双方来说最差的结局。

一、囚犯困境的来源

1950年5月，斯坦福大学心理学系请塔克给大家作一个有关博弈论方面的报告。在作报告时，塔克想到了威廉斯告诉他的那个博弈实验，并把它乔装打扮了一番，以便更符合听众的知识背景。这就是后来广为流传的“囚犯困境”。塔克后来写信告诉威廉斯，在演讲中，他是这样说的：“两个被指共同犯罪的人被警察分别关押着。每个人都被告知：①如果一个人招供而另一个人不招供，前者将被授以奖金，后者将被处以罚金；②如果两个人都招供，两个人都要被处以罚金；③两个人都有充足的理由相信，如果两个人都不招供，两个人都将无罪释放。”

这个关于囚犯的杜撰例子，经过几十年的传播和修改后，现在基本上是以下面的例子呈献的：

两个小偷（也称为“囚犯”）一起去盗窃，结果很不幸，被警察逮了个正着。然后，警察在两个独立的不能互通信息的审讯室里分别对这两个小偷进行审讯。在这种情形下，两个小偷都可以作出自己的选择：选择坦白，供述以往的犯罪事实（即与警察合作，从而背叛他的同伙），或者选择抗拒，保持沉默（也就是与他的同伙合作，而不是与警察合作）。这两个囚犯都知道，如果他俩都能保持抗拒的话，警察只能以本次的犯罪事实定罪，判少量的徒刑，两人都坐0.5年牢。警察为了激励他们招供，就对他们说：如果他们中的一个人坦白，即告发他的同伙，那么他就可以被当场释放。而他的同伙则被加重处罚，坐5年牢（坦白从宽、抗拒从严）。当然，如果这两个人都选择招供、互相背叛的话，就会按照以往的犯罪事实来定罪，即两人都坐3年牢，既不会被奖励，也不会被加重处罚。

在“囚犯困境”中，囚犯们的最佳结果是双方都选择抗拒，但（抗拒，抗拒）不是占优策略均衡，（坦白，坦白）才是占优策略均衡，对每个囚犯来说，无论对方是否坦白，自己选择坦白都是占优策略，但这个均衡结果对囚犯们来说却是最坏的结局。

在此需要给读者解释一下的是，所谓的占优策略，是指无论其他参与者采取什么策略，某参与者采用该策略的结果都优于其他策略。占优策略均衡则是指：由博弈中的所有参与者的占优策略组合所构成的均衡就是占优策略均衡。

该均衡结局并不会因为囚犯们事先口头约定了被抓住后不坦白而改变。我们甚至不妨将条件放宽，允许囚犯A和B在审讯室里一起单独待上10分钟，然后再让他们决定是否坦白。很明显，双方交流的主旨就是建立攻守同盟，克服自利心理，甚至可能订立一个口头协议，要求双方都不去坦白。然后，双方再单独被提审。我们不妨设想囚犯A的心理，他一定会认为，如果囚犯B遵守约定的话，则自己坦白就可获得自由；如果囚犯B不遵守约定的话，若选择抗拒就会被判坐更长时间的牢，因此也应该选择坦白。也就是说，无论对方是否遵守约定，自己不遵守约定都是最好的选择。特别是囚犯A认为囚犯B也会有跟他同样的想法，也会选择坦白时，更不会有单独背叛对方的道德负担。事实上，双方并不能依靠简单的沟通或约定而摆脱困境。恋人们在恋爱中海誓山盟，最终还是会分手；企业之间相互沟通信誓旦旦，价格战仍然会爆发；美苏（俄）两国经常会晤，甚至签订核不扩散条约，但军费一年高过一年……这些现象都反映了上面所说明的问题。

进一步看，如果两个囚犯确实是第一次偷东西，他们会不会坦白说，他们以前还偷了很多东西？人们的第一反应是：不会！然而，我们要告诉你的是：会！多年前，中央电视台曾经播放过一个案例，3个小伙子被控轮奸一名未满14周岁的少女，经审讯，3个小伙子都坦白了各自的犯罪事实。判决后，省高院因案件存在一些疑点，发回重审，最后真相大白，这竟然是个假案、冤案。如果把囚犯的行动选择从坦白与否修改为说谎与否（谎报自己的犯罪事实），那么每个人都选择说谎，结果就成了占优策略均衡。

附录“大记忆恢复术”

二、囚犯困境的定义与原因分析

无论是收益对称博弈还是收益不对称博弈，囚犯困境告诉人们的是：我们原本可以有更好的结局，然而实际得到的却往往是最差的结局。

表面上看，囚犯对自身利益的追求是导致囚犯困境的原因，其实真正的原因是：囚犯们在追求自身利益的同时，以更多地损害对方的利益为代价。

以上分析给了我们一个非常重要的启示：损人利己和损己利人从本质上是一样的，是一个硬币的正反两面；从一方看来是损人利己的行为，在另一方看来就是损己利人的行为，问题的关键是所损（失）的部分和所利（得）的部分哪个更多。由此，我们可以理解为什么不应该倡导未成年人勇斗歹徒的行为，也可以理解人们为什么会强烈谴责那些见死不救的行为（特别是在肯定不会危及救人者生命的情况下）。

……

接下来，我们可以再举一个例子。从所得的角度看，偷盗得到的0.5元和抢劫得到的0.5元是一样的，然而，两者的量刑却相去甚远。如果是偷0.5元，够不上刑事立案的标准，要偷窃500元以上才会立案。如果是抢0.5元，就会被判若干年的徒刑。据《信息时报》报道，一个男子打劫毫无防御能力的小学生，虽然只到手了5毛钱，但依然构成抢劫罪，被广州市花都区法院判处有期徒刑4年，罚金1000元。据报道，20岁的李某是广东英德人，2006年3月29日中午12点多，他拿了一把自行车锁，来到花都区新华街某小学门口等候。这时，12岁的小仁和小明正有说有笑走出校门，守候在一旁的李某立刻冲到他们面前，将他们强行拉到学校门口左侧的一条小巷内。之后，他要求他们写家庭地址、入帮会及交20元入帮会费，否则就用锁头砸他们。两个小孩十分害怕，但因没有带钱，于是向李某求饶。李不相信，经过一番搜身后，只获取5毛钱，最后悻悻离去。事发后，两名小学生在老师和家长的陪同下报案，警方很快将李某抓获归案。

不难看出，盗窃案与抢劫案处罚力度的巨大差异，主要是基于两者不同的社会危害程度，即“损人”程度的不同；对于“损人”更大的行为，必须加大惩处力度。

第六章真实世界的囚犯困境

本章的重点是介绍囚犯困境在社会经济活动和现实生活中的广泛存在。无论是经济萧条还是环境恶化，价格大战还是交通拥堵，甚至老太太摔倒没人去扶，都是囚犯困境的真实写照。相信读者一定会感慨：“原来这也是囚犯困境啊！”

一、大萧条与凯恩斯革命

二、公地悲剧

如果说大萧条只是让更多的人找不到工作，囚犯困境只是那些干坏事的囚犯们的困境而已（对警察而言反而是福音），那么哈定所揭示的公地悲剧，肯定不会让人们觉得那只是牧民们的悲剧而已，这很容易让人们联想到人类作为整体的未来命运。其实，一个人的自利选择会产生负的外部性问题早就被学者们所研究与探讨，如庇古针对污染问题所提出的“庇古税”，科斯在1960年发表的《社会成本问题》就专门针对负外部性问题提出了自己的解决方案。但是，哈定不但用了一个吸引眼球的题目，并且发表在《科学》杂志上面，其所产生的效果与发表在专业的经济学杂志上的文章所产生的效果有很大的不同。后来的人们，一说起囚犯困境，最容易联想到的例子很可能就是公地悲剧。

公地悲剧的故事跟大萧条可谓异曲同工。大萧条是人们选择不做对别人有利的事情（消费或投资），因为对自己不利；而公地悲剧是人们选择做对别人有害的事情，因为对自己有利。多放牧一只羊的收益全部由自己获得，而由此带来的损失（牧场的退化）却由所有的牧民承担。当牧民放牧的规模较小时，多放牧并不会导致牧场的退化，而一旦规模扩大到一定程度后，最终将导致牧场的沙漠化。这类似于公路上的交通，上下班高峰导致公共道路严重拥堵，乃至整个交通的崩溃。

三、价格战

在“价格战”中，A、B两个企业的最佳结果是双方都选择不降价，但（不降价，不降价）不是占优策略均衡，（降价，降价）才是占优策略均衡（见表6.1）。这正是现实经济活动中发生许多价格战的原因所在。

在20世纪70年代初的第三次中东战争结束时，由于美国等西方国家在战争中帮助了以色列，代表主要石油输出国集团利益的国际石油卡特尔OPEC通过提高油价对西方进行惩罚。当时，这一行动导致美国油价暴涨。对于像美国这样一个建立在汽车轮子上的国家来说，油价上涨三倍，对其经济和社会的影响是十分巨大的。许多人排长队购买配给的汽油，一些工厂被迫减产甚至关闭，人们一片怨声载道。当时，麻省理工学院的一位经济学家在报上著文指出，油价暴涨不会持久，一段时间过去后油价会自然回落，而这段时间不会很长久。果不其然，当高企的油价持续不太长的时间后，就下跌到较低水平。这位经济学家有什么特别的本事能预测到这种结果呢？其实并无什么特别奥妙，他只不过是简单地运用了一下“囚犯困境”模型而已。OPEC是一个国际卡特尔组织，主要由沙特阿拉伯、伊朗、伊拉克、科威特、突尼斯、尼日利亚、突尼斯、委内瑞拉等12个主要石油生产和出口国组成。“囚犯困境”模型告诉我们，减少产量维持高价不是一个均衡的结果。OPEC中的不同国家间经济社会条件存在着很大差异，一些国家（如沙特阿拉伯、科威特等）经济实力较强，能承受因对西方的制裁而减少石油出口所带来的损失，但其他一些经济实力较弱的国家（如突尼斯、委内瑞拉等）就不能承受减少石油出口所带来的损失。这样，经济实力较弱的国家就有私下不遵守卡特尔共谋协议的动机而缺乏遵守协议的积极性。这些国家的政府就可能对民间石油出口的违反协议行为（如生产和出口的石油桶数超过了OPEC的规定）睁一只眼闭一只眼，而给定这种可能性，其他包括那些经济实力较强的成员国也就产生了违反卡特尔协议的动机。因为预期到某些成员国会违反协议，协议也就丧失了预期效力，而给定协议丧失效力，自我约束就不是最优选择；相反，此时的最优选择是抢在别人多销石油之前多销自己的石油。这样，无论是富国还是穷国，OPEC中各个成员都有私下违反协议而增加石油出口的动机。于是，卡特尔协议规定的共谋在不长的时间内就崩溃了，各个成员国未能按协议规定的上限出口石油，而是更多地生产并出口石油，造成原来制造的高企油价很快下跌。

四、枪打出头鸟

尤塞里安在约瑟夫•海勒的小说《第二十二条军规》当中的境遇同样是一种囚犯困境。故事的背景是：第二次世界大战胜利在望，可是为了给自己捞取功劳，一个飞行大队的指挥官没完没了地提高下属的任务定额，弄得所有人都人心惶惶。投弹手尤塞里安不想成为胜利前夕最后一批牺牲者，千方百计逃避执行任务。他的上级军官问：“可是，假如我方士兵都这么想呢（言下之意是“你不扛枪，我不扛枪，谁来保卫祖国，谁来保卫家”）？”尤塞里安答道：“那我若是不这么想，岂不就成了一个大傻瓜？”

还有一个类似的例子，在苏共第二十次代表大会上，赫鲁晓夫首次谴责斯大林的大清洗运动。他那充满戏剧性的讲话刚刚结束，听众里就有人大叫起来，质问赫鲁晓夫自己那个时候又在做什么。赫鲁晓夫的反应是请提问者站起来，报出自己的姓名。听众一片沉默。赫鲁晓夫答道：“当时我也是这么做的。”这正所谓“枪打出头鸟（只需一颗子弹），鸟儿不出头（哪怕一大群）”。

在一群人面对威胁或损失时，“第一个采取行动”的决定是很难作出的，因为它意味着行动者将为此付出惨重代价。独裁暴君怎样才能通过规模相对较小的军队长期控制数目很大的人群呢？整架飞机有众多乘客，为什么只要出现一个持枪劫机者就会显得无计可施，束手就擒？

在这两个例子里，只要大多数人同时采取行动，就很容易取得成功。不过，统一行动少不了沟通与合作，偏偏沟通与合作在这个时候变得非常困难，而压迫者由于深知群众的力量有多大，还会采取特殊的措施，阻挠他们进行沟通与合作。一旦人们不得不单独行动，希望聚沙成塔，集腋成裘，问题就出来了：“谁该第一个采取行动？”担当这个任务的领头人意味着要付出重大代价，甚至可能付出生命。他得到的回报则是死后的光荣或受人感激。确实有人在想到责任或荣誉的时候会感到热血沸腾，挺身而出，但大多数人还是认为这么做的代价超出了收益。

五、禁烟广告

1971年，在“禁烟运动”的声势下，美国国会通过了禁止在电视上做烟草广告的法律。令许多人奇怪的是，这一回财大气粗的烟草公司反应相当平静，并没有动用其庞大的社会资源和影响力阻止这项法律的通过。而且，后来的统计资料表明：尽管烟草广告因受到限制而减少，可是烟草公司的利润却提高了。

你是否知道烟草公司为什么不反对，甚至可能还欢迎这项法律？因为这个禁令使他们从“囚犯困境”中解放了出来。

烟草行业竞争激烈，为了争夺市场，各大烟草公司都必须大做广告。为此，它们每年都要花费巨额广告费用，这无疑降低了它们的利润水平。也就是说，如果烟草公司都不做广告，它们的利润反而更高。可是，如果其中一家公司不做广告，它的市场份额就会被其他公司抢走。这正是一个囚犯困境：你合作，对方不合作，你就吃亏了。在这种情况下，做广告就是优势策略。那么，烟草公司能否达成都不做广告的协议呢？不能，因为谁遵守协议，就很可能被对手耍弄。

现在好了，烟草公司做不到的，国家为它们做了：法律起到了协议的作用，而政府承担了监督的成本，借用过去的一句话说，是“起到了阶级敌人想起而起不到的作用”，烟草公司又何乐而不为呢？

六、排队与闯红灯

在“排队博弈”中，人们的最佳结果是双方都选择排队，但（排队，排队）不是占优策略均衡，（插队，插队）才是占优策略均衡（见表6.2）。所以，一辆公共汽车到站时，乘客们会一起往车上挤。电梯下来后，还没有等里面的人出来，外边的人就迫不及待地要往电梯里面挤了。

在“闯红灯博弈”中，人们的最佳结果是双方都选择不闯红灯，但（不闯，不闯）不是占优策略均衡，（闯，闯）才是占优策略均衡（见表6.3）。

七、民主与多数人的暴政

在社会学家冯刚教授看来，多数人的暴政是一种比任何君主专制都更危险的暴政。在欧洲或其他地方都存在过的专制实际上只拥有一种物质性的力量，即暴力手段；但多数人的暴政不仅拥有物质性的力量，而且拥有精神力量。以往的专制君主可以控制人民的行动，却很难有效地控制人民的思想，甚至阻止不了某些反对他的权威思想在民间或宫中秘密传播。多数人的暴政不仅能够影响人民的行动，而且能够有效地控制人民的思想，触及人们的灵魂。这对于一个敢说真话的人来说，几乎是无法躲避的灾难。

冯刚教授认为，多数人的权力，是一种诱惑人们堕落的权力。在专制政府的统治下，人们不得不屈从，那是因为他们无力或软弱，但是这并不是堕落，虽然是不幸。因此，在不得已的服从中仍然可以保持精神上的独立。在多数人的权力统治下，人们的心灵具有普遍堕落的趋势，不是说这时的人心比其他状况下更坏，而是因为这种多数的权力具有更大、更多的诱惑。

这就是一个民主政治必须解决的矛盾问题：一方面，一切权力的根源必须存在于多数的意志之中，否则就意味着恶；另一方面，“多数有权决定一切”意味着与其他专制主义同样的，甚至更大的恶。

只要有一个人被冤枉，则意味着所有人都可能被冤枉。只要一个人可以被随意地剥夺财产和生命，就意味着所有人都可能被随意地剥夺财产和生命。无论以什么名义，首先要考虑的是怎么才能保证每一个人都不会被冤枉，这是必须做到的底线。只有这样，才可能让所有人都能享有最大限度的安全，所有人才有免于恐惧的自由。

第七章如何破解囚犯困境

囚犯困境的存在可以让作为局外人的你从中获益，也会让作为局中人的你利益受损，因此，如何破解囚犯困境就是本章要着重分析的问题。本章先告诉读者如何利用他人的囚犯困境获益，再把探讨的重点放在人类该如何走出囚犯困境，这或许才是人们最为关心的问题。

一、如何利用他人的囚犯困境

囚犯困境对囚犯们而言当然是一种困境，而对警察而言，就是乐境了。那么，对你而言，如何能够利用别人的囚犯困境让自己获得更大的利益呢？

最常见的一种是你作为消费者货比三家，让商家给你报价，选最便宜的买。这样，商家就陷入了囚犯困境，给了你一个相对低的价格。特别是许多耐用消费品，消费者往往通过持币待购的方式逼迫厂家降价。航空公司和旅游公司在消费淡季的时候，也会陷入囚犯困境中，被消费者任意宰割。当然，在旺季的时候，两者的情况又反了过来，消费者之间的竞价让航空公司和旅游公司得到了好处。房地产行业也是如此，房子热卖的时候，开发商采用捂盘的方式导致购房人纷纷抢购；而房子销售形势不好时，开发商又纷纷采取打折等各种优惠措施来吸引人们购买。

二、如何破解囚犯困境

1.道德教化

初次接触囚犯困境的读者很容易去谴责小偷背信弃义、只顾自己利益的行为，并对最后的结局有一种幸灾乐祸的感觉。对囚犯困境的进一步思考，又让人们意识到囚犯困境不仅仅是囚犯的困境，而是整个人类面临的困境。如果人类不能把他人的利益纳入自己的损益函数中来，那么这个社会的前景是令人担忧的。金迪斯（H.Gintis）是桑塔菲学派的一位经济学家，在最近的一系列论文里论证了一个被叫作“社会学基本定理”的看法。他论证，如果一个社会都是由自利主义者构成的，那么，长期而言，这个社会将会消亡。而如果一个社会通过“说服教育”以及其他说教机构的努力，长期保持一定比例的利他主义者，它就能够稳定地繁衍下去。

所谓的“道德行为”，按照生物学家的看法，可以界定为“以降低个体自身的适存度为代价来提高群体的适存度”的行为。那么，长期演化的结果就是，那些最经常表现出道德行为的个体将因不断降低自身的适存度而逐渐消亡，只剩下那些比较不道德的个体。这是一种“劣币驱逐良币”的逆淘汰，最终将导致人类社会的毁灭。所以，为了维系社会，就需要通过其他方式来奖励道德行为，如设立“见义勇为”奖励基金，设立“中国道德模范”的评选与奖励制度等。

脑科学的研究告诉我们，创造性思维所激活的，恰恰是自我意识、他心理论和场景记忆这三种功能所在的脑区。另一方面，米德的研究告诉我们，自我意识（即“主我”，英文的“I”）是和他心想象（即“宾我”，英文的“me”）共生演化的。没有接触过他人的人，不可能有自我意识。另一些脑科学实验表明，受试者的自我意识中枢总是和他心想象的脑区同时被激活。这些实验只激活他们的自我意识而不要求受试者运用他心想象。但是，受试者自我意识被激活的同时，他心想象也被激活了。这意味着自我意识与他心想象的共生演化。

不难想象，如果通过道德教化，提高人们对他人利益的关心程度，培养出对一些基本道德准则的忠诚，那么囚犯们就可以避免相互背叛的困境。电影《长江7号》里周星驰饰演的父亲对儿子说（重复了3次）：“我们虽然穷，但是不能说谎，也不能打人；不是我们的东西，我们不能拿；要好好读书，长大要做个对社会有用的人。”就是教育儿子懂得做人的基本道理。如果对自身利益的追求会给他人带来更大的利益伤害，那么就应该选择“不做”。其实，在人类几千年的自我驯化过程中，人们已经建立了许多价值观和道德观，如不要偷盗、不要抢掠、不要杀人、自己活也让别人活。当然，人类的理性和道德也会同情那些确实为免于死亡而偷盗的行为。正如社会学家齐美尔所言：“如果没有我们所说的忠诚现象，社会就一刻也不能存在。维系社会的要素—社会成员的自利、建议、强制、理想、习性、责任感、爱、习惯—若失去了忠诚的补充，亦不能使社会免于分崩离析。”

2.财产私有

圈地运动使大批的农民和牧民失去了维持生计的土地，称之为血淋淋的“羊吃人”事件。然而，殊不知圈地运动的阵痛过后，英国人惊奇地发现，草场变好了，英国人整体的收益提高了。由于土地产权的确立，土地由公地变为私人领地的同时，拥有者对土地的管理效率更高了。为了长远利益，土地所有者会尽力保持草场的质量。同时，土地兼并后以户为单位的生产单元演化为大规模流水线生产，劳动效率大为提高。还有，圈地运动导致大量农村人口涌入城市，为英国的工业化提供了大量廉价劳动力，并为其后来的城市化提供了城市发展所需要的人口。英国正是从圈地运动开始，逐渐发展为“日不落帝国”。

3.温故知新

子曰：“温故而知新，可以为师矣。”无论是公地悲剧还是军备竞赛，如果人类不能从过去的历史中获得遥望未来的能力，那么每一代人都只能重复过去的故事。如何从过去总结教训、习得经验是人不同于其他动物的重要区别。今天的狮子与2000年前的狮子相比，在智力水平上并没有明显的变化，而今天的人与2000年前的人相比却有了智力上的巨大变化，因为我们通过符号记载了过去的历史，传承了过去的经验和教训，让我们不仅仅像狮子那样能从父辈那里习得生活的能力，还可以从2000多年前的孔子、孟子和孙子那里，学会做人做事的道理。

第四讲万元陷阱和智猪博弈

万元陷阱

一、万元陷阱现象

游戏：

现将10000元拍卖给大家，各位互相竞价，以100元为加价单位，直到没有人再加价为止。出价最高者以其所出价格获得该10000元钱，同时，出价第二高者将其所出价格的数量支付给我。请问：您的竞拍策略是什么？

这个游戏是耶鲁大学经济学家苏必克(M.Shubik)发明的，想拍卖钱的人几乎屡试不爽地从这拍卖会里‘赚到钱’。

它是一个具体而微的‘人生陷阱’，参与竞价的在这个‘陷阱’里越陷越深，不能自拔，最后都付出了痛苦的代价。

自古以来，人类为捕杀动物所设的‘陷阱’，有三个特征：

(1) 有一个明显的诱饵。

(2) 通往诱饵之路是单向的，可进不可出。

(3) 越想挣脱，就越陷越深

二、对万元陷阱的解释分析：

①沉没成本效应与路径依赖

路径依赖：习惯成自然，不能抛弃沉没成本

投资已经过半之后，如果要改变投资方向或暂停投资，都是一个颇为困难的事儿。

②社会心理学家泰格(A.Teger)对参加拍卖游戏的人加以分析，发现掉入“陷阱”的人通常有两个动机，一是经济（理性）的、一是非经济（感性）的。

经济动机包括：渴望赢得钞票、想赢回他的损失、想避免更多的损失。

非经济动机包括：渴望挽回面子、证明自己是最好的玩家以及处罚对手等。

三、万元陷阱现实中的例子：

1.两人（或多人）为了争夺一个位置，而给领导送礼。

2.征途案例

3％的高端玩家提供了《征途》70％的收入。有3万活跃玩家每个月在游戏中消费达几千万元。引诱这些玩家花钱，对史玉柱来说，是所有布局最关键的一步。

四、如何破解“万元陷阱”

心理学家鲁宾(J.E.Rubin)的建议是：

1.确立你投入的极限及预先的约定：譬如投资多少钱或多少时间

2.极限一经确立，就要坚持到底。（止损–止盈容易止损难！）

3.自己打定主意，不必看别人。

五、关于止损，老师举了两个例子：

①假设你花费20万买了两支10元一股的股票A和B各1万股，一个月后，股票A涨了2元钱，股票B亏了2元钱（即A赚了2万。B亏了2万），但本金还是20万元，实际并未亏损。这时候你需要一笔钱，必须要卖掉一部分股票，大多数人都会卖掉股票A，但实际上这是相当于纠正正确的，坚持错误的。

主要原因：贴现和损失敏感度有关的。

贴现：现在的和将来的同样面额的钱对人们来说价值不同。

作为管理者，下达任务要有截止日期，不然很容易被拖延。。。

结论：止盈容易止损难，人对亏损和盈利的敏感度不一样，对亏损会比盈利敏感得多。（损失厌恶）

②假设有人给你两个选择，一个是直接给你1万元钱，另一个是抛硬币决定，如果是正面给你2万，反面就不给，那么大多数人都会选择直接要一万元钱；

但是反过来，如果有人跟你要1万元钱，同样是两个选择，一个是直接给钱，另一个是抛硬币，正面给2万，反面不给，那么大多数人会选择抛硬币。

由此可以得出结论：正常情况下人们厌恶风险，但是一旦亏损后，就会偏向风险。

关于“万元陷阱”蒋文华老师的补充建议是：

学会止损，会让你活得更久！

既然事情已经发生，请坦然接受！

不要指望能够以很低的价格买入。（绞刑架，可竞争市场，抄底）

如果一定要竞争，尽快传递“势在必得”的信号。（破釜沉舟）

只争馒头不争气，没了馒头终断气。（务实）

馒头，可以理解为实力、能力、身体健康、对于垃圾人的忍耐等等。

高瞻远瞩，深谋远虑。（三思而后行）

六、关于万元陷阱的特别提示

1.每个人都有犯错的时候，请把注意力放在以后如何避免犯同样的错！

2.抢占成本的最低点，就是抢占竞争的制高点。

智猪博弈

第一节智猪博弈的模型：多劳不多得

在博弈论（Game Theory）经济学中，“智猪博弈”是一个著名的纳什均衡的例子。

假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽，另一头安装着控制猪食供应的按钮，按一下按钮会有10个单位的猪食进槽，但是谁按按钮就会首先付出2个单位的成本。

若大猪先到槽边，大小猪吃到食物的收益比是9∶1；同时到槽边，收益比是7∶3；小猪先到槽边，收益比是6∶4。

那么，在两头猪都有智慧的前提下，最终结果是小猪选择等待。

第二节智猪博弈的扩展

A为按按钮的成本。

(1) 当A≥10时，大猪小猪都选择不去按。

(2) 当6≤A<10时，双方都选择等待。

(3) 当1≤A<6时，小猪等待，大猪去按。

(4) 当A<1时，任一方去按的收益都大于0。

若干启发：

(1) 个体理性与集体理性相冲突，还是相一致，取决于制度安排（游戏规则）。

(2) 解决个体理性与集体理性之间的冲突不是靠否定个体理性，而是靠修改制度（游戏规则），从而在满足个体理性的基础上实现集体理性。

(3) 从智猪博弈中还可以发现，在A<10时，任一方去按都是集体理性的选择，而收入分配的不均将有助于减少个体理性与集体理性的冲突。

第三节智猪博弈的实例分析

(1) 山寨现象（盗版）

(2) 网络购物（参照先前卖家的评论，具有一定的可信度）

(3) 抄（复印）笔记

(4) 汽车定位系统（防盗贼）

(5) 好货不便宜，便宜没好货

第四节智猪博弈的特别提示

1.智猪博弈，是一个搭便车的博弈。一方付出了相应的代价，双方共享了所得到的利益。

2.搭便车的同时，别忘了给对方以回报。

3.富人愿意行善，离不开穷人的点赞。

4.能力越大，责任越大。

第八章万元陷阱

学会止损，会让我们活得更久！—蒋文华

人们认为我不会出错，这完全是一种误解。我坦率地说，对任何事情，我和其他人犯同样多的错误。不过，我的超人之处在于我能认识自己的错误。这便是成功的秘密。—［美］乔治•索罗斯

本章指引：如果我问你，你会花1万多元钱买我手里的这1万元钱吗？相信你的第一反应是：“你以为我傻啊？”然而，我要告诉你的是，这样的傻事每天都在发生。本章的内容就是要告诉你，在一定的游戏规则下，还真有人会这么傻！本章先对万元陷阱这个游戏的时代背景进行简单描述，然后通过假设举例的方式，逐步挖掘万元陷阱博弈的几大关键点与主要内涵，接着针对上述分析给予突围陷阱的相关建议。最后通过若干实例分析，让读者明白万元陷阱在社会生活中有着非常广泛的现实应用。

一、万元陷阱

1.万元陷阱的由来

初次接触万元陷阱的人，很难把它跟囚犯困境联系在一起，也很难理解人们会花1万多元钱去买1万元普通的人民币（不是10元面值的奥运币）。如果说，公地悲剧让人对人类的未来多了一份担忧，那么，对万元陷阱的深入思考，很可能让你对自己的未来和人类的未来多一份沮丧。且听我慢慢向你道来。

1950年，苏必克（M.Shubik）、纳什（Nash）、夏普利（L.Shapley）和豪斯纳共同发明了一种称为“大傻瓜”的扑克牌游戏。游戏中，参与者为了取胜，通常会选择背叛他的同盟者。结果人们在玩的时候，还挺当真的。有一对夫妻在玩了这个游戏后竟然相互生气，各自打车回家。这使苏必克想到了这么一个问题：是否存在一个让参与者共同沉溺其中不能自拔，最后两败俱伤的博弈？1971年苏必克以《美元拍卖游戏》为题，发表了研究论文。在游戏中，苏必克把1美元纸币作为拍品，当众拍卖，拍卖的规则是：出价最高的人获得拍品，出价第二高的人也要付出所出价格的款项。

苏必克在文章中报告说：“这个博弈的试验证明，可以以远远多于1美元的价格卖出一张1美元的纸币，总的拍卖收益在3～5美元之间是极普通的事情。”

2.何为万元陷阱

这时，你可能会问：“为什么不尽快结束这次竞拍呢，这样大家也不至于都落得如此悲惨的结局，而让庄家坐收渔翁之利？”但问题就在于谁先放弃加价。如果张三和李四都只从自身利益出发，又缺乏远见，那么竞价一开始，丰厚的收益足以诱惑他们不断加价。而当价格不断上升，可能面临的损失也不断上升时，大家可能都会抱着“如果加价，还有可能赢得收益，但放弃，就要面临很大的损失”这样的心态，但“驴也是这样想的”，于是加价不断继续，双方的损失继续加大。而到了“双双亏损”的时候，可能抱着继续加价亏损会少一些的想法，但“驴也是这样想的”，于是加价不断继续。而到最后双方损失都很大的时候，可能就已经心灰意冷，只为拼口气了。于是，竞价可能一直会玩到一个人宣布破产为止。这让人不禁感慨，这陷阱真是够深的啊！

3.对万元陷阱的深入分析

你是否认为，万元陷阱其实就是一个囚犯困境？你是否在现实世界找到了许多类似的陷阱？你是否想到了跳出陷阱的竞争策略？你是否感受到了万元陷阱带来的痛苦和绝望？

从苏必克的描述看，很多人都陷入了这个游戏所设置的陷阱中。通过前面的分析，相信你也能够感受到这一点。试想，自古以来人类为捕杀动物所设的“陷阱”，通常有下列三个特征：（1）有一个明显的诱饵；（2）通往诱饵之路是单向的，可进不可出；（3）越想挣脱，就会陷得越深。其实，这就是一个具体而微的“人生陷阱”，参与竞价的人在这个“陷阱”里越陷越深，不能自拔，最后都为此付出了痛苦的代价。

社会心理学家泰格（A.Teger）曾对参加拍卖游戏的人加以分析，结果发现掉入“陷阱”的人通常有两个动机：一是经济上的（理性的），一是人际关系上的（非理性的或感性的）。经济动机包括渴望赢得钞票、想赢回他的损失、想避免更多的损失；人际动机包括渴望挽回面子、证明自己是最好的玩家及处罚对手等。

心理学家鲁宾（J.E.Rubin）对此给出的建议是：（1）确立你投入的极限及预先的约定，譬如投资多少钱或多少时间。（2）极限一经确立，就要坚持到底：例如邀约异性，自我约定“一次被拒绝就放弃”，就不可在一次拒绝后改为“三次被拒绝才放弃”，三次被拒绝后改为“五次被拒绝才放弃”，最后在一棵树上吊死为止。再比如炒股，首先想好投多少钱，并在买入股票后设定你的止损价，一旦到了止损价就坚决认赔出局。这一点在熊市中显得尤为重要。据说狮子在捕捉羚羊时，一旦追赶的距离到了200米左右还没有成功，就会放弃追赶。其中的道理其实也挺简单的，因为狮子以爆发力见长，羚羊以耐力见长，狮子如果追了200米仍然追不上，那么此后追上的可能性会越来越小。如果恰好碰见了一只特别善于奔跑的羚羊，一只不懂得放弃的狮子将付出生命的代价。或许也可以认为，那些不懂得止损的狮子最后都死了（被生存竞争所淘汰），留下的狮子一定是懂得这个道理的。（3）自己打定主意，不必看别人。事实证明，当很多人一起等公共汽车的时候，如果公共汽车一直不来，你自己单独“脱身”打车回家的可能性要小于你一个人单独等车的可能性，因为你看到了“别人也在等”。人总会有很强的从众心理。这就是中国人常讲的“近朱者赤，近墨者黑”的道理。“孟母三迁”也是同样的道理。

4.不断提醒自己继续投入的代价

针对万元陷阱，笔者可以给出的补充建议是：

（1）参与者不要指望能够以很低的价格买入。笔者曾在很久以前的《读者》杂志看到一幅漫画，漫画中两个抢劫犯中的一个面对随时有可能把自己绞死的绞刑架，对他的同伴说：“要是这个世界上没有绞刑架，那该多好啊！”（言下之意是即便抢劫被抓住，也不会被绞死了）这时，他的同伴回答说：“你傻啊！如果没有绞刑架，那我们抢谁去啊！”（言下之意是别人都来抢我们了）在万元竞拍中，你不要指望花100元就能够得到那个10000元，天底下没有这么好的事情等着你。如果你出价100元，肯定会有人出200元跟你竞争的。如果你直接出9900元，看起来你即便得到了10000元，净收益也只有100元，而这恰恰是别人不会来与你竞争的根本原因。也就是说，你直接出9900元，在一般情况下别人是不会加价到10000元的。理由是：这样做对其没有任何好处，并且容易遭到你的报复（你肯定会加价到10100元，让对方损失10000元）。更何况你也只是从中得到了100元的好处而已，不至于引起对方的强烈嫉妒和垂涎。

（2）尽快传递“势在必得”的信号。如果在竞价的过程中，你已经开出了9900元的价格，而对方竟然加价到10000元，这时候你绝对不能加价到10100元与对方竞争。如果你加价到10100元，对方加价到10200元的可能性会非常大，因为对方加价到10000元，说明对方很可能不是傻子就是疯子，这个时候你该怎么办呢？一种选择是放弃，但是你肯定心有不甘，自己白白损失了9900元，对方却毫发无损。这里存在一个明显的悖论：如果你认定对方是傻子或疯子，你就应该选择放弃，因为只有傻子才跟傻子博弈，只有疯子才跟疯子博弈。如果你放弃，恰恰证明对方不傻也不疯，他竟然如此聪明，知道你会放弃。如果你继续加价，也证明对方不傻也不疯，只是嫉妒心在作怪，而你竟然比他还傻！因为只有傻瓜才会继续加价。在此，给你的忠告是，如果你决定继续加价，那就拿出破釜沉舟、势在必得的行动，直接从9900元加价到19900元。如果对方还要加价，就选择放弃！虽然你比之前损失更多，但至少你也让对方付出了巨大的代价，这多少也算是一种安慰吧。当然，这会有一个很让人困惑的问题：为什么理性的人反而吃亏了呢？越是理性的人，越会早早放弃竞价，越是吃亏；反之，装疯卖傻的人获得了更多的利益或付出了较小的损失。试想，如果有人在马路上横冲直撞地开车，你只能选择避让。你要相信如果对方一直这么开车，总有一天会车毁人亡。

（3）只争馒头不争气，没了馒头终断气。常见的说法是“不争馒头争口气”，“人活一张脸、树活一张皮”，这容易导致人们在博弈的时候选择意气用事。殊不知，“冲动是魔鬼”。2013年6月5日中央电视台《今日说法》栏目就曾以《女人、啤酒和匕首》为题报道过这么一件事情。……这件事清楚地告诉我们，遇事一定要冷静，千万不能意气用事，特别是当我们面临损失（吃亏）的时候，更要忍耐与克制。在中国，荧屏上有一些有关暴力题材的影视节目，主人公动不动就以命相搏，不惜致对方以死地。耳濡目染下，很容易让人既不珍惜自己的生命，也不珍惜他人的生命。上述案例中，杀人者龚剑锋之所以再次开车返回，就是一种不肯吃亏的心理在作怪，最后让彼此双方的损失都进一步扩大，酿成了无法挽回的悲剧后果。

（4）建立愿意与他人共享的声誉。万元陷阱利用了人们相互竞争的心理。人们总是希望比对方赢得多，或者想办法比对方输得少。如果能够转变心态，看到对方获利自己也高兴，就不容易掉入这个陷阱中去了。更进一步，如果竞争者预期你的获利能够为大家所共享，那么双方掉入陷阱的可能性就更会大大减少。新东方创始人俞敏洪在北京大学读本科的时候，天天给宿舍里的同学打水，如果有一天宿舍里没有水了，同学就会问：“俞敏洪，你怎么没去打水？”1983年俞敏洪创立新东方，1995年到美国、加拿大去寻找合作者（主要是他在国外的北大同学）。一些同学们跟着他回到了北京，但同学们给了他一个十分意外的理由：“俞敏洪，我们回来是冲着你过去为我们打了4年的水。我们知道，你有这样一种精神，所以你有饭吃，肯定不会给我们粥喝！”

（5）高瞻远瞩，深谋远虑。不要只关注今天和明天，还要关注后天。中国人习惯说“男怕入错行、女怕嫁错郎”，原因就在于选择的不可逆性。所以，我们经常要“三思而后行”！

选择对手比选择博弈的策略还要重要！进一步来说：选择市场比选择市场的竞争策略还要重要！幸福婚姻的关键首先是选对人！

二、实例分析

1.网络游戏《征途》

没有对手就没有打斗，没有争强好胜，谁还刻苦练级，花钱买装备？游戏商赚不到钱，玩家也会觉得没意思。

笔者评论：为了实现网络世界中的天下无双，有人不惜倾家荡产；正如为了实现武林盟主的人生理想，有人不惜去练“葵花宝典”。人应该懂得现实世界与虚拟世界的区别。电影《盗梦空间》（Inception）中的主人公“盗梦者”道姆•柯布（莱昂纳多•迪卡普里奥饰）对他的妻子“魅影”梅尔（玛丽昂•歌迪亚饰）说的一句台词就是：“If you jump，I will not jump with you.”（如果你跳下去，我是不会跟你跳下去的）。不同于《泰坦尼克》中的“you jump，I jump.” （如果你跳，我也会跟着跳）。人总是要活在现实中。当一个男人有了自己的孩子，还有年迈的父亲，他的身上就多了一份责任，不能轻易地说放手就放手。反观影片中的妻子梅尔，却把之前夫妻双方所构建的梦境当成了真实世界，只想着和道姆•柯布永远厮守在梦境中，不能自拔。

人总会有追求，追求什么？以什么方式追求？这才区分出人与人的不同。所以，每个人都必须经常问问自己：什么才是你真正想要的生活？什么才是你真正应该过的生活？

2.竞技体育

如果说网络世界中的谁与争锋让你觉得多少有些不可理喻，那么现实生活中的竞技体育同样会让你觉得唏嘘不已。2004年和2005年连续两届北京国际马拉松赛过程中，均发生了相似的一幕：选手猝死。如此雷同的猝死事件，加上以往时有耳闻的运动员猝死事件，人们不禁疑问：跑步原本只是为了健身，为何要为此付出生命的代价？

……

从上面的访谈中，我们看到了一个更为立体的张尚武，也可读出他身上诸多的无可奈何。其实，在竞技体育下生存的体育人，从一开始就在玩万元陷阱的游戏。为了争夺金牌，他们从小就开始了大量的训练，为此家长投入大量培养费用，孩子花费大量时间刻苦训练。如果中途退出，前期的投入将变成沉没成本，重要的是孩子也无法再像正常孩子一样学习，因此只得选择继续训练，而继续则意味着更多的时间投入与伤病风险，于是就在这陷阱中越陷越深。金牌毕竟是少数，因此对于大多数运动员来说，没有学历和谋生技能，又带着一身伤病的他们，退役后迅速跌落为社会的弱势和边缘人群。2003年，据媒体报道，曾在中国举重史上创造了40个全国冠军、20个亚洲冠军的“亚洲第一力士”才力，在贫病交加中死去；前国脚唐全顺，因赌球被拘。

……

竞技体育在很多时候就是一个典型的万元陷阱。随着人们收入水平的提高，越来越多的人已经意识到了这一点。2001年的一项调查表明，高收入家庭不愿意孩子从事运动训练的比例高达77.8%，中等收入家庭为74.6%，低收入家庭也达69.8%。在不支持原因的调查中，64.3%的家庭是怕影响孩子的文化学习。

……

人总是要死的，或重于泰山，或轻于鸿毛；或流芳百世，或遗臭万年，或默默无闻。所有你已经付出的时间和精力，就是你的沉没成本。只要有了沉没成本，就会有万元陷阱，你也就被套牢了！死亡才是个体解套的方式。很多时候，我们总觉得是在和别人博弈，其实，真正的对手是你自己！

3.行贿受贿

如果说网络游戏只是沉迷于此的玩家们的万元陷阱，竞技体育只是专业运动员的万元陷阱，那么下面的案例就是你我都可能遇见的万元陷阱了。

……

故事背后的事实我们不得而知，可能确实是陈姓职工“送”得更多，因此他子女“顶职”一事最后得以尘埃落定。类似于这样的行贿事件其实就是行贿人之间在进行万元陷阱的游戏，彼此间竞价的是“顶职”，然后通过不断向权利人行贿以期获得最后的胜利，最后行贿最多者“顶职”成功，其他行贿人只得“人财两空”。

其实在日常生活中，大多数的行贿人都是在玩万元陷阱的游戏。如机关里有一个副局长的职位正在竞争上岗，为得到这块“肥肉”，大家纷纷向局长送礼、表示心意，而且一旦听说谁送得更多、更好了，便立即加码打点，实现赶超。当然，“驴也是这么想的”，于是在相互追逐中，大家送的礼越来越大，砸的钱也越来越多。最后，胜利者感慨万分，这“肥肉”真当来之不易，以后必须得靠它弥补先前损失，这就为下一次别人的万元陷阱游戏做好了铺垫。失利者则唏嘘不已，砸的钱已然“一江春水向东流”，而且新副局长可能还会记恨他们这些曾经的竞争者，真当是“赔了夫人又折兵”。

由此可见，行贿人最大的痛楚可能不是“砸钱才能办事”，而是“钱砸了，事没办成”，更甚者是“钱砸了，事没办成，而且还被举报了”。这是一个“人生陷阱”，一旦进入，便会欲罢不能，而且越挣扎，陷得越深，因此不能轻易进入。

行贿本身就是一种社会祸害，对于广大民众来说，“不行贿，能办事”才是最优的社会状态。在该状态下，行贿中的万元陷阱也就不复存在了，因此，我们亟须完善当前的法律法规来改善这一现状。有人提出：“中国应立即修改法律法规，主动举报的行贿人可不定罪，还要给予奖励，这将使受贿人不敢再受贿，办事需行贿的社会风气可能会得到很大改善。”

第九章智猪博弈

相信很多人都有搭顺风车或被搭顺风车的经历。坐享其成的现象可谓比比皆是，智猪博弈模型就是对这类现象的一种理论总结与分析。本章首先介绍“智猪博弈”的经典案例，并点出该博弈的核心与内涵。然后对案例中的模型进行扩展分析，提出一些新的思路和策略。最后通过对一些现实案例的介绍，挖掘生活中的智猪博弈。

一、智猪博弈（Boxed Pigs）

猪圈里有两只猪，一只大，一只小。在猪圈的一头有猪食槽，另一头安装着控制猪食供应的按钮，按一下按钮会有10个单位的猪食进槽，但是按按钮以后跑到食槽所需要付出的“成本”，是消耗相当于2个单位的猪食。如果两只猪同时按按钮，再一起跑过去吃，大猪能吃到7个单位，小猪能吃到3个单位，减去劳动耗费各自2个单位，大猪净得益5个单位，小猪净得益1个单位。如果大猪按按钮，小猪等着先吃，大猪再赶过去吃，则大猪吃到6个单位，去掉按按钮的劳动耗费2个单位净得4个单位，小猪也吃到4个单位。如果小猪按按钮，大猪等着先吃，则大猪吃到9个单位，小猪吃到1个单位，再减去按按钮的劳动耗费，小猪是净亏损1个单位。如果大家都等待，结果是都吃不到。

对于大猪而言，如果小猪按，自己就应选择等；如果小猪等，自己就应选择按。对于小猪而言，如果大猪按，自己应选择等；如果大猪等，自己仍然应选择等。换句话说，无论大猪是按还是等，对于小猪来说“等”都比按好（“等”是占优策略，“按”是占劣策略）。那么，在小猪一定会等的条件下，大猪的选择应是按。博弈的均衡结局是：（大猪按，小猪等）或（4，4）。在此，大猪付出了按按钮的代价，却只得到和小猪一样的收益。真可谓“多劳不多得”。或许大猪感到有点愤愤不平：“活都是我干的，小猪却吃的跟我一样多。”小猪的回答是：“你不按拉倒，我又没有叫你去按！”

智猪博弈其实是一个搭便车的博弈。一方付出了相应的代价，双方共享所得到的收益。

二、智猪博弈的扩展

启示：个体理性与集体理性是相互矛盾与冲突，还是相一致，取决于制度安排（游戏规则）本身。解决个体理性与集体理性之间的冲突不是靠否定个体理性，而是靠修改制度（游戏规则），从而在满足个体理性的基础上实现集体理性。从智猪博弈中还可以发现，在A＜10时，任何一方去按都是集体理性的选择，而收入分配的不均将有助于减少个体理性与集体理性的冲突。从这一角度看，让一部分人先富起来有助于帮助未富的人们。

三、实例分析

1.山寨现象

2.网络购物

“好货不便宜，便宜没好货”。这是因为不懂行的人搭了懂行人的便车。

3.校园探头

第五讲懦夫博弈和性别战

第一节懦夫博弈（Chicken Game）

懦夫博弈也叫“斗鸡博弈”。两只公鸡狭路相逢，即将展开一场战斗。结果有四种可能：一种是两只公鸡都选择进攻，互相厮杀，那么最后的结果则是两败俱伤，假设双方此时的收益均为-3；一种是两只公鸡都退了下来，那么它们俩都相安无事，假设收益均为0；另外两种结果是一只公鸡选择了进攻，另一只公鸡选择了退让，那么进攻的公鸡赢得了足够的面子，收益为1，而退让的公鸡输掉了面子，但是却没有受伤，所以收益为-1。

均衡点是要么是A进B退，要么是A退B进。

本质上是一种竞争的关系。

第二节鹰鸽博弈

当A>C时，老鹰-老鹰是纳什均衡。

当A<C时，老鹰策略的概率是 a=A/C。

各自的期望收益=Ax（1-A/C）

两点推论：

1.A增加，对双方有好处么？

引申：奖励要适度，过犹不及。

eg：一等奖学金，由1000元增加到600万元时，可能会引起奖学金的质变。

不仅仅依靠成绩，还会出现找关系、搞破坏等行为的出现。

2.C增加，对双方有好处么？（分母变小，理论上是有好处的）

引申：核恐怖带来的恰恰是核安全。

人的理性其实是从试错中慢慢总结出来的

第三节实例分析

一、路权之争

二、谁打电话

三、责任分散效应

第四节公共物品的提供

（1）公共物品的特点

非排他性（谁都可以使用）

非竞争性（一个使用者对该物品的消费并不减少它对其他使用者的供应）

（2）谁来提供

1.囚犯困境（政府提供）

2.智猪博弈（能者多劳）

3.斗鸡博弈

类似例子（本质上都是竞争关系）

1.停车占位（协调机制）

2.升官发财（选拔机制）

3.找工作（招聘管理）

4.抢市场（竞争机制）

5.填志愿（录取机制）

第五节来自懦夫博弈的特别提示

1.赢者通吃的行业，容易出现过度竞争（winner-take-all）。

类似二八现象，20%的人、企业手中占领了80%的份额、资源、收入。

赢者通吃的行业，是能够低成本复制的行业，包括：运动员（大家只记得第一名，而不记得第二名）、搜索引擎（谷歌）

非赢者通吃的行业：教育业（线下）、手机（Android&iOS）

2.竞技体育很多时候就是个万元陷阱，除非它本身就能给你带来快乐！

马拉松比赛中，时有耳闻的运动员猝死事件。原本是为了健身，反而为此付出了生命的代价。

2014年的北京马拉松，PM2.5超过300，空气重度污染，依然有万人万台人肺除霾机上街跑步。

3.奥运会就是一帮最需要运动的人在观看一帮最需要休息的人在剧烈运动。

第五节性别战的基本模型

在博弈中，双方存在一定的共同利益，但是具有共同利益的不同结果又有着相对冲突的偏好。

比如：夫妻两人都宁愿在一起看同一个电视节目，而不愿意分开各自看各自喜欢的电视节目；但是给定大家看同一个节目，夫妻两人又各自偏好于能够看自己喜欢的节目。

这个博弈有两个均衡结果：（足球赛，足球赛）和（偶像剧，偶像剧），但双方各自会有偏爱的一个均衡，譬如丈夫偏爱（足球赛，足球赛）均衡，而妻子偏爱（偶像剧，偶像剧）均衡。该博弈的另一个典型特征是：如果对方一意坚持，则顺从对方比与对方抗争要好，即如果对方坚决选择自己喜欢的节目，那么顺从至少可以得到1单位效用，而抗争则只能得到0单位效用。这与现实中的情况是一致的，夫妻双方一方坚持己见的时候，另一方常常会迁就一些，作出让步。

其实，性别战的名字很容易误导人，它事实上并不能说是一种对抗，而更多的是具有共同利益的参与者在两个相当理性的纳什均衡之间进行选择，从而使双方都能达到同样的结局。这其实比较像不存在灾难情况下的“斗鸡博弈”，但与“斗鸡博弈”的一个很重要的差异是，在性别战中，两个纳什均衡是在左上方和右下方，正好是对角，这就意味双方是相互依存的选择而不是完全对立的选择。而“斗鸡博弈”的两个均衡在左下方和右上方，正好也是对角，但是双方是你死我亡的对抗关系。

这样的博弈结构与囚徒困境、智猪博弈、纯协调博弈、斗鸡博弈的结构都完全不一样。

书中的例子有语言博弈、左行还是右行、麦琪的礼物。

麦琪的礼物的故事估计大家已是耳熟能详，故事的结尾令人感动，但男女主人公彼此间的“错过”更令人惋惜。其实，这就是典型的信息不完全下的性别战，在缺乏信息沟通的情况下，当双方都只为对方考虑时，就出现了总收益最差的结局。其实，这样的例子在生活中也比比皆是，譬如周末你有一份的重要文件要交到同事手里，但情急之下忘记约定在哪里会面，这时双方又都无法马上联系到对方。在此情况下，如果都为对方考虑，你亲自到同事家去送文件，同事却又亲自来你家拿文件，那结局就是彼此错过，事情未能办成，两人都是“好心办了坏事”。因此，在这类博弈中，即在缺乏信息沟通的情况下，都为自己着想反而比都为别人着想要好。试想，如果你和同事都待在家里等对方，虽然任务未能完成，但双方至少没有白费精力各跑一趟。

第六节实例分析

类似例子（本质上是合作关系），而斗鸡（懦夫）博弈本质是竞争关系

1.约会

2.恋爱与结婚

3.聚餐（要么都去，要么都不去）

4.通讯（MSN）

我用，你不用，那就没办法交流。你用，我用，大家用，才能长期用。

5.语言（世界语）

扩展分析：

a、农户的产品选择（规模与合作）

在市场容量以内种一样的是有规模经济的（合作关系），如果超过容量以后一起种，效率会下降，应分开种不同的（竞争关系）

b、休假制度（团聚与旅游）

c、有效需求（长尾理论，余额宝、快手）

长尾理论：降低成本后，有更多的需求能得到满足

d、盲人摸象与知识生产

每个人的经验都有其自己的局限性，以至于在判断和思考问题的时候会从自身先前的经验出发去思考。合作突破局限。

第七节均衡的存在性和多重性

1.均衡的存在性定理

每一个有限博弈至少存在一个纳什均衡（纯战略的或混合战略的）（纳什，1950）

2.均衡的多重性

聚点均衡–谢林点

谢林点（英语：Schelling point，又译为薛林点，或称为聚焦点），是博弈论中人们在没有沟通的情况下的选择倾向，做出这一选择可能因为它看起来自然、特别、或者与选择者有关。

这一概念是由美国诺贝尔奖获得者托马斯·谢林Thomas Schelling于1960年在《冲突的策略》一书中提出的。

聚点均衡的例子

1、文化、历史（接人）

2、道德（出门）

让列宁先走

让领导先走！克拉玛依大火

3、法律（右行、斑马线）

特别提示：

法律不被信仰，形同虚设！

第十章懦夫博弈

第一节懦夫博弈（Chicken Game）

懦夫博弈也叫“斗鸡博弈”。两只公鸡狭路相逢，即将展开一场战斗。结果有四种可能：一种是两只公鸡都选择进攻，互相厮杀，那么最后的结果则是两败俱伤，假设双方此时的收益均为-10；一种是两只公鸡都退了下来，那么它们俩都相安无事，假设收益均为5；另外两种结果是一只公鸡选择了进攻，另一只公鸡选择了退让，那么进攻的公鸡赢得了足够的面子，收益为10，而退让的公鸡输掉了面子，但是却没有受伤，所以收益为0。

……

无论如何，在这个博弈中可以肯定的是，如果一方态度强硬、不计后果，那么另一方选择后退就是一个理性的选择。这就意味着，在这样的博弈中，要想取胜，就要在气势上压倒对方，至少要显示出破釜沉舟、背水一战的决心来，以迫使对方退却。也就是说，在这样的博弈中，鲁莽、非理性、非理智形象的人往往能够取得胜利。譬如，在过独木桥时，那种看上去不把自己的生命当回事的人，或者看上去有点醉醺醺、傻乎乎的人，往往能逼退独木桥上的另一人。笔者在自己所在小区就亲眼见过这么一件小事，印象深刻。在小区内的单行道有人逆向行驶，与另一辆正向行驶的车相遇，结果逆向行驶的车死活不肯退让，甚至选择弃车走人。最后的结果是，正向行驶的驾驶员选择退让后从另外的大门开走。如果这种懦夫博弈是重复博弈，那么冒险选择向前而成功的参与者就更有信心在将来再次采取这种策略，其所树立的粗暴形象将使得对手在未来的对抗中害怕两败俱伤，使其从中获得收益。

第二节实例分析

1.路权之争

一连串发生于人行横道即斑马线的交通事故，使很多人感到震惊：俗称“安全线”的斑马线，为何越来越成夺命虎口？

其实，当行人过斑马线时，就在与车主发生懦夫博弈，其均衡结果是行人让、车主过，或是行人过、车主让。该博弈的一个特点是，当双方都选择不让时，所预期带来的损失非常之大，行人可能将付出生命的代价，而车主则是巨大的道德谴责、财产损失，甚至牢狱之灾。那为什么还会发生如此多的惨案呢？

笔者通过观察发现，与法律要求的在斑马线司机应该减速慢行相反，一些车主快到斑马线时选择的是鸣笛且加速。一方面由于时间成本太高，时间就是金钱，而且一旦让行人先过，后面可能还有源源不断的人；另一方面，鸣笛和提速可以吓一吓过马路的人，叫他们让道。而行人抢着过马路，不是不怕危险，而是车子太多，长长一串，头尾相接，如果不“见缝插针”，半天都过不去。这样一来，车主和行人大多都不会退让，最后一桩桩悲剧也就不断酿成。这背后还有一个更重要的原因是，博弈双方都不确定对方会采取哪种策略，那还不如先发制人，当自己选择“强硬”后，对方的选择只能是“退后”。然而，“驴也是这么想的”，当车主和行人同时产生这种想法时，悲剧也就发生了。

因此，当博弈中出现两个或两个以上纳什均衡时，双方的行动也就变得进退两难，困境就会发生。这时，参与者之间就需要达成一个共识，那“共识”可以通过什么方式产生呢？

……

以上两个案例的初衷是，让车主提前知道行人的选择，从而避免双方都先发制人，即达成“行人先行，车让路”的共识，但遗憾的是，两种尝试均以失败告终。失败最重要的原因在于，这种共识是一次性的，即只发生在行人举牌的时候，如果到了下一个路口，没有行人举牌时，车主依旧会理性地选择先发制人。同样，行人下次不举牌了，仍然很有可能会被车撞。而举牌本身的成本很高，不可能在世界上所有的斑马线前都放上足够多的谦让牌，即使实现了也不可能保证所有的路人都能用、会用或者想用这牌子。因此，该措施的制定本身都存在很多问题，并不能从根本上解决斑马线前的问题。

其实，“共识”达成的最好方式还是通过制度措施的建立，只有普及性强、具有强制力的制度保障，才能使“共识”发挥实效。一个较好的例子是，杭州的公交车斑马线前礼让措施的设立。当前，杭州公交车在斑马线前礼让现象已经在全国声名鹊起，杭州的行人常常能感受到公交车给予的温暖。这其实应当归功于杭州公交集团采取的严格、严密的制度，它要求司机在斑马线前见人必让，让必彻底。同时，还加大了检查考核力度。该措施颁布以来，每天有多辆巡视车以及数百位一线管理人员在各主要路段现场检查。公交司机不让行，一旦在检查中被发现，就意味着拿不到每月300元的安全行车奖励，还要扣3分。公交车司机之所以愿意遵守这个规定，也和礼让行人所带来的时间损失更多地由乘客承担有关。乘客从心理上愿意承担时间损失又和公交车的乘客下车后就是成为被礼让的行人有关（公交车的乘客与行人的重合度会比较高）。该措施至少达成了一个共识：行人与公交车进行懦夫博弈时，均衡点是“公交车让行，行人过路”。公交车让行还给私家车主带来一种榜样的力量，带动了绝大多数车主选择了主动让行。

2.粗暴之利

20世纪70年代，在通用食品公司与宝洁公司的斗争中，通用食品公司就凭借其鲁莽和粗暴而获得了斗争的胜利。当时美国通用食品公司和宝洁公司都生产非速溶性咖啡，通用食品公司的Maxwell House咖啡占据了美国东部43%的市场，宝洁公司的Floger咖啡的销售额则在西部领先。1971年，宝洁公司在俄亥俄州打广告试图扩大东部市场，通用食品公司就立即增加了俄亥俄地区的广告投入并大幅度降价，Maxwell House咖啡的价格甚至低过了成本，通用食品公司在该地区的利润率从降价前的30%降到了降价后的-30%。在宝洁公司放弃在该地区的努力后，通用食品公司也就降低了在该地区的广告投入并提升了价格，将利润恢复到了降价前的水平。后来，宝洁公司在两家公司共同占领市场的中西城市杨斯顿增加广告并降价，试图将通用食品公司逼出该地区市场。作为报复，通用食品公司则在堪萨斯地区降价。几个回合后，通用公司树立了一个粗暴的报复者形象，这实际上向其他企业传递了一个信号：谁要跟我争夺市场，我就跟谁同归于尽。于是在以后的岁月中，几乎没有公司再试图与通用食品公司争夺市场。

由此可见，通用公司一直在用这种自杀式的报复行为树立粗暴者的形象，在懦夫博弈中一直表现出强者的姿态，先发制人，从而使对手感到害怕而退避三舍。

刑讯逼供一直被人们所批评，殊不知很多时候警察建立起一种粗暴的形象，会让其对犯罪嫌疑人的审讯变得相对容易。因为一个犯罪嫌疑人如果预期警察在审讯中会胡作非为，甚至会因为他的不招供置其于死地，那么，犯罪嫌疑人选择招供的可能性就会大大提高。从某种意义上说，审讯就是比谁更狠。

3.谁打电话

生活中常常会遇到这样的情况，电话打了一半忽然断线了，这时谁应该先打电话过去呢？

那么，到底谁应该先打电话呢？这时，“共识”非常重要。很多时候，“共识”就是一些约定俗成的规则。譬如，一般来说，原来打电话的一方再次负责打电话，而原来接电话的一方则继续等待电话铃响。这么做的好处是原来打电话的一方知道另一方的电话号码，反过来却未必是这样。另一种约定是，假如一方可以免费打电话，而另一方不可以，那么，拥有免费电话的一方应该负责第二次打电话。还有一种比较通常的约定是，由较热切的一方来打电话，如恋爱中的男女遇到这种情况，通常是由主动追求者来打电话。公司员工给客户打电话时遇到这种情况，通常是员工主动打给客户。

4.责任分散效应

现实生活中，当发生你做可以，我做也可以的时候，就会发生没有人做的现象，也就是责任分散效应。

1964年3月13日凌晨3时，在美国纽约，29岁的酒吧经理凯蒂•吉诺维斯小姐（Kitty Genovese，1935—1964）驾车驶向自己在纽约皇后区的家，那是一个中产阶级的居住区。大约3∶15左右，她将自己的红色轿车停在了住处附近的一个停车场，转身走向自己的寓所。刚走几步，一个叫温斯顿•莫斯里（Winston Moseley）的男人走上来袭击并用刀刺中了她。凯蒂大声呼救，附近一个住户的灯亮了，一个男人打开了窗户向歹徒大喊：“放开她！”歹徒看看他，耸耸肩走开了。凯蒂小姐踉跄着往回走，邻居的灯熄灭了。此时，袭击者又转回来再次刺中了她，凯蒂再次大声呼叫。这一次，许多附近住户的灯都亮了。袭击者回到自己的轿车里跑掉了，可5分钟后，他又回来了。他沿着凯蒂的血迹在一个楼梯的门口找到了凯蒂。凯蒂已经躺在了地上，但仍有一些意识。袭击者又一次上前刺中了她，给了她致命的一击。整个的袭击事件持续了接近半个小时。在这个过程中，尽管凯蒂大声呼救，她的邻居中至少有38位到窗前观看，但无一人来救她，甚至无一人打电话报警。

两周之后，1964年3月27日的《纽约时报》（The New York Times）首先以《38人目击到凶手，但没有人报警—对皇后区妇人遇刺事件的冷漠震惊了调查者》为标题，报道了两个星期前在纽约一个中产阶级的居住区Kew Garden发生的一起凶杀案。这件事引起了纽约社会的轰动，也引起了社会心理学工作者的重视和思考。《纽约时报》的阿贝•罗森塔尔（后来他做到这家报纸的总编辑），甚至还在1964年出版了《38位见证人：吉诺维斯案》一书，试图解释这一事件的成因。后来人们把这种众多的旁观者见死不救的现象称为责任分散效应。在社会心理学中，称之为旁观者效应（Bystander Effect）。

对于责任分散效应，心理学家进行了大量的实验和调查。在一个实验中，两位社会心理学家比布•拉坦和约翰•达利让被试者待在一个房间，一个学生独自待在隔壁房间里，然后假装癫痫病发作。当被试者所在房间里只有一个人时，听到声音后，他有85%的可能性会冲进这位学生的房间提供帮助。但是，当实验对象觉得还有其他4人也听到了声音时，他们去帮助这名学生的可能性只有31%。在另一个实验中，如果有人独自看到黑烟从门下冒出，他有75%的可能性去报警，但如果他与一群人在一起时，去报警的可能性就只有38%。

实验的结果表明：旁观者见死不救现象不能仅仅说是众人的冷酷无情或道德日益沦丧的表现，因为在不同的场合，人们会采取的援助行为确实是不同的。当你看到别人遇到紧急情况时，如果只有你一个人能提供帮助，你会清醒地意识到自己的责任，对受难者给予帮助。如果你见死不救，会产生罪恶感、内疚感，这需要付出很高的心理代价。但如果有许多人在场的话，帮助求助者的责任自然就由大家来分担，造成责任分散，每个人分担的责任很少，你甚至可能连自己的那一份责任也意识不到，从而产生一种“即便我不去救，别人也会去救”的心理，造成“集体冷漠”的局面。

在笔者多年的教学实践中，课堂上的责任分散效应同样存在，它影响着所有学生对课堂教学活动的参与度。笔者常常会遇到这样的情形：当我提出问题，同学们经常会你看看我，我看看你，彼此沉默不语，于是课堂出现僵局。学生沉默，教师尴尬。这时候，就出现了责任分散效应。

学生为什么选择沉默？那是因为，当我提出问题以后，有的学生可能在想，这个问题并非只有我必须回答，除了我还有别人呢，既然大家都有责任回答问题，那么平均到自己身上，回答问题的责任就小了。或许许有的学生在想，这个问题大家都不会，我何必硬充好汉呢？或者这个问题太简单，别人都不屑于回答，我又何必回答呢？再者，万一答错了呢？那多不好意思啊！所以，笔者经常发现人数众多的课堂其实并不比人数较少的小班课堂更活跃，也就是说，在一般情况下，学生的数量与课堂的活跃程度成反比。因此，当笔者在人数众多的礼堂上作报告时，根本不会指望台下会有人回答我提出的问题。在这种场合，笔者所采取的策略是：要么不问问题，要么自问自答。

如何打破课堂中的沉默呢？笔者可以提供的经验是：（1）强化提问的针对性。提问的时候不是笼统地问所有的学生，而是直接问某个（或某几个学生）学生。（2）控制好问题的难度。太难的问题学生不敢回答，太容易的问题学生不屑于回答，适中的难度更能激发学生回答问题的积极性。学生会觉得答错了也不尴尬，答对了又很有成就感。（3）充分表扬回答问题的学生，放大榜样的带动作用。只要有学生愿意回答问题，就应当不但耐心倾听其答案，表扬其对问题的积极思考，更要明确表扬其回答问题的行为本身。这一点是作为教师特别要注意的，一些教师只表扬回答正确的学生，甚至还会批评回答错误的学生，这样特别容易让学生担心“回答错了怎么办？”（4）增强自身的亲和力。除非是在讲述一些非常严肃的主题或者抨击一些很丑陋的现象，需要你义正词严，否则在上课的过程中应尽可能面带微笑。教师的笑容展现了一种开放的心态，拉近了与学生的距离，也是对学生问答问题最亲切的鼓励。

提示：作为领导，分配任务一定要责任到人！！

第十―章性别战（Game of Battle Of Sex）

懦夫博弈让我们体会到人与人之间的竞争关系，而性别战却让我们更多地去探讨人与人之间的合作关系。人类因为有了比动物更强的合作能力，才得以在自然的进化中脱颖而出。本章首先介绍性别战的经典模型，并点出该博弈的核心与内涵。然后对案例中的模型进行了深入分析，提出一些新的思路和策略。最后通过对一些现实案例的介绍，解读生活中的性别战。

一、性别战（Game　of　Battle　of　Sex）

其实，性别战的名字很容易误导人，它事实上并不能说是一种对抗，而更多的是具有共同利益的参与者在两个相当理性的纳什均衡之间进行选择，从而使双方都能达到同样的结局。这其实比较像不存在灾难情况下的“斗鸡博弈”，但与“斗鸡博弈”的一个很重要的差异是，在性别战中，两个纳什均衡是在左上方和右下方，正好是对角（如表11.1所示），这就意味双方是相互依存的选择而不是完全对立的选择。而“斗鸡博弈”的两个均衡在左下方和右上方，正好也是对角（如表10.1所示），但是双方是你死我亡的对抗关系。

第二节性别战的均衡

那么在性别战中，究竟哪一种均衡会出现呢？大抵有以下几种思路。

1.先动优势

在这种情况下，夫妻俩在家庭的地位可能将决定均衡结果。如果家里什么都是丈夫说了算，那么很可能出现丈夫偏爱的均衡；反之，如果妻子在家庭中的话语权很大，那么很可能出现妻子偏爱的均衡。总之，在家庭中话语权较为强势的一方将最终取得自己偏好的胜利，而弱势一方将会迁就对方。

2.约定俗成

由于在家庭生活中，这样的博弈还会继续发生，因此在重复博弈的框架下，双方就可以通过商议，考虑双方的利益平衡，最后达成“合约”。譬如，达成“轮流做主”的约定，或是“单号日丈夫做主，双号日妻子做主”的约定等。这种策略的好处是：通过“协商”的方式，使博弈双方的偏好在不同时空内得到尊重，这将更有利于共同利益的实现。

3.随机选择

这是由罗伯特•奥曼所发现的。奥曼给性别战所提出的解决方案是，让双方都同意用一种相对随机的方法，例如通过扔硬币或者抽卡片来决定他们的策略。一些影视剧中，当双方要决定谁负责掩护、谁负责撤退时，也会经常用扔硬币的方式决定。奥曼将这种结果称为“相关均衡”，因为它将双方之间所有选择用一种比较干净利索的方法捆绑在一起。一枚硬币就能解决的问题可能显得太微不足道了，但是奥曼发现这种解决方案比纳什均衡还要强大有效，甚至可以借助它来解决“斗鸡博弈”的困境。这种方法实施的关键之处在于：博弈双方都认同一种规则，最好找到一个没有任何利益相关的第三方实施这个规则。这种方法的最大好处是，不会影响家庭和睦，失去偏好均衡的那一方，不太会对对方心存不满，大多只会抱怨自己人品太差，连老天都不帮忙了。

第十二章信任博弈

如果博弈的均衡结果是唯一的，那么人们很容易对博弈的结果进行预测。如果均衡不是唯一的，作为分析者就很难预测最后的均衡结果会是哪一个。参与者如何实现均衡就成了博弈双方必须面对的问题。要想更有效地达成均衡，彼此的信任是非常重要的。本章首先介绍中国社会普遍存在的信任危机，然后通过对几个小故事的深入分析告诉你在什么条件下，人们愿意彼此信任对方。本章带给读者最重要的结论是，如果你希望别人相信你，先让对方知道彼此的利益是一致的。

一、信任危机

近些年中国国内发生了许多非常有影响力的群体性事件，这些事件的一个非常重要的特点是，由于相互之间彼此缺乏足够的信任，使得一件并不算严重的事情演变成了一件让彼此双方都损失巨大的事情。依据各类媒体的报道和调查，结合网络上的相关资料，这里重点介绍这些年发生在中国的三个非常有影响力的事件。

1.温州“7.23”动车事故

2.贵州瓮安县“6.28”事件

3.温州乐清钱云会事件

二、信与不信，是个问题

相信全中国有一半以上的人玩过石头、剪子、布的游戏，想必你也很可能玩过这个游戏，不知道你是输多赢少还是输少赢多。如果有人和你一起玩石头、剪子、布的游戏（赌注为100元），并且对方事先告诉你，他准备出“石头”，请问：你会出什么？

对于这个简单的游戏，如果对方什么也不说，那么读者的选择应该是随机石头、剪子、布中的一个，出石头、剪子、布的概率基本都为1/3左右。那么，对方说了要出“石头”，会影响你的选择吗？你出什么的概率会增加，出什么的概率会减少？

笔者曾经在教授博弈论的课堂上，让浙江大学的本科生和研究生们做选择。从学生们的选择结果看，出剪子的比例往往是最小的，而出石头的比例基本上是最大的（比例往往都在50%以上）。由此看来，学生们的选择受到了对方“言语”的影响。真的是这样的吗？

……

通过上述分析，我们可以得到一个非常重要的结论：目标（利益）一致是彼此信任的基础。无论是瓮安事件还是钱云会事件，正是因为民众和政府的利益不一致，才导致了彼此信任的缺失。因此，只有让政府的利益和老百姓的利益一致起来，才是国家稳定、社会长治久安的最根本的保证和最坚实的基础。要想实现这一点，必须要靠国家的制度建设来完成。

同样的道理，在一个企业中，企业管理者与被管理者的目标（利益）保持一致，是提高企业管理效率的一个非常重要的原则。当然，要做到这一点，首先是企业管理者要有这样一种理念，其次是在企业内部建立有效的机制来保障。从下面浙江万向集团的案例中，我们不难看出，管理者的利益与被管理者的利益保持一致，对企业的发展是多么重要！

……

基于以上分析，笔者认为，今后中国医疗制度改革的方向首先是改变以药养医的制度安排，实现医药分离，允许医院提高医疗服务的收费标准（提高医的费用）；其次是充分放开医疗服务和药品市场的竞争准入，通过市场竞争实现优胜劣汰，提高行业效率；最后是改革政府对医疗行业的监管体制和医疗保险制度。

第六讲混合策略和监督博弈

第一节概念及说明(混合策略)

1.纯策略&混合策略

纯策略：如果一个策略要求参与者在每一个给定信息情况下只选择一种特定的行动。

混合策略：如果一个策略要求参与者在给定信息情况下以某种概率分布随机地选择不同的行动。

2.示例

①随机药物检测，可能被抽检，也可能不被抽检。

②点球射门

攻方的策略有：左边、右边

守方的策略有：左边、右边

③假设我和你一起玩“石头、剪刀、布”的游戏，如果我告诉你说，我准备出“石头”，请问：你会出什么？

第一次赌注为10元。

第二次赌注为10万元。

特别提示：小得失相信人，大得失怀疑人！

游戏玩久了，赚钱就难了。（红海&蓝海）

ps:混合策略，更贴近现实。特别是对没有把握，和没有太大把握的人、事。

在处事时，对把握不准的地方，要准备多种解决方案。

第二节扩展分析 (混合策略)

1.智猪博弈中的混合策略

在工作中，即便现在是小猪，也要充分发挥主动性，去成长，有一天你就是可以提供便车的大猪。

2.懦夫（斗鸡）博弈中的混合策略

特别提示：

利益冲突需要协调，协调成本过高，不如不协调。

能够降低协调成本的制度（技术），是一种更好的制度（技术）。

例如：红绿灯

第三节雇主与雇员的监督博弈 (监督博弈)

V是雇员的贡献，及雇员为雇主创造的价值；W是雇员的工资，H是雇员的付出。C是雇主检查的成本。同时假定H<W<V, W>C.

H<W<V可以理解为，你的价值远大于工资，工资大于你的付出。

问题：

①求混合策略纳什均衡

混合策略均衡解：当雇员以C/W的概率偷懒，雇主以H/W的概率检查，达到均衡状态。

若干推论：

H越大，雇主越容易检查。

C越大，雇员越容易偷懒。

W越大，雇员越少偷懒，雇主越少检查。

②求解雇主支付W为多少时，其期望收益最大？

雇员的W=$\sqrt{CV}$

例如CV=4，W则为2

若干推论：

V越大，工资越高。

C越大，工资越高。

C越大，雇员越容易分享到剩余价值。

当工资非常高时，在一定情况下可以激发员工的绩效，同时减少了偷懒。

来自蒋老师的特别提示

越是难以被监督的职业，越需要职业道德。（高薪养廉）

选一个容易偷懒的职业，并努力不偷懒，你离成功就不远了。

比如说，知识型工作者。

成功的路上并没有你想象的那么拥挤！

课后测验

第六讲 混合策略和监督博弈

1.以下是某教授和学生张三之间的策略表达式，请问，教授选择发过该学生的概率是多少（50%）。

这是一道监督情境的博弈题。

为了使对方不具备占优策略，也使自己所得收益最大，应使对方无论采取任何策略，所得收益都一样。

假设张三平时勤快的概率为p，则平时偷懒概率为1-p。教授放过的概率为q，不放过的概率为1-q。
教授放过时的收益为3p-1*(1-p),不放过时的收益为-p

张三勤快时的收益为2q+1-q，偷懒时收益为3q

为了让张三勤快和偷懒时的收益一样，教授需要决定q=50%。

为了让教授放过和不放过时的收益一样时，学生需要决定p=20%。

因而教授采取放过的策略为50%，学生平时勤快的概率为20%，此时可达到纳什均衡。

2.在高级版的石头剪子布的游戏中，大家第一次玩的时候，一般的规律是（A.出剪子的总是赢B.出剪子的比例最高D.出石头的总是输）。

3.纯策略是指如果一个策略要求参与者在每一个给定信息情况下只选择一种特定的行动（正确）。

4.有关石头剪子布的实验表明，人们在该游戏中普遍采用（胜留败走）的策略。‍说明：括号内请填写4个字。

第十三章混合策略

通过前几章的介绍，我们已经熟悉了纯策略的纳什均衡，但是如果一个博弈没有纯策略的纳什均衡，我们又该如何解决呢？你可能会问，什么博弈没有纯策略的纳什均衡呢？比如，当我们在玩石头、剪子、布或者划拳的时候，我们很难找到一个纯策略的纳什均衡，因为无论自己选择什么策略，对方总会有一个可以胜过自己的策略（否则游戏就失去了意义）。所以根据我们平时玩游戏的经验，就是随意出一个而已，其实这就是混合策略。在这一章中，我们可以学到混合策略纳什均衡的概念，掌握均衡策略纳什均衡的求解方法。并看到混合纳什均衡在现实中的应用。深入思考混合策略，有利于我们更深一步地理解均衡的意义，并且学会在生活中利用混合策略谋取利益或者减少损失。

一、概念及说明

纳什均衡分为两种，如果一个策略规定参与者在每一个给定信息的情况下只选择一种特定的行动，我们称该策略为“纯策略”。相反，如果一个策略规定参与者在给定信息情况下以某种概率分布随机地选择不同的行动，我们就称该策略为混合策略。

混合策略是对每个纯策略分配一个概率而形成的策略。混合策略允许参与者随机选择一个纯策略。因为概率是连续的，所以即使策略集合是有限的，也会有无限多个混合策略。当然，每个纯策略其实都是一个“退化”的混合策略，某一特定纯策略的概率为1，其他的则为0。完全混合策略对每个纯策略都分配了一个不为零的概率。

1.随机药物检测

2.石头、剪子、布

“石头、剪子、布”的起源有四种说法，大多数人认同中国起源说，也有人认为它起源于日本、非洲或者爱尔兰。根据史料记载，这个游戏很可能是起源于中国，然后传到日本、韩国、欧洲等地。中国从汉代就有猜拳游戏，而其他国家都不具备产生这种游戏的土壤和相关历史。“石头、剪子、布”作为猜拳的一种，根据明人谢肇浙所撰的《五杂俎》一书，猜拳的传统可以追溯到汉朝的手势令。明李日华《六研斋笔记》载云：“俗饮，以手指屈伸相搏，谓之豁拳，又名豁指头。”在明清小说中，相关记载更多。《红楼梦》第六十三回写道：“彼此有了三分酒，便猜拳赢唱小曲儿。”《水浒传》第一百零九回写道：“猜拳豁指头，大碗价吃酒。”清朝人赵翼有诗云：“老拳轰拇阵，谜语斗阄戏。”

3.点球大战

二、若干实例分析

1.仁慈的教授——是否放过学生

2.智猪博弈中的混合策略

3.懦夫博弈中的混合策略

4.充足的思考是否必要

第十四章监督博弈

监督博弈是混合策略博弈中的一种，是人们在工作生活中经常会看到和碰到的一种博弈，如偷税漏税中的征税博弈，雇主与雇员之间的偷懒博弈，食品安全中的监管博弈，甚至包括老师与学生之间的点名博弈。本章直接根据现实生活中的具体案例，用监督博弈模型进行深入分析，模型分析所引发的思考，相信一定是你所喜欢的。

一、雇主与雇员的监督博弈

在企业里，雇主与雇员的利益冲突是个永恒的话题，因为他们有着自己独立的行为，同时也在努力使自己的利益最大化。在给定企业总收入的情况下，扣除物质成本的投入，雇主和雇员之间的利益分配就是一个此消彼长的零和博弈。所以我们可以把与雇员和雇主看作博弈的双方，分析他们直接的收益。

V是雇员的贡献，即雇员为雇主创造的价值；只有当员工努力工作的时候，雇主才能得到V的收益。W是雇员的工资；除了员工偷懒被雇主查到的情况，雇主是要给雇员发工资的。H是雇员的付出；当雇员不偷懒时，雇员的收益将损失H，即努力工作的成本。C是检查的成本；当雇主选择检查的时候，雇主的收益将减少C。F是雇主发现雇员偷懒时的惩罚，即没收雇员所交的抵押金。

同时，我们假定HWV，W＞C-F。HWV的条件保证了雇主和雇员的参与，其中，HW保证了雇员愿意被雇佣，WV保证了雇主愿意雇佣雇员。W＞C-F的条件则保证了双方的博弈是一个混合策略的均衡。如果WC-F，那么无论雇员是否偷懒，雇主都会选择不检查。试想一个雇主去检查一个雇员的成本要花10万元，罚没的抵押金只有5万元，而工资的支出是3万元，那么即便是在雇员偷懒的情况下，去检查一个雇员也是不合算的一件事。

接下去，我们一起来讨论以下三个问题：

（1）求解混合策略纳什均衡。

（2）求解雇主支付W为多少时，其期望收益最大？

（3）如何理解雇员所交的抵押金？

……

基于以上分析，针对双方的博弈可以得到四个推论：

（1）当W越大，雇主的检查概率下降，雇员的偷懒概率也会下降。高薪养廉的含义即在此。

（2）当F越大，雇主的检查概率下降，雇员的偷懒概率也会下降。乱世用重典的含义即在此。

（3）当H越大，雇主的检查概率增加，雇员的偷懒概率不变。越是难以完成的工作，越需要雇主加强监督。

（4）当C越大，雇主的检查概率不变，雇员的偷懒概率增加。越是难以监督的工作，雇员就越会偷懒。

基于以上分析，针对雇主给雇员的工资可以得到三个推论：

（1）当V越大，雇主给的工资越高，多劳多得，论功行赏的含义即在此。

（2）当C越大，雇主给的工资越高。这里的理由也很简单，越是难以监督的工作，雇员就越会偷懒。为了减少偷懒的损失，雇主必须通过一个更高的工资来减少雇员的偷懒。

（3）当F越大，雇主给的工资会下降。这说明，当雇主拥有更重的处罚权，雇员会得到一个更少的工资。从雇主看，通过给雇员一个更低的工资提高了其期望收益。

上述的分析表明，从期望收益来说，雇主的期望收益会随着F的增加而上升；雇员的期望收益会随着F的增加而减少；总的期望收益和支付的工资W和抵押金F的大小无关，只和雇员的贡献V、雇员的劳动力机会成本H和监督成本有关。

因为收取抵押金有助于提高雇主的收益、降低雇员的收益、改变双方的利益分配格局，因此，这是一件雇主特别希望去做、而雇员又特别反对的事情。除非雇主能够因此给雇员一个合理的补偿。中国的法律已明确规定不允许向新员工收取押金。但是，收取押金这一高效的方式还是在用一种隐含的方式进行着。这就是通过调节工资来积累押金。

二、打击假冒伪劣博弈

售假者相对于消费者具有信息优势，即消费者无法分辨正常商品与假冒伪劣商品，且与制售正常商品相比，售假收益为A，A＞0。对于消费者而言，因为无法区别假货和正品，所以其购买行为得到的收益都为B。不考虑监管，博弈矩阵如表14.2所示。

1.非合谋情况下的分析

以上两种情况的分析还说明了一个特别重要的道理，那就是只要消费者无法分辨出假冒伪劣产品，那么生产者一定会选择制假，真品会被“淘汰”。这就是我们常说的“劣币驱逐良币”的逆淘汰，又称为“格雷欣法则”。

……

当消费者发现监督方由于地方保护主义等问题而不作为的时候，就不会采取举报的策略。由此也可以看出地方保护主义的危害，因为这最终会使消费者采取拒绝与监督方合作的态度，使监管体系失灵。例如在高端白酒市场，地方保护主义依然严重，行业准入门槛较低、假冒伪劣产品屡禁不止，给贵州茅台和五粮液等公司产品造成一定的负面影响。

而当举报成本E过高也会使消费者采取不举报的策略，进而依然会使监管体系无法运作。此处证明了过高的举报成本也是假冒伪劣泛滥的原因之一。

……

从上面二个公式可以得到以下结论：

（1）在A和P不变的情况下，企业违法成本F越大，监督方治理的概率n越小，政府的治理成本S越小，企业制假的概率m也越小。

（2）当S不变，提高监督方的治理奖励P也能降低企业制假的概率m，所以某些地方政府对监督方给予一定比例的罚没款奖励还是有相应的理论依据的。在这样的情况下，监管能够顺利进行，假冒伪劣商品虽然不能得到杜绝，但是能得到一定程度的控制。

2.合谋情况下的分析

消费者与生产者如果在假冒伪劣的生产与销售过程中存在合谋，那么情况就会发生很大变化。

……

当然，在现实中，监督方可以将举报奖励提到很高，以刺激群众举报的方式来打击假冒伪劣（理论上只要高于某个消费者的C即可），但是举报奖励事实上是不可能很高的，因为其不可能高于监督方绕开消费者举报的环节进行主动监督的成本。因此，在合谋的这一情况下，很难通过消费者的举报来启动整个监管程序。

当然，还有另一种情况能够启动监管程序，即通过利益受损的生产正常商品厂家的举报。启动该举报程序的条件依然为D-E＞-C。一般情况下，正常商品的生产者都是一些规模较大的企业，而假冒伪劣商品的生产者的规模一般都不大，因此这就决定了正常商品生产者举报后可能获得的赔付D相对于其所需投入的调查费用以及时间、精力等举报成本E来说会非常小，这就决定了只有在它受到的损失C非常大的情况下，才会采取举报的策略。例如，贵州茅台股份有限公司坚持做好茅台酒及系列产品的打假保知维权，加强与执法部门和各地整规办的沟通与配合，加大打假力度。

由于D-E是一个较大的负值，因此假冒伪劣现象并不能通过正常商品生产者的举报得到杜绝。当正常商品生产者停止举报后，新的假冒伪劣生产者又会不断出现，使C变大，直至重新启动举报程序。实质上，正常商品生产者与假冒伪劣商品的生产者之间处于一种动态均衡的状态，市场份额也由此被划分。

在正常商品生产者所启动的举报监督程序中，监管确实能够发挥作用，但是假冒伪劣现象依然不会消失。

……

在消费者与生产者合谋的情况下，消费者大都采取了不举报的策略，这就表示消费者不愿意承担一部分的治理成本，即举报成本E。定义治理的总成本S’＝∑E＋S，S为监督方接到举报进行监管的成本。由此我们可以发现，在合谋的情况下，监督方的治理成本增加了，增加值为∑E。这就有可能使得监督方由于监管成本过高而放弃监管。当然举报成本也可以由正常商品的生产者承担，这就回到了上文中关于正常商品生产者是否会举报的讨论。

本节运用博弈论的方法讨论了假冒伪劣商品的原因，认为可能由于以下几种原因导致监管失灵，假冒伪劣商品泛滥：

（1）消费者举报成本过高，使得监管程序无法启动。

（2）地方保护主义盛行，使得监督方认为监管无利可图。

（3）当出现合谋的情况时，消费者没有举报的动力。

（4）违法成本过低，总是会有生产者选择制假策略。

（5）治理成本过高，迫使监管方放弃监管。

第七讲最后通牒与讨价还价

第一节最后通牒博弈

最后通牒博弈（Ultimatum game）的游戏规则：

两人分一笔总量固定的钱，比如100元。方法是：一人提出方案，另外一人表决。如果表决的人同意，那么就按提出的方案来分；如果不同意的话，两人都将一无所得。

最后通牒博弈的最大特点：take it or leave it

无讨价还价的余地

例如：超市的一口价，要买就买，不买就不要；其次还有自动售货机。

如果总量变为10万元，你会提议如何分配？

第二节最后通牒的实验结果

1.实验表明,总额为100元时，大多数A分配给B的钱在40-50元之间,大多数A分配给B的钱在40-50元之间,给50元以上的情况极少见。

如果分配数量小于20元,方案被拒绝的概率很高(40%-50%)，拒绝的可能性随着钱数的减少而不断增大。

特别提示：

人在博弈中，还会追求利益以外的价值。比如公平感，也不一定都是自私的。

2.示例

①弗兰克（Frank）分桔子汁的实验。

兄弟两个的桔子汁，可以同时变多，或者变少，但不能一个多，一个少，后者会引发一定的矛盾。

②季军比亚军更快乐！

季军的参照物是第四名，亚军的参照物是冠军。

③序位消费理论

（困扰我们的，不是如何能够过上幸福的生活，而是如何能够过上比别人更幸福的生活。）

人和人之间的最根本的冲突不是利益冲突，而是价值观的冲突！

穆斯林、共产党员恐怖分子

能用钱解决的问题都不是最难解决的问题！

价值观：认为什么是重要的？？

一个没有信仰的人很难理解一个有信仰的人的思维和行为！（信仰壁垒）

人与人之间最根本的冲突是价值观的冲突

每个人可以有和别人不一样的价值观

一个国家要有一个相对统一的价值观

找对象要找价值观相近的！

个人价值观可以有差异，但国家（集体）要有一个相对统一的价值观！

④复仇与公正（正义、公平）

参照系很重要！

幸福不幸福不重要，比别人更幸福才重要！

3.来自蒋老师的特别提示

越是成熟的组织（社会），在管理中越是更多地运用最后通牒的博弈。

最后通牒一方面可以节省大量的谈判成本，另一方面还可以给人以公平感。

决定您出价高低的是：贪婪与恐惧！

4.分配方法：

①蛋糕越大，给对方分配的比例可以越小。如果对方拒绝，损失会较大。所以对方拒绝的概率会降低。

②当给对方分配的比例小到一定程度以后就不能再小下去了，我们一定要学会适可而止，否则会过犹而不及。

③金额的分配与蛋糕的大小有关。较小时，可五五分。变大后，四六分、三七分、二八分，等等。

5.权力的基础

决策权大于否决权

解决凭什么是你有决策权的问题——凭什么要听你的？

特别提示：

职务提升制度直接影响组织的管理效率。
尽可能建立基于绩效和能力的职务提升制度，并坚持公开竞争性原则。
被提升者需要自身具有可信度和权威感，这样不会引发异议，更有利于工作的开展。

四连问：

为什么在企业里,出钱的人说了算,而不是出力的人说了算?

为什么企业的领导不是选出来的?（领导为后果负责）

为什么村(国家)的领导是选出来的?（大家为后果负责）

孩子问：为什么非要听你的？

谁承担决策的后果（出了问题谁负责？），谁负责决策！

第三节独裁者博弈

独裁博弈的设计

两人一组分100元，提议者提出分配方案，分给响应者X元，留给自己100-X元；而无论响应者同意与否，提议者都将得到自己的100-X元。显然，此时提议者不会遭遇响应者的任何威胁。基于纯粹利己的标准的博弈理论所得到的结果将是提议者分给响应者0元（X=0）。

实验结果表明，这种极端的分配结果仅占20%，而分给响应者大于0元但小于50元的提议者占80%，没有提议者愿意分给响应者50元以上。

这说明，与最后通牒博弈相比，独裁博弈中由于提议者不用担心响应者的回绝，他们倾向分配给响应者更少的份额，但并不是极端自利地一点也不给响应者——尽管他可以这么做。

由此，三个道理：

第一，人们在决定其行动时，并不会仅仅考虑到其经济利益，虽然这可能是最主要的一个考量，他们也会考虑一些道德和社会规范，比如公平原则，“己所不欲，勿施于人”。

第二，一个社会如果在制度安排上能够给人民更多可以拒绝（可以说“不”）的权利，那么这个社会就会产生更多的公平性，甚至会带来更多的效率改善。

第三，一个社会在制度安排上给了官员更多可以拒绝（可以说“不”）的权力（比如行政审批制度），那么拥有审批权的官员一定能够从中获利丰厚。

张艺谋缴纳七百多万的社会抚养费

（如社会抚养费的不知去向、房地产）

合法伤害权：如果法律赋予你可以打任何人一拳的权力，试问你能从中获益多少？

你愿意为此花多少钱来购买该权力？

第四节讨价还价

1.含义：

讨价还价：也称为议价或谈判，主要是指参与者通过协商方式解决利益的分配问题。

称讨价还价时主要强调其动作或过程，称谈判时则强调其状态或结果。

2.均衡解：

用X表示参与者1所得的份额，（1-X）为参与者2所得的份额，Xi和（1 - Xi）分别是时期i时参与者1和参与者2各自所得的份额。假定两个参与者的贴现因子分别是δ1和δ2 。

均衡解为：

参与者1获得的份额X*=（1-δ2）/（1-δ1δ2）。

推论：

①谈判时有先动优势，先开价的人比后还价的人更有优势（证明：当δ1=δ2=δ时，X*=1/(1+δ)＞1/2）；δ越小（越没有耐心），先动优势越明显

②假设δ1=1，X*=1，即当第一个人有无限耐心的时候，整个蛋糕就都归第一个人了

③假设δ2=1，X*=0，即当第二个人有无限耐心的时候，整个蛋糕就都归第二个人了

④当δ1=δ2=1，这时候就比谁先死，谁寿命长了。

在这个博弈中，谁更有耐心，谁最后拿到的份额就越多。

货币的时间价值——人是会死亡的

特别提示：

在讨价还价中，总能找到一个均衡解。

统一的价值观的实现：只要我们通过不断地交流和沟通，总能达成一致意见。

知识的互补性：每个人对世界的认识都是局部的、片面的，我们在跟别人讨论问题的时候，一定不要把讨论的焦点放在争论谁是对的上面，而应该放在彼此的交流和沟通上面，这样我们对事物的认识就更全面、充分、完整。

当意见相左时，我们至少可以尊重彼此不同的看法，求同存异。孔子曰：“君子和而不同，小人同而不和。”

第五节讨价还价-贴现因子

1.示例：

以下有两个选择，只能选择一个。

A：今天得到100元。

B：4周后得到110元。

实验表明，A的比例为82%，B的比例为18%。

2.贴现因子的含义

1个份额经过一段时间后所等同的现在份额。

贴现因子是由参与者的“耐心”程度所决定的。

3.一个人对眼前利益和长远利益的比较（贴现因子）由哪些因素决定？

答曰：

个人：年龄（寿命）、财富、未来收益的确定性（法治）、知识水平（文化程度）。

组织：相对于个人有更长的寿命预期，从而提高了人们的贴现因子。

例如，连锁店、百年老字号、驰名商标。

4.蒋老师的寄语：

抬头看山、低头走路，我的理解是心中要有目标，同时要务实、脚踏实地的用行动去接近、实现目标。

“磨刀不误砍柴功”，误与不误，取决于你想要砍多少柴！

第十五章最后通牒

最后通牒博弈经常是战争题材电影中的一个典型镜头，《亮剑》中李云龙攻打平安县城，对守城的日军喊：再不投降，就开炮！日常生活中，类似的例子也很多。买者对卖者说，100元不卖，我就走人。姑娘对小伙子说，再不娶我就分手。本书的定价告诉你，50元一本，要买就买，不买拉倒。相对于讨价还价而言，最后通牒显得特别干脆利落或不近人情。本章先介绍最后通牒的基本含义，再介绍一些有关最后通牒的实验结果，最后介绍一个比最后通牒更狠的博弈—独裁者博弈。

一、最后通牒的含义

最后通牒博弈（Ultimatum Game）是指：两人分一笔总量固定的钱，比如100元。方法是：一人提出方案，另外一人表决。如果表决的人同意，那么就按提出的方案来分；如果不同意的话，两人将一无所得。

比如A提方案，B表决。如果A提的方案是70∶30，即A得70元，B得30元。如果B接受，则A得70元，B得30元；如果B不同意，则两人将什么都得不到。A提方案时要猜测B的反应，A会这样想：根据理性人的假定，A无论提出什么方案给B—除了将所有100元留给自己而一点不给B留这样极端的情况，B只有接受，因为B接受了还有所得，而不接受将一无所获—当然此时A也将一无所获。

在标准的理性假设下，（1）提议者和响应者均只理性地关心他们各自能得到多少钱；（2）提议者知道响应者是理性和自利的。这样，博弈的均衡实际上是一个非常极端的情形：只要是有钱赚，响应者对提议者的方案均会接受，因此，提议者给出最小单位的钱，比如一分钱，而将其余的钱据为己有。这是根据理性人的假定的结果，而实际则不是这个结果。

二、最后通牒的实验结果

大量的实验表明，上述理论上的极端分配结果出现的频率非常小。通过数百次在不同国家、用不同钱数做实验的结果表明，大多数提议人分配给回应者40～50元，分配给回应者50～70元的情况极少见，分配回应者小于20元的方案被拒绝的概率很高（约40%～50%），拒绝的可能性随着钱数的增加而减少。

英国博弈论专家宾莫也为此做了实验，发现提方案者倾向于提50∶50，而接受者会倾向于：如果给他的少于30%，将拒绝；多于30%，则不拒绝。

有意思的是，最后通牒博弈的结果是相当稳健的，承受住了来自各方的质疑。比如，有人认为，这一结果可能会和不同国家和地区的文化传统、道德习俗等有关，而来自欧洲、美洲、亚洲许多国家的研究依然得到了大致相同的结果；也有人认为，可能跟受试对象通常是学生有关，于是有些最后通牒实验则利用了学生以外的对象（比如公司的CEO），实验结果并未受到挑战（CEO表现出的行为比学生的行为更倾向于公平分配）。

……

最后通牒博弈只是确认了分配结果是趋向于公平结果的，但并不能证明提议者的动机就一定是利他的，因为不能排除这样的可能性：提议者正是因为害怕被回应者拒绝才提出较为公平的分配方案。尽管如此，我们还是可以确认，公平理念的确是影响经济行为的一个原则，因为提议者之所以在其信念中认为不公平分配有可能遭到回应者拒绝，那是因为他相信回应者有着对公平的偏好，他也相信回应者有可能牺牲其经济利益来维护其认同的“公平”。在课堂上，我也曾经问过一位学生，如果10万元中分给他2万元，是否愿意接受，我的学生明确地回答说：“拒绝。”我又问：“岂不是白白损失了2万元，对你有什么好处啊？”学生的回答是：“对方损失8万元，我感觉还是很爽的嘛！”这背后的逻辑是学生对二八开的分配比例的强烈不满。

三、独裁者博弈（Dictator Game）

对最后通牒博弈进行修改，取消回应者对提议者（分配者）所提要求的否决权，那么，这个分配者就可以被叫作“独裁者”。这种严格不平等条件下的谈判博弈被称为独裁者博弈。在这里，回应者没有拒绝的选择，主要是考察提议者（独裁者）如何分配。

独裁者博弈是这样设计的：仍然是两个人一组，提议者就100元提出分配方案，分给响应者X元，留给自己100-X元；而响应者没有任何权力拒绝提议者的方案，即无论他同意或不同意，提议者都将得到自己的100-X元。显然，此时提议者不会遭遇响应者的任何威胁。即使提议者提出分回给响应者0元，自己得100元，响应者也将无可奈何。基于纯粹利己的标准的博弈理论所得到的结果将是提议者分回给响应者0元（X＝0）。但是实验结果却表明，这种极端的分配结果仅占20%，而分给响应者大于0元但小于50元的提议者占80%，没有提议者愿意分给响应者50元以上。这说明，与最后通牒博弈相比，独裁者博弈中由于提议者不用担心响应者的回绝，他们倾向分配给响应者更少的份额，但并不是极端自利地一点也不给响应者—尽管他可以这么做。

独裁者博弈充分说明了两个道理：第一，人们在决定其行动时，并不会仅仅考虑到其经济利益，虽然这可能是最主要的一个考量，他们也会考虑一些道德和社会规范，比如公平的原则。管理学界早已注意到公平的重要性，比如绝大多数人力资源管理教材都会特别强调薪酬设计中公平因素很重要，即所谓的对外的竞争性、对内的公平性；而经济学界则由于实验经济学的研究和发展，才开始逐步地接受上述观点。第二，一个社会如果在制度安排上能够给人民更多拒绝（可以说“不”）的权利，那么这个社会就会产生更多的公平性，甚至会带来更多的效率改善。试想，如果我国政府在征地制度上规定，只要农民不同意，就不能征地，那么征地的补偿会上升到一个更公平、更合理，甚至更有效率的水平。市场经济的有效性很大部分都是因为消费者可以对自己不喜欢的商品（及价格）说“不”，这才迫使企业去生产更有竞争力的产品。

从历史上来看，大部分独裁国家的当政者并不会这么做。实际上，这个博弈的独裁者并不仅仅只是考虑资产多少，他还要考虑名誉、地位与统治的稳固与否。如果将这些因素都考虑成收益，从广义上来说，这样的独裁者仍然是理性的。可见，对于平民来说，收益可能仅是资产分得多少，而对于当政者来说，资产并不是其全部的收益。反过来说，仅仅考虑自身经济收益的当政者反而是非理性的人。试想，如果一个独裁者把所有的收入全部归自己所有，那么响应者最终会被消灭（被饿死或赶尽杀绝），这样的话，独裁者也无法生存，或者说也把自己给消灭了。汉朝的皇帝从秦朝的灭亡中懂得了这个道理。

第十六章讨价还价

讨价还价（Bargaining）也称为议价或谈判，主要是指参与者通过协商方式解决利益的分配问题，称讨价还价时主要强调其动作或过程，称谈判时则强调其状态或结果。

讨价还价理论是托马斯•谢林早期的主要贡献所在，他的一篇名为《讨价还价漫话》（An Essay on Bargaining）的论文首先发表在1956年的《美国经济评论》上，之后又收编入《冲突的策略》的第二章。通过对讨价还价现象进行分析，谢林得出一个让人意想不到的结论：“在讨价还价的过程中，势弱的一方通常会成为强者。”对此其实可以这样去理解，那就是将自己固定在特殊的谈判地位是有利的，当任何一方都认为对方不会作出进一步的让步时，往往协议就达成了。一方之所以会让步（以避免谈判破裂而两败俱伤），是因为他知道对方不会让步了，因此也可以认为，谈判的关键就在于让对方相信你不会再让步了。

一、均衡解

在分析讨价还价的均衡解之前，必须先把贴现因子的概念给读者解释清楚。如果说甲乙双方分10万元，甲先说给乙4万元，他自己6万元，然后通过讨价还价，在双方各5万元下达成一致。看似通过讨价还价，乙多得1万元，但是任何事情都是有成本的，讨价还价也存在机会成本。试想，如果我说要么现在给你4万元、要么明年给你5万元，你如何选择呢？这就涉及如何比较未来收益和眼前收益，即跨期选择。曾经有人做过一个实验：要么现在给你100元，要么一个星期后给你110元，结果82%的人选择了前者。一个星期能有10%的利率，那简直是暴利啊，但是为什么更多人愿意选择前者呢？首先，我们要知道如何把以后的钱和现在的钱作对比，因为只有同种性质的事物才可以在数量上进行比较，这就涉及贴现因子的概念，即把未来的收益折算成眼前的收益。贴现因子就是打折。如果是打9折，那么明年的5万元就相当于现在的4.5万元，比4万元多，你就会在今年的4万元和明年的5万元之间选择5万元；如果是打7折，那就只有3.5万元了，就少于现在的4万元，你就会选今年的4万元。所以，具体选什么要看贴现因子的大小。贴现因子越高，说明这个人越看重长远利益，在谈判的时候越有耐心。一个人之所以愿意继续谈判，说明他看重未来的收益。所以在谈判中，非常重要的一点是看谁更有耐心。

我们用X表示参与者1所得的份额，（1-X）为参与者2所得的份额，Xi和（1-Xi）分别是时期i时参与者1和参与者2各自所得的份额。假定两个参与者的贴现因子分别是δ1和δ2。这样，如果博弈在时期t结束，参与者1支付的贴现值是$W_{1}=\delta_{1}^{t-1}X_{t}$，参与者2支付的贴现值是。双方在经过无限期博弈后，得到的纳什均衡解为：

参与者1获得的份额X*＝（1-δ2）/（1-δ1δ2）。

该均衡结果和双方的贴现因子有关：

（1）当δ1＝δ2时，X*＝1/（1＋δ1）＞1/2

这说明参与者1的份额总是大于参与者2的份额，始终处于有利的位置，也就是说，在双方都没有足够耐心的情况下，先出价的总是处于有利位置。

（2）当δ1＝1时，X*＝1，表示当第一个人有无限大的耐心时，他就可以占有全部的利益；当δ2＝1时，X*＝0，表示当第二个人有无限大的耐心时，他就可以占有全部的利益。

（3）当δ1＝δ2＝1时，X*＝0/0，无解，表示当双方的耐心都无限大的时候，就看谁活的时间长了。当然，现实的情况是贴现因子一定小于零，因为每个人的生命都是有限的。

二、贴现因子

贴现因子在数值上可以理解为贴现率，就是1个份额在经过一段时间后所等同的现在份额。贴现因子是由参与者的“耐心”程度所决定的。“耐心”实质上是讲参与者的心理和经济承受能力，不同的参与者在谈判中的心理承受能力可能各不相同，心理承受能力强的可能最终会获得更多的便宜；同样的，如果有比其他参与者更强的经济承受能力，也会占得更多的便宜。

既然贴现因子影响了眼前利益和长远利益的大小，那么哪些因素会影响人的贴现因子呢？

1.年龄（寿命）

一般来说，人越年轻或预期的寿命越长，越看重长远利益。

2.财富

贴现因子的大小与一个人所拥有的财富多少有很大的关系。一般来说，博弈中一个人拥有的财富越多，越会看重长远利益。富人一般比穷人更看重长远的利益。试想，穷人首先要解决的显然是当前的温饱问题，只有把眼前的问题解决了，才有能力走向未来。“人穷志短”说的就是这个道理。

3.未来收益的确定性

试想，如果我告诉你两个选择：一个是现在的1万元，一个是明天的11000元，你一般会选择明天的11000。但是，如果我告诉你说，明天的11000是有可能给你的，也有可能不给你的，我相信你多半会选择今天的1万元。因此，不难理解，一个人对未来收益的确定性越高，就越愿意选择未来的收益，贴现因子就越大；反之就越小。

4.知识水平（文化程度）

一般而言，知识水平（文化程度）越高的人贴现因子会越大。背后的原因是，知识水平（文化程度）有助于增强对未来收益的预见性，从而使之更愿意放弃眼前的收益。

三、征地拆迁中的讨价还价

在讨价还价的博弈中，首先需要存在一定的公认的标准，这是达成一致的前提。换句话说，当双方一起分配一个“蛋糕”的时候，我们首先要就“蛋糕”的大小达成共识。然而在一般的拆迁纠纷中，争议最大的莫过于拆迁纠纷双方的补偿标准存在差异，也就是不动产评估的方法和假设不同。政府往往采纳的是成本法计价，如在上述案例中，是参照当年建筑成本给予适当补偿，其缘由是建筑物的升值主要得益于社会经济的发展以及基础设施的完善，因此升值部分应由公众（国家或政府）共享。然而拆迁户则是按照市场法估价，其缘由是建筑物的升值理应由其拥有物权者享有。因此，我们说在拆迁纠纷的讨价还价中，应该先确定一种估价标准，这个标准应该是双方都能接受和认同的。

在讨价还价的博弈中，博弈者行为的一致性非常重要，其实也就是强调了博弈中的信任机制。

……

讨价还价的设定结局一般有两种形式：一种是最后的“成交价”由双方达成一致后敲定，如果不能达成一致，则不成交，如一般的商品交易；另一种是博弈的某一方要求必须完成交易，如水电供应、交通等垄断行业中的交易，在这种情况下，急买或急卖方的谈判能力很弱。为了弥补政府在谈判中的“弱势”地位，一方面赋予了国家强制拆迁权，从而大大强化了国家的谈判能力；另一方面我国的拆迁纠纷在协商未果的情况下，由第三方（行政机关或司法机关）进行调解或裁决。我国在拆迁纠纷中如拆迁补偿等类似问题上，第三方依据的标准往往和政府相一致，如都是按照成本法计算补偿额。因此，当纠纷僵持不下时，第三方在大多时候会将结果判定给拆迁方，这也就相当于在这场博弈中，只要双方未达成协定，政府就可以强制拆迁，这种不公平的谈判地位很容易逼迫弱势一方采取暴力手段进行反抗。

以上分析表明，平等主体之间的讨价还价无论结果如何（哪怕谈判破裂），都不可能损害任何一方的利益，双方都能接受最后的谈判结果。一旦双方的地位是不平等的，那么强制（乃至暴力）行为就必然会发生。对当今的中国而言，当社会群体之间发生利益冲突又无法协商（谈判）解决时，引入公正的第三方仲裁机制就变得极为重要了。

第十七章承诺与威胁

在现实生活和日常工作中，我们经常会面对各种各样的威胁与承诺，比如向你借钱的人一定会承诺尽快还钱给你。企业的老板总是信誓旦旦地对员工说，只要你努力工作，一定不会亏待你的。新郎新娘总会在婚礼上发誓相爱一生、白头到老。一个绑匪会在电话里威胁你说，如果不给钱就撕票，或者承诺说，如果给钱就放人。那么，对你来说，在什么情况下，你应该相信这些威胁或承诺，什么时候不应该相信呢？还有，如果你要给别人承诺，又怎么让对方相信你的承诺呢？本章的内容就是围绕这些问题展开的。

一、承诺与威胁

有时候，威胁（threaten）与承诺（commitment）的界限非常模糊。威胁与承诺的界限只取决于你怎样称呼当前的情形。绑架你的歹徒会威胁说，如果你不肯告诉他银行卡的密码，他就会弄死你。如果你怎么都不肯说，那他就会动手殴打你，从而造成一种新的情况，而在这种新的情况下，他又会承诺说只要你告诉他密码，他就会住手并把你放了。随着形势转变，一个强迫性的威胁会变得和一个阻吓性的承诺差不多。

如果实践一个“威胁”对对方不利，称之为警告（warn）。比如，政府告诉被拆迁户，如果在本月底之前还不搬迁，就要采取强制拆迁。这就是一种警告。再比如，父母告诉孩子，如果期末考试不及格，假期就不带他出去玩。警告的用意在于告知对方，他们的行动将会产生什么影响。

如果实践一个“承诺”对对方有利，称之为保证（promise）。比如老板向每个员工保证，如果员工努力工作，年终奖会增加10%。这就是一种保证。再比如，父母告诉孩子，如果期末考试得了100分，假期就带他出国旅游。保证的用意同样在于告知对方，他们的行动将会产生什么影响。

我们强调这两对概念的区别是有理由的。威胁与承诺是真正的策略行动，而警告与保证更多的是起一个告知的作用。警告或者保证不会改变你的策略选择。实际上，你只不过告知他们，针对他们的行动，你打算采取怎样的行动作为回应。然而，一旦他们真的这么做了，你也未必会作出原先所说的回应。与此截然相反的是，威胁或者承诺意味着一旦时机来临，就会真的这么做，这么做的目的不是为了告知，而是为了操纵。由于威胁和承诺表明你可能选择与自身利益冲突的行动，这就出现了一个可信度的问题。等到别人出招之后，你就有动机打破自己的威胁或者承诺。很多时候为确保可信度，我们必须作出一个承诺。

二、可信承诺

可信承诺是博弈论中的一个重要的概念，动态博弈的一个中心问题是“可信性”问题。所谓可信性，是指动态博弈中先行动的参与者是否该相信后行动的参与者会采取对自己有利的或不利的行为。后行动者将来会采取对先行为方有利的行为相当于一种“承诺”，而将来会采取对先行为方不利的行为相当于一种“威胁”。我们可将可信性分为“承诺的可信性”和“威胁的可信性”，即可信承诺与可信威胁。

可信威胁是那些对威胁者来说，无论是事前还是事中都是有效的。事前有效意味着承诺在把博弈对手看成是和自己同时行动时是有效的，事中有效意味着当采取行动之后该威胁仍然是值得执行的。换言之，可信威胁是符合序贯理性的威胁，它是指当轮到后行动者采取行动时，他出于自身利益考虑，确实会按照原先声明采取行动。

三、案例分析

1.绑架博弈

2.婚姻承诺

3.徙木立信

4.海盗的诚信

16、17世纪各大洋上海盗盛行，但事实上海上商业并没有受到很大的影响。一方面这有各国军舰保驾护航的功劳，另一方面我们也必须注意到，大多数海盗并不是随意打家劫舍，他们更大的收入来源是向各国商船索取保护费。海盗们在索取了保护费后，不但不再抢劫缴费的商船，而且还会对其进行保护。据《明清时期澳门海上贸易史》记载，有一次一名葡萄牙海盗失误抢劫了一艘已经交纳了保护费的商船，被海盗首领知道了，海盗首领不但要求该海盗交回抢劫之财物，更令其赔偿船主500葡萄牙银圆。乍听之下我们很惊讶海盗也会如此讲信义，但是如果海盗想要长期、稳定地发展，靠打家劫舍做流寇是不行的（流寇只注重眼下的利益，贴现因子低），而必须做坐寇（坐寇收取保护费，与收税接近，贴现因子高）。

第八讲重复博弈和制度建设

重复博弈（repeated games）是指同样结构的博弈重复许多次，其中的博弈成为“阶段博弈”（stage game）。

特点：

1.前一阶段的博弈不改变后一阶段的博弈结构

2.所有参与人都能观测到博弈过去的历史

3.参与人的总损益是所有阶段损益的贴现值之和

不要被认为是不知好歹的人（醉汉），否则没人会对你好的！

对方采取醉汉策略（随机选择），我方最好选择背叛策略！

整体最优策略：Tit for Tat一报还一报

首先示好，接下来与对方行为一致。

特点：

1.它是善良的，不树敌。

2.它是可激怒的，防背叛。

3.它是宽容的，给机会。

4.它是清晰的，易辨识。

“针锋相对”的善良性防止他陷入非合作的麻烦中，对对方背叛的报复则保证了对方背叛行为的谨慎性，宽容性则有助于在对方背叛后重新开始合作，而简单清晰的规则则易于被人理解，从而导出长期的合作。

四点忠告：

1.不要嫉妒

2.不要首先背叛

3.对合作和背叛都要给予回报（as soon as possible）

4.不要耍小聪明

两点启示：

1.合作的基础不是信任，而是关系的持续性。

2.组织相对于个人而言往往具有更长的预期寿命，从而提高了关系的持续性。

避免景区宰客之类的事件，买东西要分开买，表现自己是可以与之长期合作的，降低被骗的风险。

某些人面对巨大诱惑时，可能想一次骗个够，尽量从制度上或个人行为上避免（例如营造多次合作的“现象”）

处理噪音（无意的背叛）方法：

宽容
悔过
噪音导致原谅，但过多的原谅会被利用。=>宽严相济

人性经不起考验，最好提前通过制度建设避免人做坏事。

制度 => 行为 => 现象

改变激励模式达成目的：如英国运囚犯到澳大利亚。

特别提示：

不要去责备人的利己心，如果一种利己的行为，导致了恶劣的结果，要改变的是制度。

优秀的管理者不是要消灭人的利己心，而是要充分利用人的利己心。利己心既能让人去杀人，也能让人去助人；既能让人说谎，也能让人说真话。

【注：根据李泽尧先生的管理学，管理不要和人性过不去，而要通过管事来管人。T目标B利益C检查到位即可，每项制度都应该设立一个期限，确保到时可以调整或废止，如两税制本来是不得已而使用的后来竟然延续千年。】

特别提示：

不要试图改变人性，而是努力改变制度。不要让人不想贪，而是让人不能贪、不敢贪。

结束语：

人生是永不停息的博弈过程，博弈意味着通过选择合适策略达到合意结果。作为博弈者，最佳策略是最大限度地利用游戏规则：作为社会的最佳策略，是通过规则引导社会整体福利的增加。——计算机之父、博弈论创始人之一冯·诺伊曼

人生是永不停息的博弈过程，博弈的精髓不是通过暴力或阴谋诡计去战胜对方，而是大家共同努力去建立起更好的游戏规则，实现民富国强与社会和谐的共同目标。

博弈的最高境界：双赢

第十八章重复博弈

重复博弈是一种特殊的博弈，在博弈中，相同结构的博弈重复多次，甚至无限次。因为其他参与人过去的行动历史是可以观测的，因此在重复博弈中，每个参与人在每个阶段选择的策略依赖于其他参与人过去的行为。重复博弈让报恩或报复都成了可能。本章先介绍重复博弈的基本特征与一般分析，然后介绍爱克斯罗德的重要研究成果，以探讨重复博弈中的最佳策略选择，对冷酷策略的探讨也会是读者所感兴趣的。

一、重复博弈

重复博弈（repeated game）是指同样结构的博弈重复许多次，其中的每次博弈称为“阶段博弈”（stage games）。重复博弈是动态博弈中的重要内容，它可以是完全信息的重复博弈，也可以是不完全信息的重复博弈。当博弈只进行一次时，每个参与人都只关心一次性的损益；如果博弈是重复多次的，参与人可能会为了长远利益而牺牲眼前的利益，从而选择不同的均衡策略。因此，重复博弈的次数会影响到博弈均衡的结果。

重复博弈具有三个基本特征：

（1）重复博弈的阶段，博弈之间没有“物质”上的联系，即前一个阶段博弈并不改变后一个阶段的博弈的结构。

（2）在重复博弈的每一个阶段，所有参与人都能够观测到该博弈过去的历史。

（3）参与人的总收益是所有阶段博弈的收益的贴现值之和或加权平均数。

在重复博弈中，每次博弈的条件、规则和内容都是相同的，但由于有一个长期利益的存在，因此各参与者在当前阶段的博弈中要考虑到不能引起其他参与者在后面阶段的对抗、报复或恶性竞争，即不能像在一次性静态博弈中那样毫不顾及其他参与者的利益。有时，一方作出一种合作的姿态，可能会使其他参与者在今后阶段采取合作的态度，从而实现共同的长期利益。必须要强调的是，重复博弈中，参与者需要考虑对方的利益不是利他主义的结果，而是出于对自身长远利益的考虑，仍然是利己的选择。

二、重复博弈：以囚犯困境为例

第五章有关囚犯困境的分析表明，在一次性博弈中，双方最后的均衡结果是（坦白，坦白），虽然（抗拒，抗拒）是一个对双方更好的结果。双方合作是最好的结果，但是彼此背叛是均衡的结果。如果博弈不是一次性的，那么每个人就有了更多的策略选择。

……

在以上所列举的那么多策略中，到底什么样的策略是最值得我们效仿的呢？换句话说，当所有的策略彼此博弈后，哪种策略最后的得分是最高的呢？

……

这个问题的答案应该归功于美国密西根大学一位叫做罗伯特•爱克斯罗德的人。爱克斯罗德是一个政治科学家，为了进行关于合作的研究，他组织了一场计算机竞赛。这个竞赛的思路非常简单：任何想参加这个竞赛的人都负责扮演“囚犯困境”案例中一个囚犯的角色，提供一个相应的策略。他们把自己的策略编入计算机程序，参与者一起开始玩“囚犯困境”的游戏。每个人在每一步都要在合作与背叛之间作出选择。

在爱克斯罗德的竞赛中，总博弈的次数是200次。比赛的分数是这么计算的：如果两个程序都合作则各得3分，如果都背叛则各得1分，如果一方背叛而另一方选择合作，则背叛方得5分而合作方得0分。

竞赛的第一个回合交上来的14个程序中包含了各种复杂的策略，爱克斯罗德自己则递交了一个醉汉策略的程序。本次竞赛的桂冠属于其中的一报还一报（tit-for-tat）策略。这是多伦多大学心理学家阿纳托•拉帕波特提交上来的策略。

……

通过对两次竞赛结果的分析，艾克斯罗德总结了“一报还一报”策略的4个重要特点：

（1）善良性。即不做首先的背叛者。在实验中，排在得分前8名的8个策略都是善良的规则；实验中所有善良策略的得分在472～504分，而不善良策略的最高分只有401分。道宁策略本来设计得比较巧妙，但第一步的背叛使之很容易陷入被别人报复的泥潭，最后得分却很低。

（2）可激怒性。即应该针对对手的背叛行为给予报复。可激怒性太弱的策略易受到非善良策略的剥削，像乔斯策略就可以占这些策略的便宜。但乔斯策略如果遇到TFT这样马上报复的、可激怒性强的策略，则得分迅速降低。

（3）宽容性。不因对方的一次背叛，就没完没了地报复。只要对方放弃背叛，就原谅对方，继续与其合作。一报还一报只记住对方上一次的选择，就此不断给对方改正的机会。缺乏宽容性的策略，会使双方合作的高收益无法实现。

（4）清晰性。过于复杂的策略不容易被辨识，从而容易让对方认为是醉汉策略，那么对方就很容易采取曹操策略，至少会让非善良策略占便宜。“一报还一报”的行为方式很容易被辨识：它不欺负人家，也拒绝老是被欺负（以一次为限）。一旦被识别，对方就容易看出与之相处的最好方式是选择合作。

一报还一报策略的胜出对人类和其他生物的合作行为的形成所具有的深刻含义是显而易见的。爱克斯罗德在《合作的进化》一书中指出，一报还一报策略能导致社会各个领域的合作，包括在最无指望的环境中的合作。他最喜欢举的例子就是第一次世界大战中自发产生的“自己活，也让他人活”的原则。当时前线战壕里的军队约束自己不开枪杀伤人，只要对方也这么做。使这个原则能够实行的原因是，双方军队都已陷入困境数月，这给了他们相互适应的机会。

一报还一报的相互作用使得自然界即使没有智能也能产生合作关系。这样的例子很多：真菌从地下的石头中汲取养分，为海藻提供了食物，而海藻反过来又为真菌提供了光合作用；金蚁合欢树为一种蚂蚁提供了食物，而这种蚂蚁反过来又保护了该树；无花果树的花是黄蜂的食物，而黄蜂反过来又为无花果树传授花粉，将树种撒向四处。

三、冷酷策略（Grim Strategies）

冷酷策略的核心理念是任何参与者的一次性背叛将触发永远的背叛，这一点意味着，在冷酷策略下，不给对手任何改正错误的机会，所以才被称为“冷酷”。无限次重复博弈的所有参与者慑于冷酷策略的严重后果，只能选择积极性地维持合作。所以，它其实是友善的。

如果你的对手采用的是冷酷策略，对你而言最好每次都选择合作，因为你一旦背叛，就会面临对手的永久报复。然而，在爱克斯罗德的竞赛中，冷酷策略的得分却是相当低的。这是因为人非圣贤孰能无过，在博弈中，就算一个心地善良的人，也难免会因出错而选择了背叛。这种出错可能是不小心的出错（随机干扰），也可能是被误认为出错（信息传递错误），也可能是占便宜心理的诱惑。那么，一旦出错，就永远都没有重新合作的任何可能性了。这是重复博弈中我们最不愿意看到的。在重复博弈中，最重要的目的不是惩罚对手，而是尽快地建立一种合作关系，最好是建立一种牢固的合作关系。即便有惩罚，也是基于上述目的的考量。

如果考虑到贴现因子的作用，那么一个采用冷酷策略的参与者并不能保证对手的永久合作。举例来说，我现在告诉你，我是一个冷酷策略的人，如果我们彼此合作，你每年得到的合作收益是3万元，而一旦你背叛我，你今年的收益是100万元，但从此后我不再选择和你合作，你以后每年的收益是0，请问你的选择是什么？是选择拿到100万元走人，还是放弃当下的100万元，去期待明年的3万元？

第十九章从策略选择到制度建设

人生是永不停息的博弈过程，博弈意味着通过选择合适的策略达到合意的结果。作为博弈者，最佳策略是最大限度地利用游戏规则；作为社会的最佳策略，是通过规则引导社会整体福利的增加。

——计算机之父、博弈论创始人之一、美国学者冯•诺伊曼

游戏规则决定人的策略（行为）选择，人的策略（行为）选择决定了游戏最终的结局。当我们渴求实现一种更好的游戏结果的时候，我们应该把思考的重点放在如何建立起一种更好的游戏规则。本章先用两个实例说明游戏规则如何影响游戏结果，然后和读者一起探讨，什么样的制度才是中国未来制度改革的发展方向。

一、匿名投票与署名投票

国会议员投票采用的是署名投票方式。曾经有人提议，给所有议员加薪50%，但最终该议案被否决了，原因就在于因为是署名投票。……如果是匿名投票，那么大家肯定会投赞成票，这样薪水涨了，但是公众并不知道是谁投的。

面对同样的议员，不同的投票规则导致了不同的投票结果。

二、离岸价与到岸价

1770年，库克船长带领舰队来到澳洲，澳洲就此成为英国的领地。为了开发这一领地，英国政府开始组织大规模移民。移民的重要来源是罪犯。一开始，英国政府给那些帮助移民的私人船主定的是离岸价，即运一个人给多少钱。为了获取更多利润，私人船主尽可能地多装犯人，减少给养，降低卫生条件。据《犯人船》一书记载，1790至1792年，私人船主用26艘船运送4082名犯人到澳洲，死亡498人，平均死亡率为12%，其中一艘叫“海神号”的船，424名犯人竟死了158人，死亡率高达37%。如此高的死亡率不仅造成巨大的经济损失，而且引起英国社会的强烈谴责。

当时解决此问题的方法有三：一是教育船主，使其良心发现，能够自律；二是强化监督，派员上船制约，使船主不敢虐待；三是改革运送罪犯的给付制度。由于媒体的介入和问题的公开，英国政府也变得聪明起来。最后，他们选择的是制度的改革，将离岸价改为到岸价：不按上船时运送的罪犯人头付费，而按下船时实际到达澳洲的罪犯人数给钱。1793年，第一次按新规则付费的三艘运送罪犯的船到达澳洲，结果422人中只有1人死于途中。

三、对制度建设的思考

1.对经济增长的制度透视

当经济学家们对经济增长进行了制度视角的透视后才发现，资本积累、技术进步等因素与其说是经济增长的原因，倒不如说是经济增长的本身。进一步的研究表明，影响实物资本、人力资本积累和生产率的因素是所谓的社会组织基础，包括各项政策、法律制度以及经济组织形式等。“制度构造了人们在政治、社会或经济方面发生交换的激励结构。制度变迁决定了社会演进的方式，因此，是理解历史变迁的关键。”

2.交易费用的节约与制度演进

由于资源的稀缺性，在一个社会中，当两个或更多的个人都想得到同一种资源时，必然隐含了利益冲突与竞争。利益冲突（竞争）要通过这种或那种方式来解决，这种解决冲突的方式就是所谓的经济运行机制。为了减少冲突所带来的损失，就会逐渐形成限制竞争的规则，这就是通常所说的制度安排（经济制度、政治制度等）。

配置稀缺资源的方式有很多，如排队、考试、选举、抽签、拍卖、招聘、任命、赠予、世袭、偷窃、夺取等。竞争性市场规则只不过是解决竞争中的利益冲突的许多方式之一，但却是没有租金耗费的最有效率的规则（张五常，1974）。

如果市场价格被扭曲或不被采用，那么，取代它的任何其他准则都必然会招致一个类似于竞争条件下的租金耗费。如排队定量配给，排队竞争者所赢得的商品价值至少部分地被排队成本所“抵消”。因此，这一部分价值被认为损耗掉了。如果是在自由市场上进行市场交易，排队成本就可以被节省。其他根据资历、等级、政治、美貌、体能、考试成绩等这种方式或那种方式决定输赢，都将促使竞争者选择超过使用自由市场竞争机制所需成本的行动（张五常，2001）。

进一步看，置于“公共领域”的权利（“公共”产权）节省了界定和实施私人权利的费用，但是与公共产权相联系的租金耗费意味着另一种类型的交易费用是很高的。私人产权能够减少租金耗费，但界定和实施产权的费用可能会很高。两种费用之间的权衡决定了产权的具体安排，决定了产权被界定为共有或私有的程度。

产权界定的演进过程有理论上的均衡状态（没有人愿意偏离这个状态），即对每一个潜在的寻租者而言，寻租的边际成本等于该寻租者在其已经享有的权利下能够得到的租金的边际增量。基于此，所谓的公共产权，要么是表明进一步界定已经不再能够增加经济效率，要么是已经通过我们所不清楚的其他方式进一步加以界定了。在张五常（2001）看来，如果一种财产真正被“公共”占有，那么，对其使用的竞争就不受约束，对众多的竞争者就没有什么限制。但是，在资源稀缺条件下，对公共资源的竞争仍不可避免，并且这种竞争并不会导致租金的全部耗散。借用诺斯的理论，只要给予一定的时间跨度，某种制度安排一定会被采用以降低租金耗费。如果这种制度不是通过建立私人产权来降低租金耗费，那么，其他的制度安排将用来降低租金耗费。其他类型的产权安排中的一种是，根据等级或层级来界定个人权利，而不是根据出价高低来界定权利。经济活动和资源利用由官员的层级秩序控制着。在此规定下，对资源的竞争就表现为对官位的竞争。“学而优则仕”，“官本位”制度，必然构成了集权国家的基本性质。从更广泛的视角看，所有科层组织都表现出这一相同的特点。

【注：从本段结尾能看出蒋老师（可能也包括张五常）分不清集权国家和极权国家的区别，也不懂“学而优则仕”的含义。这段话带有满满的“河殇”印记。】

在缺少私人产权的制度下，还存在着第二种降低租金耗费的一般方式。它不是由等级秩序控制的，对资源利用的竞争是由范围极其广泛的管制和许可证来控制（限制）的。当然，腐败总是经常与管制和许可证制度联系在一起（张五常，2001）。

3.私人产权的作用

“有效率的经济组织是经济增长的关键；一个有效率的经济组织在西欧的发展正是西方兴起的原因所在。有效率的组织需要在制度上作出安排和确立所有权以便造成一种刺激，将个人的经济努力变成私人收益率接近社会收益率的活动”（诺斯，1973）。借用经济学的一般分析方法对经济史加以重新思考，诺斯看到了财产所有权制度在经济增长中的重要地位。如果没有制度保证和对个人经营的刺激，私人的产业及其收入就得不到保障，工业革命就不会发生，近代工业就不可能发展起来。

在诺斯（1973）看来，财产权（包括知识产权）是社会繁荣和经济效率的关键。除非有特殊的情形，一个人使用自己的财产总比使用他人的财产更谨慎、更有效率，所以保障个人的财产权比废除个人的财产权带来了更高的效率、更高的收益和更低的成本。

财产权必须属于个人，否则不会有市场经济，不会有经济发展，因而不会有自由与繁荣。私人财产权是市场经济的核心和基础。

【注：宗族组织的财产权归属呢？宗教团体的财产归属呢？】

奥尔森（1982）的研究发现，尽管“一手交钱、一手交货”的初级市场交易在世界各地到处可见，在各国的历史发展中也比比皆是，但在合同约束下进行的复杂市场交易却不是很普遍。投资、融资、新产品研发、技术创新等“产权密集型”的生产活动只活跃于那些私人财产受到很好保护、商业合同得到有效执行的国家。这意味着自发秩序的扩展空间会受到一个社会制度的强烈约束，从而使得人们在诸多文明发展史上可以经常看到这样的情形：经济发展到了一定的水平后就会戛然而止。

然而，私人产权的确立及其保护是一种公共物品。虽然它能使个人财产得到保障，使人们愿意为积累财富而积极从事生产活动，使得社会通过和平的市场竞争机制实现资源的有效配置，但是，集体行动的逻辑告诉我们，这种公共物品很难由私人提供（奥尔森，1965）。如果这种物品不能被提供，那么人们必然会把大量资源用于防盗和保安，并缺乏从事生产活动的积极性，甚至“穷光荣”、偷懒。人们就会陷入“社会陷阱”（Social Strap）而不能自拔。

国家正是在集体行动的困难中得以产生。奥尔森（1965）发现，集体行动在两种特定条件下比较容易产生：一是集体成员的“不对称”，二是“选择性激励”的存在。个别成员从集体行动中得到的利益比其他成员来得越大，他为集体行动作贡献的积极性也就越高。选择性激励可以分为正向激励和反向激励两种。正向激励通过搭卖私人物品的方法刺激集体成员为负担集体行动的成本作贡献；反向激励是惩罚搭便车者的措施。

4.国家的产生与矛盾

关于国家的产生有两种解释：契约理论和掠夺或剥削理论。在诺斯看来，两种理论都不全面。可以借助“暴力潜能”分配理论使两者统一起来。契约论假定主体间暴力潜能的平等分配，而掠夺论假定其不平等的分配（诺斯，1981）。奥尔森（2000）则借用“流寇”和“坐寇”的故事对国家的产生作了更深入的揭示。

【注：这种国家的产生方式只适合野蛮人，比如日耳曼蛮子，这和我们中国国家的诞生存在较大差异。】

在私有产权的保护中，拥有更大利益的政府起到了大猪的作用，并借助于对小猪的强制，在全社会范围内分摊了产权的保护成本。然而，这也使人类社会面临一个非常棘手的两难选择：一方面，政府必须拥有权力和强制手段，才能维护社会秩序、保护私人财产、取缔掠夺行为；另一方面，政府也可能利用手中的权力对私人进行掠夺。经济繁荣需要的是一个扶助之手强有力、掠夺之手受约束的政府（奥尔森，2000）。

【注：国内有的学者把这种两难冲突称之为“诺斯悖论”，虽然诺斯本人并没有提出这个概念。“诺斯悖论”从根本上反映的是眼前利益和长远利益之间的冲突。】

课程大纲#

前言#

第一讲 博弈论概述#

第一章 何为“博弈”#

一、从一个简单的故事说起#

二、博弈的渊源#

三、学习博弈论的收益#

第二章 发展简史#

一、最初的探索和应用#

二、理论的诞生与发展#

第三章 术语解读#

一、博弈的术语#

术语详解#

附录《三十六计》#

二、博弈的分类#

1.合作博弈和非合作博弈#

2.静态博弈和动态博弈#

3.完全信息博弈与不完全信息博弈#

4.零和博弈与非零和博弈#

三、公共危机中的策略#

第二讲 基本假设#

理性假设#

附录锚定效应#

共同知识（common knowledge）假设#

第四章 基本假设#

一、理性假设#

二、共同知识假设#

第三讲 囚犯困境和破解之道#

囚犯困境#

真实世界中的囚犯困境#

附录大跃进游戏规则和大饥荒#

附录政治运动#

如何破解囚犯困境？#

第五章 囚犯困境及原因#

一、囚犯困境的来源#

附录“大记忆恢复术”#

二、囚犯困境的定义与原因分析#

第六章 真实世界的囚犯困境#

一、大萧条与凯恩斯革命#

二、公地悲剧#

三、价格战#

四、枪打出头鸟#

五、禁烟广告#

六、排队与闯红灯#

七、民主与多数人的暴政#

第七章 如何破解囚犯困境#

一、如何利用他人的囚犯困境#

二、如何破解囚犯困境#

1.道德教化#

2.财产私有#

3.温故知新#

第四讲 万元陷阱和智猪博弈#

万元陷阱#

智猪博弈#

第八章 万元陷阱#

一、万元陷阱#

1.万元陷阱的由来#

2.何为万元陷阱#

3.对万元陷阱的深入分析#

4.不断提醒自己继续投入的代价#

二、实例分析#

1.网络游戏《征途》#

2.竞技体育#

3.行贿受贿#

第九章 智猪博弈#

一、智猪博弈（Boxed Pigs）#

二、智猪博弈的扩展#

三、实例分析#

第五讲 懦夫博弈和性别战#

第一节 懦夫博弈（Chicken Game）#

第二节 鹰鸽博弈#

第三节 实例分析#

第四节 公共物品的提供#

第五节 来自懦夫博弈的特别提示#

第五节 性别战的基本模型#

第六节 实例分析#

第七节 均衡的存在性和多重性#

第十章 懦夫博弈#

第一节 懦夫博弈（Chicken Game）#

第二节 实例分析#

课程大纲

前言

第一讲博弈论概述

第一章何为“博弈”

一、从一个简单的故事说起

二、博弈的渊源

三、学习博弈论的收益

第二章发展简史

一、最初的探索和应用

二、理论的诞生与发展

第三章术语解读

一、博弈的术语

术语详解

附录《三十六计》

二、博弈的分类

1.合作博弈和非合作博弈

2.静态博弈和动态博弈

3.完全信息博弈与不完全信息博弈

4.零和博弈与非零和博弈

三、公共危机中的策略

第二讲基本假设

理性假设

附录锚定效应

共同知识（common knowledge）假设

第四章基本假设

一、理性假设

二、共同知识假设

第三讲囚犯困境和破解之道

囚犯困境

真实世界中的囚犯困境

附录大跃进游戏规则和大饥荒

附录政治运动

如何破解囚犯困境？

第五章囚犯困境及原因

一、囚犯困境的来源

附录“大记忆恢复术”

二、囚犯困境的定义与原因分析

第六章真实世界的囚犯困境

一、大萧条与凯恩斯革命

二、公地悲剧

三、价格战

四、枪打出头鸟

五、禁烟广告

六、排队与闯红灯

七、民主与多数人的暴政

第七章如何破解囚犯困境

一、如何利用他人的囚犯困境

二、如何破解囚犯困境

1.道德教化

2.财产私有

3.温故知新

第四讲万元陷阱和智猪博弈

万元陷阱

智猪博弈

第八章万元陷阱

一、万元陷阱

1.万元陷阱的由来

2.何为万元陷阱

3.对万元陷阱的深入分析

4.不断提醒自己继续投入的代价

二、实例分析

1.网络游戏《征途》

2.竞技体育

3.行贿受贿

第九章智猪博弈

一、智猪博弈（Boxed Pigs）

二、智猪博弈的扩展

三、实例分析

第五讲懦夫博弈和性别战

第一节懦夫博弈（Chicken Game）

第二节鹰鸽博弈

第三节实例分析

第四节公共物品的提供

第五节来自懦夫博弈的特别提示

第五节性别战的基本模型

第六节实例分析

第七节均衡的存在性和多重性

第十章懦夫博弈

第一节懦夫博弈（Chicken Game）

第二节实例分析