总书记治国智慧博弈论解读——党课讲稿(47页)

发布时间:2020-11-15 来源: 对照材料 点击:

  总书记治国智慧的博弈论解读 (党课讲稿)

 前

 言

 在这里跟大家一起来交流一下有关《博弈论》方面的一些知识,我把它起了一个名字《习总书记治国智慧的博弈论解读》,事实上这是一个很大的名字。

 这样一个题目事实上是我从 2010 年开始,在我们学校讲博弈论以来一直的一个思考,尤其是在十八大以来,我比较关注把这个博弈论的一些知识和我们习总书记的治国理政的一些理念相结合,并且试图在课堂上跟同学们之间进行分享。我想这些分享从现实来看是取得了还不错的效果。于是我就从去年开始,之前我一直在做这个司局级干部讲学班,我的题目叫《博弈与对策》。这也是我们系统科学学院有四门课当中的其中的一门。我们今天讲课讲的就是《博弈论》,试图用博弈论的这么一些知识来理解体会我们习总书记的一些治国智慧,这是今天的一个主题。

 我们现在就开始上课,题目是习总书记治国智慧的博弈论解读。其实说到博弈,我觉得每位老师可能多多少少都有些了解。我想通过一个问题,先问问大家,我把这个问题发送给大家。这时候麻烦您看看您的手机,上面就会有一个蓝框,上面有一道题,说老师发布了一道习题,看到了吗?投票?对,是投票的习题。

 投票,是吗?投票,老师发布了一个新的投票。您就看到了,我提的题目是您同意以下观哪些观点,第一个,增加对手的选择,就是对手在博弈过程当中让对手选择更多一定会让我的收益降低。第二个,减少自己的选择,一定会使我的收益降低。当然三、四就是以上都同意,以上都不同意。我们现在已经有 7 位领导已经答到了,已经进来了,有 10 位已经进来了,10 位已经答了、12 位已经答了。相互之间交流一下,因为我给的时间比较长。

 好,我看我们基本上有 50 位老师、领导进来了,有 46 位老师、领导已经答完题了,我们来看看大家答题的情况。我们会发现在我们 47 位老师当中,回答 D 的是最多的,24 个人,将近一半。我可以告诉大家,D 是正确的。你会发现按我们传统的直观的理解,让对方的选择多一点,一定对我是不利的。或者说让自己控制一下自己,减少一点自己的这种灵活性,一定对自己是不利的,这是我们直观的理解。但是我希望今天学完我的课,上完我的课,我希望大家对这种直观的理解,相当于是反直觉的这么一些结论,我觉得大家应该稍微颠覆一下,就是反过来,因为它们都是不一定的。其实在现实当中我一提这两个例子,你马上就知道了。

 第 1 个例子当中是《孙子兵法》的例子,你会发现在《孙子兵法》的第 7 章当中,他提出来了围师必阙,穷寇莫追。讲的什么故事呢?讲的是这样,前者讲的是如果己方包围敌军的时候,并不是要四面围住,而是要围住三面,放一面。这样敌军就会从

 未被包围的城门跑走,己方就可以较为轻松地占领城市。事实上是要放对方一马,增加对方的选择。你完全可以把四面来增加对方的选择,是不是?他本来是无路可走,但是我让他有一条路,给他一条路,增加对方的选择。而后者如果所有城门都被围的话,守军无路可逃,只有一个选择抗争到底,造成己方添加伤亡。而后者我们可以看到,对于没有战斗力的陷于绝境的敌人,不要过于去追迫他,否则可能会让他狗急跳墙、鱼死网破。于是在我们现实当中我们就会有缴枪不杀、优待俘虏,得饶人处且饶人,有这样的说法,这是第一个角度。

 第二个角度,事实上也包含在刚才我提到的这么一个故事当中,巨鹿之战,项羽只有 20 万人,秦军有 30 万人,这种情况下,项羽来引兵渡河,皆沉船,破釜甑,什么意思?减少自己的选择,通过这种方式干嘛呢?告诉氏族,你们必须要拼命,因为我们已经没有退路了,什么退路都被我已经破掉了,但是你会发现,最终的结果是九战九捷。这事实上是怎么着?减少自己的选择,最后自己获得了胜利。

 我想这样的一些故事,其实都可以通过博弈的方式来得到解读。而这也是我今天非常重要的一个观点,我们以往的管理,更多的是习惯于层级式的这样一种管理,而层级式的这样一种管理要注意,不是说它是错的,而是说如果我们懂了博弈,知道一些博弈的思维,再去做层级式管理,你就会发现会更有效。

 我想这个随着我后边的课程当中,我觉得我们可以来共同的

 分享一下。其实我们昨天也讨论了,最近我们习总书记在讲区块链,其实我想区块链对于我们传统的治理体系也是一个非常大的冲击,但是习总书记为什么要提倡区块链?就是因为这与他的共享、协同两大理念是相同的,但是我相信会对我们传统的治理体系有很大的冲击。有这个冲击的时候,它其实并不是要颠覆或者是要打破一个旧的秩序,而是要主动的去应对区块链对我们带来的冲击。和我们的课程相结合,主动的去熟悉什么叫博弈,在熟悉博弈的基础上来做我们的管理,你就会发现真的,有一些反直觉的这样一个结论,在博弈当中是会存在的,而且事实也是这样的。

 那么,我们这个主题是叫科学思维,博弈论显然是科学,全是数学,可以告诉大家,我们从 1994 年,你可以调研一下,所有得诺贝尔经学奖的,到今年将近十届的诺贝尔经学奖得主,他用的方法就是博弈论。我们应该知道经济学,尤其是主流经济学是非常强的这么一个学科,所以你会发现那里边其实都是数学模型,博弈论本质是数学。其实我希望通 7 能难难难 j 过对习总书记的治国智慧进行博弈论的解读,事实上也告诉大家,其实我们习总书记是深谙博弈之道的。

 当然在我讲课之前,我提这句话的时候,可能大家会有不同的理解,但是我要告诉大家的是,博弈论事实上是一门讨论大事、大理念、大的智慧的这么一个学科,它绝对不是我们社会当中所提到的博弈是厚黑学,是想把别人给战胜,想获得更大的利益等

 等,并不简简单单是这样一门学科,我想这是我的整个的一个基本的主张。

 那么所有的主张,事实上是研究我们系统科学当中的一个词,这个词叫序。我们希望这个社会有秩序。那么这是一位社会科学社会学家,他曾经写了这么一本书,这本书的英文,名字翻译成中文,叫《社会的粘合剂》,就怎么样能把社会让它更有秩序,其实本质上讨论的就这么一件事情。我把博弈论和习总书记的治国智慧结合在一起,事实上也是讨论,如何让我们的这个社会更有秩序。在这本书当中,有两个非常重要的观点,他就说有两件事情是一个社会当中有序的,非常重要的两个根源。第一个,要鼓励在社会当中的合作的行为。所以今天我的第一个主题,事实上就告诉你如何促进合作,如何促进合作。包括我们习总书记,他为什么要提以德治国与依法治国相结合。当然你会发现,对于这个问题,不同的学科当中会有不同的解释。那么从博弈的角度,事实上就是告诉你一个道理,博弈告诉你,这个社会,社会困境的问题比比皆是,而这两者相结合,能够帮助我们来走出社会困境,我想这是第一个问题。

 在这本书当中还提到了。第二个要想社会有序的一个非常重要的元素,这样一个元素,是社会当中的所有人要怎么样?要想法一致,从博弈论的语言叫预期一致。我会体会我们现在整个习总书记的这个治国智慧,事实上是使得让我们从传统的一种管理,向对预期进行管理的这么一个过渡。

 讲到这里,首先我告诉大家,其实博弈论首先给我们讲的是一个叫社会困境的,这么一个问题。

 在讲社会困境之前,我们先说说博弈论。博弈论,它告诉你的是一个不同的社会参与者,他们的收益不仅仅取决于我的选择,还取决于其他人的选择的时候,这个时候你的最优选择是什么?你的最优选择是什么?这是博弈论的一个本质。以前在层级的管理当中,我们是完全的把被管理者作为管理者,相当于是他完全要执行,我们的管理者的这样一个意志,和他的一些主张。但是我们有的时候很难去考虑被管理者,对于你的管理措施的一个反应。如果你承认了他对你的政策是有反应的,那么,我是说你是在一个博弈的环境下,来制定你的管理政策。如果说你把它当做一个被动的接受者,那么我就认为你事实上是在用一种控制的方式来做管理。

 提到博弈,其实我们可能会有好多的这种已有的这种概念,比如说台湾不叫博弈,它就叫赛局论。所以博弈是跟比赛有关系的,GameTheory,game 就是比赛,赛局论,比如说下棋是博弈,比如说我们的比赛是博弈,比如说我们大国博弈。所以博弈是跟政治是有关系的,中美之间的博弈,当然我今天没有时间来讨论中美之间的博弈,其实我讲博弈这么多年,跟社会上做培训的时候,大家都在说中美之间的博弈,当然了我想跟大家分享一点点,影响博弈最重要的元素,事实上是大家的偏好偏好,也就是大家的收益。中美之间的博弈,我觉得我们习总书记是为了最广大人

 民的利益,最广大人民的利益,而且预期他整个的时间是会比较长的,是在长久的一个阶段下,希望他的收益最大化。而美国,我们特朗普最重要是他是有一个短期的要连任。所以如果认识到了这一点,我觉得这是当然不能解决所有的问题。但是我觉得可以解决大多数的问题。在博弈当中,其实最重要的就是一个偏好分析和收益利益的这么一个分析,这是最本质的。理解到了这一点,我觉得我们应该能够了解更多的一些事情,当然今天我们就不展开了。所以你知道大国博弈其实就是博弈,包括其实一开始我们讨论博弈的时候,其实最容易想到的是这么一个词,叫你死我活。这事实上是博弈当中最简单的一种博弈,这个叫零和博弈。零和博弈就是指假设有两个人在一起博弈,我要想得到收益,我就必须去抢你的,这叫你死我活型的,我们俩的收益之和永远等于零。这种事在博弈当中冲突、对抗最激烈的,这叫零和博弈。所以我们习总书记每次都告诉特朗普,怎么着?诺大的太平洋,能容许中国和美国同时存在,告诉你,我们之间的博弈是博弈,但不是零和博弈。我想这从博弈论里边可以告诉我们,如果你把这个博弈想成你死我活型的,你最后决策和你认为我们有共同的利益,你会发现两个最优决策是完全不一样的。我们还会讲,可能会有人提到博弈当中会有一个叫纳什均衡,这是《博弈论》把它作为一个数学模型的最优解。一会我们会讲什么是纳什均衡,包括合作,合作就是博弈,我们签订的合同、机制、协议等等,本质上都是博弈,包括我们说我们要在一定程度上学管理者,最

 重要的是要善于妥协,最后目的是双赢,其实这些词都是我们《博弈论》里边的词语。

 简单而言,《博弈论》什么?博弈要有两个或两个以上的参与者,同时参与者会争夺收益,有博弈的一个规则,大家都同意的规则,同时参与者有自己可选择的一个策略,这就构成一个博弈问题。因此博弈和决策他们之间最大的不一样。我今天从科技楼来我们京师大厦,我应该怎么样选择我的路线,这叫个人决策问题。他不会受到别人的选择的影响。博弈问题最重要的核心就叫互动,我几点能到,我用多长时间能到?比如说这路比较拥挤,我可能就得选一选,有些路比较拥挤的时候,我可能要避免,博弈问题,就说我几点到既受我的选择影响,也受别人会不会采用这条路他的影响,这就是一个博弈问题。核心就说我有相当于一个互动的决策,我在这种互动的环境下,我如何进行最优的选择,这就是博弈论。这样讲不太好,我给大家看一个东西,进入今天的第一个例子。

 这个问题文字的表述就这样,其实本质上很简单,俩人,当然只要有一个人坦白,就能定罪,以前讲课的时候马上就有领导就提出来,周老师,你这个和法律不一样,这个法律是必须两个人都得坦白,最后才能定罪的。咱这是一个例子,这是一个模型,这是一个假设的例子,不要跟现实相对应。假设有一个人一坦白,警方就能顺藤摸瓜,证据确凿,我们就假设这点是成立的。这里边核心的一点,就是坦白从宽,抗拒从严,对不对?如果我们俩

 都沉默,1 年,如果我们俩都坦白,6 年,如果一个坦白,一个沉默,因为他不坦白,他就得多坐 10 年牢,你坦白那个有立功表现三个月。很夸张的一个例子,这是一个假设的例子。

 我给大家一分钟时间,你觉得最优选择是什么?我已经开了弹幕了,大家可以从那个小程序的右上角有一个加号,点那个加号出来一个弹幕,大家就可以把你想说的话写在这儿,是坦白呢还是抗拒呢?好,有领导说了坦白、抗拒、抗拒、沉默,好,沉默就是抗拒。坦白、抗拒、坦白、坦白、坦白、坦白、抗拒、抗拒,都不坦白,OK。我在这边问的是你,不是问你们俩。坦白、沉默、坦白、沉默、坦白、坦白、抗拒、坦白、抗拒、坦白、坦白。基本上是 1:1,我没做这个统计分析,大家还可以接着发,有同学发得比较多,显然是抗拒,有一个选择没有说,就是两个都坦白的优惠条件是什么,好吧,假设没有优惠条件。博弈论会把这样一个故事表述成一个博弈矩阵的方式,咱一会再讨论,表示成一个博弈矩阵的方式。我们来看甲和乙。甲是黄色的。他是行的参与者,我们就说坦白和抗拒。然后乙也是坦白和抗拒。于是这种情况最终的结果就是四种结果,两人都坦白,俩人抗拒,甲抗拒乙坦白,甲坦白乙抗拒,这 4 种情况。在这 4 种情况,根据刚才的我的案例提示,我就可以把收益写在这儿。其中前边那个数字代表的是甲参与者、行参与者它的收益,后边这个数字代表的是列参与者的收益,所以大家一下子就应该能明白了,是不是?很清楚。好。我们现在先从理论上来看看这个解,事实上就

 是要找到这个解的纳什均衡。其实讲囚徒困境这个例子不太容易理解博弈。其实现实当中最容易理解博弈的就是石头剪刀布,对吧?这是个博弈。我们来想想石头剪刀布博弈,你会发现博弈问题它的思维为什么难。我告诉你,因为它思维存在着一个无限的循环的链条。你看,我告诉你,我要出石头,你的最优选择是什么?你要出布。如果假如说我知道你出布,我的最优选择就是剪刀。如果你知道我是剪刀呢?你石头。你知道石头我就是布。然后如果你知道我是布,你是什么?你就会是剪刀。你会发现这个时候互动的角色当中这个最优解是很难找的,因为它不停的在变,当然我举的是一个你很容易理解的这么一个例子。那么什么叫你的最优选择呢?你发现你找不到,因为它一直在变,是不是?所以它就存在着这么一个无穷的链条,这个链条被谁打开呢?纳什。纳什告诉我们,在这种互动的角色当中,什么是你最优的选择呢?就是达到均衡状态,达到均衡状态。这个均衡,后来我们就称为它叫纳什均衡。纳什均衡就告诉你,有这么一个或者多个策略组合,具备这么一个特点。在这个组合当中,所有的参与者面临一种情况,当其他人不改变策略的时候,这个时候你的策略是最好的。什么叫你是最好的呢?你只要一改变,你的收益就会下降,对不对?就是这么一个案例,例子。好,我们结合囚徒困境,我们来看,我们来看看双方都坦白,具不具备这样的一个特征呢?于是我就说我们俩和这位领导,你坦白我坦白,当你坦白我坦白的时候,我就想我这个时候是坐牢 6 年,对不对?6 个月。我会

 不会改变呢?我就想如果你坦白,我改变,我变成抗拒,变成沉默,我发现我不管你,我自己就怎么着?就要坐几个牢?坐 120个月,做 10 年牢。我不傻,对不对?所以我不愿意改,我不愿意在你是坦白的时候,我从坦白变成抗拒。能理解吧?所以这个组合就具备纳什均衡的特点。明白吗?符合纳什均衡的定义。再来看看,双方都抗拒,具不具备这特点?你就想如果你抗拒,我也是抗拒,我们俩同坐一年牢,我会不会改成你抗拒,你知道你要抗拒的话,我会不会有改变成坦白的动机。你发现从纯收益的角度来讲,你是有这动机的。因为坦白从宽,抗拒从严,当我知道你抗拒,我就有变成坦白的动机,因为我会从坐一年牢变成坐三个月的牢。我不管你最后是一个什么情况,注意了,我不管你的这件事情,就是追求你个人的收益最大化的一个表现,所以你会发现,从纳什均衡的角度来看,双方都抗拒,不具备这样一个特征。因为知道你要抗拒,我是有改变的动机的,最后改不改不管,但是我有改变的动机。事实上坦白从宽,抗拒从严,也就使得你有坦白的动机。于是从纳什均衡的角度来看,双方都坦白是两个理性的囚徒,他的自由选择。当然,很清楚,我们公安局,我们警察是愿意看到这种情况的,他肯定不会设计一个机制,让你们所有的人进去都抗拒,都跟你沉默,他其实不希望是这样的。刚才我也看到有位领导发了一个弹幕,说也许一开始的时候想抗拒,但是到最后可能还会坦白,反正你就在局子里关着,我们想各种各样的办法,甚至不想办法,就让你自己去想。时间长了,

 真的这种坦白的动机可能会越来越强烈,这就是纳什均衡。

 纳什均衡的这种思路,我怎么来体现?也就是,周老师,能不能告诉我,以后我回去看各种各样书的时候,我怎么样分析纳什均衡,我告诉你一个很简单的办法,就这种,这叫找到纳什均衡办法,叫划线法。特简单,我就先想想,假设自己是甲,然后我假设乙是选坦白,如果乙选坦白的话,那边我就过不去了,你看甲选坦白的话是 72,坐牢 72,选抗拒的时候坐牢负 120、负72 是要好于负 120 的,是要大于负 120 的,于是我在这种好的选择下边,我画一个横线,这代表当对方选择坦白的时候,我的最优选择。当乙抗拒的时候,你的最优选择是什么?还是坦白,因为负 3 大于负 12。我看完甲了,我分析完甲了,我就分析乙,分析乙就得横着看,因为乙的两个选择是坦白、抗拒,于是我怎么办,我先假设甲是坦白,这是刚才那个。我假设甲是坦白,横着比,乙是应该选坦白还是想抗拒?也应该选坦白,当乙假设抗拒的时候乙也是选坦白。纳什均衡是什么?双滑线,可以理解了吧?有了这种办法,我们自己就可以回去玩了。可以分析一些博弈,分析找到,前提是两个理性人。记住了,前提是两个理性人,都是追求自己收益最大的。

 其实我知道在座的各位领导,心里有不服气的,肯定你们心里有不服气,说周老师,你会发现两个人都坦白,每个人做了六年牢,显然不如两个人都抗拒,因为如果两个人都抗拒,最后两个人都做一年牢,对我们俩都是很好的,是不是?

 好了,这就是囚徒博弈说他是囚徒困境的由来。而这样一个问题其实反映的也是博弈论当中的两种不同的视角。第一种视角叫非合作博弈的视角,就是每个人都会坚持让自己的收益最大,追求自己的收益最大,而合作另外一种视角叫合作博弈的视角。合作博弈视角追求的是团体、群体、整体的利益之和为最大。于是你就有了这种,如果从我自己的角度考虑,我应该先坦白。但是我们俩关系特好,特哥们,我们俩考虑事情的时候,都是考虑我们俩加在一起的收益,你会发现从集体收益最大的这样一个角度,双方都抗拒是要好于双方都坦白的。从经济学的上来讲,这叫一个帕累托改进,存在这种可能,让大家收益都变好这种可能。因此这就是困境。困境就是你个体的收益和整体收益,他们得到的最优的症结是不一样的,这就是困境。你在这种情况下,你到底是从我自己的角度考虑,还是从集体的角度考虑,这是个问题,这是一个两难的选择。那你会发现这里边就存在两种理性,第一种叫非合作博弈视角下的个体理性,以及整体收益最大下的一个集体理性,这就叫困境。实际上以前这个问题不是一个,怎么说呢?我想到一个词,应该是一个很常见的问题,包括我们党也一直要求我们要个体利益与集体利益相统一,就是这么一个问题。从博弈论的角度要告诉你,这是困境。

 同时我们也可以看到在现实当中抗拒、沉默可以被认为是合作,刚才说了合作博弈的这样一个视角,可以认为是合作的一种体现。于是现实当中我合作还是不合作,这就是个问题。关于这

 个问题我一会儿还会讲。

 在这我先插一句,当我们知道了纳什均衡之后,我们就可以思考第一个提示,制度应该是一个纳什均衡。刚才我分析了,双方都抗拒不是一个纳什均衡,为什么呢?有人有偏离动机,对不对?纳什均衡,大家都没有偏离动机,单方面偏离动机。所以对于我们的管理者,我们在做制度的时候,一种乌托邦或者一种理想的境地,我们也希望我们的制度是一个纳什均衡。因为只有制度是纳什均衡的时候,所有被管理者包括所有的管理者,他才没有单方面去偏离的东西。不知道大家能不能理解,当然我也告诉大家,这是一个理想。对这个问题非常敏感的领导马上就会想到一个问题,合作能否成为个人理性选择最优呢?这也就是我们党所提出来的,集体利益和个体利益能不能统一呢?这是一个非常重要的问题。这个问题我们说一会我们叫走出囚徒困境,我们目前的这个博弈仅仅是一个一次性的博弈,这种分析,我们一会会告诉你几种方式,可以让大家在现实当中呈现合作行为。我刚才主题的时候我已经说了,社会的秩序当中的第一个就是合作如何得以可能?这个问题我们就先放在这。

 讲下一个问题,集体理性能否成为纳什均衡?在现实当中我们好多的这种问题,比如说亲社会和行为如何能够得以可能?集体利益能否成为个体利益?我们能否走出囚徒困境或者叫社会困境?讲完这个例子,我就想测验一下,让大家来看看,让大家来体会一下。好,我们现场来个游戏。我假设在座的每位领导,

 我们都拥有一家企业,都生产的是同种产品,现在你必须决定选一还是选二。选一就意味着你会生产高质量的产品,来帮助这个产品维持在市场当中的地位,维持一个比较高的价格。或者你选择二,你说我可以选择模仿,通过仿制产品来获得收入。

 我的场景设定是这样的,我的收益设定是这样的,根据选一的学生总数,把收入分给在座的所有人,因为选一是维持这个商品的市场地位,对不对?所以每个人都是会受益的。第二个,每个选择二的学生都会比选择一的学生多得 0.5 元,就会多得一部分钱。现实意义是什么呢?模仿的生产成本要比生产高质量的这个产品它的成本要低。选择二的人越多,全班的总收益其实会越少,对不对?相当于是最后大家都是仿制产品,都是一个低质量的产品。

 在我们本班本班我有制定这么一个特殊的规则,每位选择 1的同学将会为班级总收入贡献 100 块钱,也就是说班级总收入是100 乘上我们班选 1 的同学。我会把这些总收入平均分配给所有的同学,其中选 2 的同学会多 20 元,真实的。

 好,这时候请大家看一下,大家的手机上又多了一套投票题。请问大家你会选 1,还是会选 2?我们一会让大家讨论,我已经说了请勿讨论,你是会选 1 还是会选 2?不是掏出,你只要你选1 为班级贡献,不是你掏。这 100 块钱是我给。只要有一个选 1的,我就会给 100,就这意思。全班都选 1。好,还有 50 秒。现在我们班已经有 38 位同学已经选了,40 位同学选了,还有 10 位

 同学没选。好,42 位同学了。还有没有要选的吗?好,没有人要选的话,我就收题了。大家肯定特别关心选择的结果,最后是 44个同学选了。我们班一共有 33 位同学选了 1,我们班的总收入是 3300 块钱。其中每一位选 1 的同学,你获得的是 3300 除上44。记住了,因为我要把你们班的总收入平均分配给所有人,所以是除以 44。选 2 的同学是这个数上再加 20,理解了吧?好,现在我觉得大家应该是真正地理解了这个博弈。

 刚才那次是假的,这次是真的,请大家选择,重新再选,还是不允许讨论。刚才是练习题,现在是正考试。我看到已经有 40位同学已经选了。好,大家加油,40 位,能再选几个?我真给钱的,所以一定要慎重。43 位同学已经选了,44 位同学已经选了。王老师的全选光了。没问题,这一次比刚才人多了,看来真想要周老师的钱。45 位了,45 位了,46 位了,刚才是 44 个人。好,我估计差不多了,我就收题了,我就收题了,不耽误时间了。比刚才好,我们班一共获得了 3800 块钱,对不对?然后除上 46 个人,其中选 2 的那 8 位同学,每个人都 20。在我们班的这个情况我是有预期的,肯定是这个样子的。但是你要知道,我要是在本科生里边做这个会非常地快速。大家所有人都选 B,我们这样一个群体,长期受我们党的教育。对不对?我们很清楚,选 1 是对大家都好的,因为你应该知道,在这种情况下,只有所有人都选择 1,是大家都能获得最高的收入。

 最后自由讨论,选 1 还是选 2?你们现在可以讨论,像刚才

 这位领导提的,答案明显都觉得选 2 收益更高,对自己更好嘛。大家如果都这么想,那你只能 20。是的,对不对?如果所有人都这么想,就只能当 20。这个没有共同的,肉回来,汤也是别人的。这个结果你会发现不同的群体会有不同的选择,确实是这样的。如果真的一次,每次我都给你钱,真的给你钱,你们真的会那么坚持一直选 1 吗?这是我的一个疑问。同意,说得好!价值观的问题,非常好。如果真的,我每次真的都给你钱,你每次都看到选 2 的会多 20,选 2 的会多 20,你们说 20 不够。好,我 1000,200,你们会怎么样?每次那个人都比我多 200,每次那个人都会比我多 200。

 我也告诉大家某次实验,一个现实的例子,全班,是学生的例子,一个现实的例子。就是我做了这么多次实验的一个真实的例子。这个班全班是 27 个人,演练这个博弈,演练这个博弈,从不允许讨论到允许合谋,结果愿意合作选择 1 的同学从 3 到14 不等,我们的比例是要比这个高的。那个最多是一半,最多是一半。在最后一次带有协议的博弈里边,我就让这个同学说,你起来号召一些大家,你是班长,你号召一下大家,都选 1。当然我是演练这个博弈演练的 10 次,大家反复体验,反复体验,是这么一个。于是全班选择 1 的同学只有 4 个,最后大家都说选 1、选 1、选 1,但是最后选的时候你会发现还是选 2。这位同学最后发表感想,他说我这辈子再也不会相信任何人了。那我就问,你选的什么?他说我选了 2。这是一个非常好的一个问题,我们到

 底要不要合作,要不要出现对大家都有利的这么一个行为,事实上就这么一件事情。现实当中,我们班非常好,但是不一定所有的人都会这么想。而我也告诉你,有很多的例子不是这样的。

 现实的例子,困境对不对?我们都已经学完这个博弈了,我们很容易建一个博弈模型来帮助你来分析。你会发现,我现实当中这里边两个博弈的局中人,假设赵宣子这儿就只有这一个岗位,这两个人来进行竞争,玉戭生、三乌丛臣,你可以选择巴结还是不巴结? 我们说巴结可以让你获得更高的被提升的可能,假设就存在这么一件事情,于是两个人都巴结或者两个人都不巴结,大家都可能落选或者是晋升。而如果你巴结,他不巴结那巴结的人就晋升,就这么一件事情。同时我们假设升官是要好于升官或落选,再好于落选的。假设每个人有这么一个排序,在这两个假设的前提下,其实我们用数越大,我们假设用 3 来表示升官,用 1 来表示落选,用 2 来表示升官或落选。相当于有个排序,你把这个序往这儿一填,这就是 2、2,这也是 2、2,这是 3、1 或者是 1、3。说周老师,刚才你已经告诉我画线法了,是不是?我马上一分析,什么是纳什均衡?自己回去当做一个作业,双方都巴结。所以告诉你,一旦深入其中的时候,可能个体理性就会占优了,或者是你更多的会考虑,这就叫困境。就是你明明知道那么做是好的,但是现实做选择的时候往往会让你非常的难受。说周老师,这个问题这么严重吗?我们说纳什均衡是自动实施的,这个问题

 这么严重吗? 其实我给你举一些例子你就知道了,你看美国波士顿犹太人屠杀纪念碑的铭文,他也告诉你了。起初他们追杀共产主义者,我保持沉默,因为我不是共产主义者,接着他们追杀犹太人,我保持沉默,因为我不是犹太人,后来他们追杀工会会员,我保持沉默,因为我不是工会会员。此后他们追加天主教徒,我保持沉默,因为我是新教教徒,最后他们奔我而来,却再也没有人为我说话。这就叫困境。

 说周老师,还有例子呢?38 个人目击凶手,没有人报警,说什么样的一个故事呢? 集体冷漠就是一种困境,其实每个人都知道自己应该去伸一把手,但是现实情况不一定这个手你会真的伸出去。我们专门建立一个博弈的模型,来分析这种情况。很简单的假设,你是会选择合作还是不合作?会伸手还是不伸手?其实取决于两个条件,第一个条件,如果至少有一个人,其他人合作了,你会发现你应该选择不合作,因为你报警是需要有成本的,0 是不是?你不合作,就是不去救,你知道有别人会去救,你不去救是好于你去救的,因为你要付出成本。那么如果其他人都不合作,你就意识到这个责任是你的,你的合作就好于不合作。

 在这么一个参数条件下,有这么两幅图,就告诉你这样一个叫志愿者困境的一种情况。它会告诉你,这是图,网络不太好。前一幅图告诉你的是,随着横坐标是参与者的人数从少到多,从

 1 到 10。纵坐标第一个图代表的是一个参与者会参与合作的一个概率,你会发现就像我刚才的那个动画片所示的,随着参与人数的越来越多,他会选择合作的概率是低的。同时至少有一个参与者会选择合作策略,也是随着人数的增加是在降低的。这两条曲线就说明了集体冷漠有它理性可解读的一面,对不对?有同学说是正常的,当然有这种价值判断在其中,至少我们从这种很客观的,从一个人是理性的,他会顾及自己的收益,就是这么一条曲线。

 博弈论里边这样的例子有很多我们就把它称为社会困境,比如说这些结论都是数学模型的结论,我在这不跟大家讲数学模型了。但是我一提,我觉得大家就应该能明白,这就是社会困境。比如说公共物品的私人提供意愿是不足的,什么叫公共物品呢?我们作为管理者,我们其实就是管这个,让大家都受益的这么一些东西,我们就称为叫公共物品。注意了,公共物品让一个私人来提供,这个私人的意愿是不足的模型结论。第二个,公共绿地是会被过度使用的。如果不管理,让大家都去在一个草地上放羊,最后就会造成这个草地的崩溃。第三个,比如说军备竞赛是很难遏制的。

 别着急,我再做一个现场的游戏。今天早上,我这个真是可以给钱的,但是我今天没带,我从来不不忘带钱包,但今天就忘带钱包了,好像一说出来是我要取代。规则是这样的,我这儿有100 块钱,一会我可以请我们组织部同事,借给我 100 块钱,真

 的 100 块钱。现在在座的各位,我要干嘛呢?我要拍卖我这 100块钱,拍卖这 100 块钱,你们就说可以喊一个数,比如说喊 5,喊 5 的意思就是说周老师,我要拿 5 块钱,买你这 100 块钱,换你是 100 块钱。那大家都可以叫,而且拍卖,肯定是价格越来越高,我的规则是两个。第一个,所有人从 1 元开始叫,从 1 块钱开始叫。就是第 1 个人,你要想拿走我这 100 块钱,你要喊 1,后边的加价,必须要加 1 的整数倍,1 的整数倍。第二条规则是,最后价高者得到我这 100 块钱,谁叫的最高,谁能得到我这 100块钱,同时价高者,最高者和次高者都需要把你叫的这个数给周老师。尤其是最后一条,大家要注意了,就是最高者和次高者,都要把你叫的那个钱给周老师。好,你们可以思考半分钟,我们就开始。会不会超过 100 块钱?我们就开始,真的 100 块钱,真的 100 块,不是假的,我真的给。和刚才不一样,这次是真的给。号,半分钟到了。大家不讨论了,现在我们拍卖开始,第一个人必须从 1 块钱开始叫。1 块。1 块。50。50。好。真的会给,谢谢,我一会还给您。老师直接给 50 就行了。咱不要商量,来,我在这拍卖。51、50。51、50、52。赔了,这就赔了。52、51。52、51,您是 51,其他同学还可以再叫。估计没人叫了。你还要叫吗?53。53、52。还叫吗?53,100。100、53、100、53。101。101、100。102。102、101,102、101。你俩都要。还有没有,接着叫三次?对。我叫 3 次,102 第 1 次。103。103。少点。没事。他这 102 还是 103 是吧,还要吗?再加 1 块钱。还加吗?就 1

 块。

 那你可要给我 102,你给我 103,我会把这 100 块钱给你。知道我为什么可以拿真钱了,对不对?基本上我没有亏过。都会算。其实今天我们不够激烈,最后我们这叫到,在我们实习班当中叫到上千的都有。因为这俩人到最后会怎么样呢?会失去理性了,他不是为了纯收益了,到最后是为了面子。军备竞赛,想想是不是这样?因为老大、老二肯定都是要投入的。这个博弈叫什么博弈呢?这叫斜坡博弈。斜坡,它是一条线的,只能往底下走,它是一条线的。所以周老师不会亏。但是这种你很清楚,如果两个人都不在叫了,可能对于大家来讲是比较理性的,但是实际当中往往到最后,你超过我,我要超过你,我再超过你,我再超你,这就是军备竞赛。博弈论还挺有意思,他就用这种很小的这种游戏。它能告诉你这么一些道理,这也是困境。因为大家不搞军备竞赛,其实对于所有人,大家把这些军备竞赛用的这些钱投入到民生,让老百姓们越来越好不好吗?但是有的时候。当然我们的分析只是一个局部的,只是一个片面的,只是一个局部的。大家都把它当做游戏,把这个当做一个结论,体会一下就 OK 了,和实际结合的时候,往往这个信息我们不能通过一个游戏来帮助你来判断。但是告诉你了,军备竞赛是很难以遏制的. 价格战总会存在,价格联盟是无效的,可以在网上去搜价格联盟,一个协会所有人卖家用电器,大家就说不再涨价了,但是过一段,虽然不再降价了,他就开始搞促销,送东西,你最后发

 现价格战永远,当然对老百姓是挺好的,但对这个行业未必是好。价格战它总会存在,价格联盟到最后,那只是一个自律的联盟,一点用都没有,这就是困境,当这种困境来临的时候,其实在这里边也希望大家对改革有一个思考,大家为什么不愿意走出这一步呢? 其实,我觉得今天在现场,讲的有点多了。现实当中还有一个游戏挺有意思的,大家可以回去跟自己的爱人来玩,比如说假设两个人一共有 10 张牌,每个人每次可以拿一张或者两张,谁拿到最后一张牌,谁赢,这是一个博弈的规则,这是一个动态博弈,你会发现在这个博弈当中会有先动优势或者后动优势,我也记不太清楚了。而如果是 11 张牌的时候,可能是恰恰是相反的,所以和刚才的困境,大家谁愿意走出第一步以及先动和后动这样一种优势和劣势,可以帮助我们来进行思考。

 思考什么呢?我们来看改革事实上就是要破除思想上的说服,但是我们很清楚,并非所有的改革都对自己是有利的,于是改革从总体上,我们简单的做一下分类,有先动优势,也有先动劣势的改革,那么很清楚,如果是先动优势的改革,大家都有意愿,而先动劣势的改革,大家都没有意愿,比如说之前老早就提研究生收费,当然现在研究生都已经收学费了,但是一开始的时候,我们教育部就提哪个高校愿意试点呢?你会发现大家都不愿意试点,那很清楚,北大不收费,北师大收费,那学生更往北大跑了,是不是?这就叫先动劣势,为什么我们总书记现在说我们

 的改革进入了深水区,当然有很多很多的原因,其中有一个原因,现在我们的改革有很多都具有先动劣势的特征,这时候大家都观望。于是我们总书记从十八大一开始就提,对于改革我们要怎么着?顶层设计、整体推进,就是因为没有人愿意走出第一步,先动是劣势的,所以我们必须要整体推进,研究生收费的改革也是我们教育部统一下的命令,所有高校研究生必须收费,最后才有这件事情,所以我想通过这样两个例子,大家也可以来熟悉。我们理解现实当中的这样一个改革. 讲到这里,其实第二个题目马上就呼之欲出了。走出社会困境,合作如何得以可能呢?合作如何得以可能?合作是一个对于从整体收益出发,是一个集体理性的一种表达。如何能够成为个体理性的自由选择呢?这是一个非常重要的问题。说周老师,有那么重要吗?这不仅仅是一个现实当中我们管理非常关注的一个问题,更重要的是《Science》最有名的或者是最著名的这么一个,就是我们科研人员的这样一个期刊,《Science》。它总结了 21 世纪有 100 个科学难题,其中排第 15 位的就是合作如何得以可能。当然了,现在我们,包括我的科研方向,其实也是围绕着这个在展开。因此有很多的结果,和今天体会我们习总书记治国智慧相结合,我大概讲这么三类方法,或者是三类这种基本的思路。第一个,事实上最直接的就是改变参与人的偏好,通过价值观引导,通过一些实际的操作手段,事实上刚才我们看到了这样一个囚徒困境,它的例子。

 如果我们按照我自己来分析,我们来看,事实上如果我是甲,我能得到的收益的可能大概是坐牢 3 个月,坐牢 12 个月,坐牢72 个月,坐牢 120 个月。其实这个具体的数不重要,从博弈的分析来讲,博弈最关心的是比较大小,因此我们会发现,其实我坐牢 3 个月是最好的。于是我把这个最好用 4 来表示,因为 4 种情况,你说 5、6、7、8、9、10 都无所谓,反正它是最好的。其次是我坐牢 12 个月,再其次是坐牢 72 个月,最后是坐牢 120 个月。你把这样一个通过坐牢月数表达的收矩阵,表述成他们排序的偏好的这么一个矩阵,你马上知道他们俩的最优解,也就是纳什均衡是一样的。你一画,大的下边画横线,通过画线法,你马上就知道双方坦白,是纳什均衡。好了,第一种机制或者叫第一类机制,事实上就是改变一下这样一个偏好序,就这 1、2、3、4 这样一个排列顺序,就有可能使得双方都坦白,不是纳什均衡了,就变成了双方都抗拒是一个纳什均衡。当然了,这样的一些机制可不可信,就是一个非常重要的问题了。要想改变这个偏好序,我们怎么来改变呢?整体上有两种方式,第一种,通过对不合作的人进行惩罚。当然这种惩罚我们要求必须是可置信的惩罚,对不对?必须是可置信的惩罚,才能让他真的,当他不合作的时候有一个很大的成本在等着他。那么改变了他的实际收益,就有可能改变这样一个偏好的顺序,我不知道大家能不能理解?不知道大家能不能理解。如果公安局有一天说我鼓励你沉默,我鼓励你这个什么,于是我没有什么坦白从宽,抗拒从严,我反过来,

 我是沉默从宽,坦白从严。假如这样一个机制的话,他这个偏好序就会发生变化。法律就是告诉你,当你不合作,出现一些不亲社会的行为的时候,我要对你进行惩罚,我要让你有切身的这种收益上的减少,通过这种切身的收益上的减少,就让你改变你的整个的这种偏好的顺序,改变了人的偏好,就可能使得最优选择发生变化。我们习总书记一开始就提要从严治党,对不对?执法要严,一开始就提。我们事实上有很多有很多甚至很好的这种法律,但是我们在执行过程当中,事实上并没有真正的把它给做了。所以我认为习总书记从十八大以来首先要做的是取信于民,取信于民其中非常重要的事,我们说到我们就要做到,就叫可置信。

 这里边我引一个我自己的一个,就是通过这个统计分析得到的,因为我们经常说新加坡的人素质非常高,咱就拿中国跟新加坡来比,你就会发现法制环境是不一样的。为什么我们习总书记一上来首先提的就是依法治国,其实不是习总书记先提的,在我们之前 N 多年,大家都一直在提依法治国,当他出现不文明的行为、不合作的行为、不清澈的行为,他有鞭刑,而且是公开的鞭刑。你想想?就能改变你收益的偏好的续,从而你就会知道你的最优行为应该是什么?我想这就是依法治国,他的作用所在。

 仅仅有法律行吗?我们习总书记还有说以德治国,我这张PPT 放的是一群猴子,我要告诉你的是,猴子是群体当中一个猴群,他们是群居动物。猴群当中都会有一只道德高尚的猴子。什么叫道德高尚的猴子?中午到饭点了,所有猴子要在一起吃饭,

 一定会有一个猴子站在树上,它不吃饭,它干嘛?站岗放哨。它是在牺牲自己的利益,来使得群体能得以繁衍发展,得到安全、这就是一只道德高尚的猴子。

 我们习总书记提的很明确,这两者要怎么着?这两者要相结合。我们习总书记显然他也是关注到这个问题,所以他曾经提过不让老实人吃亏,我想这也是可以让我们,咱不一定让他先富起来,但是不能吃亏,有这么一个。但是有一点,如果这个社会全是道德高尚的人,你觉得会怎么样呢?全都是为他人着想,为我们两个人着想,或者直接为他人着想,全是这样的人,会是什么样子呢?我又做了一个动画片,大家来看看。

 这样一个故事告诉你,如果这个社会全是道德高尚的,当然假想的例子是个预言,是假想的故事。但是如果真到了那一步,很多潜在的交易其实都可能发生不了,对于这个社会来讲可能是无效。我想习总书记是非常清楚的,纯依德不可,纯依法可能也不行,一会我告诉你,一会我跟我给你举例子,你必须要两者在一起相结合。我想德和法都是在博弈论当中改变人和人的偏好的这么一些方法,习总书记提了必须要以德治国与依法治国相结合,提到任何时候法律是准绳,道德是基石。

 有的时候我会把德和法,和原则和准则相对应,德其实更像原则,而法其实更像准则,像办法,当然我们刚才说是法律。有的时候我们会发现现实当中我们做事情,做管理的时候,这种情况我在这指出来,我觉得是一个很普遍的一种事情,我们做管理

 的时候,往往可能更重视法,你会发现仅仅有法可能会得到很多很多很奇怪的现象。我说德与法,或者原则和准则往往有的时候会相背离。在经济学当中,有一个阿罗不可能定理,它告诉你,你想通过一套制度去解决所有的偏好,这件事情,这种最优选择是不存在的。也就是你想通过一个完美的契约,或者是一个完美的法则,或者是一个完美的实施办法来实现这个原则,往往不是这样,这件事情是不可能存在。所以这就提醒我们做管理的一定要把这两者相结合。在实际当中,我们系统科学比较推崇的是定性、定量,要相结合。不能完全的定量,但是也不能完全的定性,只有把两者结合在一起,才能最终得到的这个结论可能才是,我们想要看到,否则的话就会有偏离,而这样一种偏离,我觉得现在在不同领域当中还是挺常见的。我们总书记一直在提醒我们,一定要不忘初心,一定要以我们最终的一个标准,当然可能不可量化,作为我们共产党人的奋斗目标,它可能不能量化,但是我们不要忘记,那可能是在决定我们任何成果,任何工作的一个最终的决定原则,而那只是一个原则。我们现在正在做不忘初心的主题教育,师大也在做。要提醒我们,德法或者原则和准则,有的时候这种偏离情况可能是永远存在的,但是我们不能忘了那个德,不能乱了原则,这是非常重要的。这是第一类,通过直接的一些机制改变人的偏好的顺序,通过道德的宣传以及我们法律的一个直接的一种惩罚,这是第一个。

 第二个,在我们的博弈当中,一定要意识到未来很重要。我

 告诉他,是要用一句比较通俗的话,叫有明天。当你意识到你的管理工作或者你的工作有明天的话,就会改变你的行为。从标准的博弈论体系当中,它告诉你一次性的囚徒博弈双方都不合作,是一个纳什均衡。但是,当你觉得你们俩在一起,假设两个囚徒在一起干坏事,是要看一辈子的时候,甚至是还有来生的时候,合作就是你的最后选择。前提是你必须要意识到我们俩玩的这个博弈是一个长期的、战友的博弈。博弈论告诉你,在重复博弈的情况下,合作可能是一个稳固的纳什均衡。从数学帮你证明。

 从现实当中的例子,我们也可以能感觉到的。我举几个例子,比如说你会发现地摊、车站、旅游点,不但商品和服务的质量很差,而且假货横行。因为在商家和买家和顾客之间没有明天。一个旅客不太可能因为你的饭菜可口而再次光临,一锤子买卖,不赚白不赚,没有明天。但是你会发现,比如说我爱人家在沈阳采油厂,在新民市它其实就是一个小区,周边的农村可以把自己家里的一些农产品,包括自己自制的一些东西拿出来到市场去卖,但是他就服务于这个地方,所以你看他的产品质量都非常高。因为他知道你今天吃了不好,明天就不会再来买。他很清楚,和这儿就是两种截然不同的行为,这是没明天的。而小区或者那样一个社区,它的那样一个购买和销售的这样一个行为,它就是有明天的。

 还有在公共汽车上,两个陌生人可能会为一个座位而争吵。而如果他们认识就会互相谦让,为什么?明天还要见。

 比如,两个原始人见面,一个人拿着兽皮,一个人拿着野果,他们都想把对方的东西据为己有。如果他们的见面是偶然的,会怎么样?会抢。如果他们都知道对方生活在附近,结果又怎么样?会换。这也是有明天和没明天的一个思考,给你带来的行为上选择的不一样。

 习总书记是知道这一点的,习总书记也是这样。我的体会在二点上,我是很佩服他的。第一点,他推崇中国的传统文化。第二点,他明确提出绿水青山就是金山银山。仅仅是从可持续发展的角度,我们当然是可以理解。但是从博弈论的角度,事实上也就告诉你,大家平时的这种交易行为、这种博弈的行为,不要只看眼前,要想想以后。当我们所有领导在做我们决策的时候都想得很长远,那么就会改变你的行为。其中传统文化这里边宗教在一定程度上也是传统文化。想到要有明天这件事情上,做得最彻底的其实就是佛教。佛教告诉你,人有来生。你不仅仅是这辈子还有来生,当你想想你还有来生的时候,这时候的自由行为应该是什么呢?一个理性人告诉你,一个理性思考告诉你,你应该想不仅仅想今生,还要想来生,还要想来生以后。这个时候你应该是一个什么样的行为?因此我们说传统文化包括宗教,在于稳定人们的这样一个预期的,它是有作用的。宗教是传统...

相关热词搜索:治国 党课 讲稿

版权所有 蒲公英文摘 www.zhaoqt.net