赵汀阳：冲突、合作与和谐的博弈哲学

发布时间:2020-06-13 来源: 日记大全点击：

　　1．初始状态作为政治起点

　　在解决冲突的研究中，政治学家往往不太喜欢哲学家对道德意义的夸大。道德行为必须同时是优势的生存行为，否则是可疑的。正如宾默尔指出的：哲学家喜欢研究对生活问题的道德解决，并且把道德想象成康德式的理性先验绝对命令，但道德游戏终究必须同时是生存游戏，否则根本行不通[1]。如果道德原则在生存博弈中是没有效率的，那么就是坏的原则。以现实主义态度去解释道德的思路并不新。荀子早就对“礼起于何也”的问题给出了在今天看来属于政治学和经济学的解释：礼这种伦理\政治制度是为了克服无节制的“争”所引起的乱和穷[2]。这与后来以“一切人对一切人的战争”而闻名的霍布斯“丛林”的思路几乎完全一致。荀子和霍布斯的分析都是从一种假设的初始状态去分析合作的条件以及合作规则的生成。初始状态问题后来由于罗尔斯在《正义论》中的杰出工作而成为当代政治哲学和伦理学的一个热点问题。

　　初始状态是一个尚未存在共同承认的游戏规则的特殊游戏，人们在自由选择中形成游戏规则，可以说，初始游戏是在无限制的策略选择中进行的，没有什么是非法的或不允许的。既然每个博弈方都享有最大化的自由选择，就必定暴露出“前道德的”真面目，在充分自由的条件下去做他最想做的事情，而任何一个人的唯一限制就是他人的选择，任何人的选择不得不受到他人选择的制约，这是分析人与他人关系最彻底的理论环境，而所有规则和制度都将在人与他人的互相制约关系中产生。由于规则和制度必须是稳定的，至少是比较稳定的，因此人们关心的是，什么样的人际关系能够导致稳定的规则和制度。

　　初始状态虽是理论虚构，但它对于说明真实生活仍然必须是有效的。这里的“有效性”至少包括两个要求：（1）虚构的初始游戏与真实的生活游戏之间必须是可通达的或可过渡的，大致能够反映真实生活的思维方式和策略选择模式；
（2）作为思想实验的初始游戏所发现的普遍原理表达了比真实情况更正确的博弈选择，因为真实博弈有许多偶然因素，也就可能使人们做出冲动的错误选择。不过，纯粹理论追求“比真实更正确”的理想多少有些荒谬：理论或许更正确，但人们在生活中所追求的未必是最正确的事情，因为没有充分理由能够证明“正确的”就是“更好的”，错误的行为往往创造了丰富多彩的生活和历史，许多人宁愿要“错误的”生活，这就像真实世界中并没有严格的直线，人们也未必就认为严格的直线比不太直的线更好。但理论上的直线对真实的不太直的直线仍然具有说明力。作为理论实验的游戏就是试图发现比真实更正确的选择以便建立对生活的普遍理解。

　　霍布斯的“自然状态”可能是最知名的初始状态。比霍布斯更古老的荀子假设有着基本相同的设想。《礼记/礼运》则相信早期社会是充分合作的“大同”社会，后来才变成私心压倒公心的“小康”社会。马克思主义的想象与《礼记》有某些相似，也相信在导致私心和冲突之前有过原始共产主义。卢梭的“自然状态”版本也很有名，他相信自然状态中人们虽有着自然的不平等（体力和智力），但远不足以导致霍布斯想象的普遍残酷冲突，因为那时还没有什么值得争夺乃至拼命的东西，直到后来出现“万恶的私产”才有了可抢可盗的物品。这些设想都非常有趣，但恐怕都不很真实，历史上真实的初始状态更可能是群体之间的残酷冲突与集团内部的高度合作两种情况并存。为什么不选择真实的初始状态作为理论分析对象？因为真实状态不够极端，没有触及社会可能变化的最好和最差状态的极限，因此没有充分说明力。

　　可以发现，无论是设想一开始就是冲突，还是先有合作后来变成冲突，都同样把所要解决的问题落实在“冲突”上，因此，人们所关心的就是在冲突条件下如何能够产生合作，就是说，给定人人绝对自私，合作是如何可能的？什么才是众望所归的合作原则？初始游戏并不需要真实的历史起点，但必须是有效的理论起点。这个有效的理论起点只能是“人人都只为自己着想”这一利益冲突状态，只有这样才能够清楚地表达出需要解决的社会问题。假如“人人为别人着想”，人们所烦恼的绝大多数问题就不复存在了。因此，任何一个实验性的初始状态所要分析的都是在私心主导的环境中如何形成合作的问题。荀子/霍布斯方案最为简洁：不仅人人自私，而且还可以不择手段。“不择手段”是个真正严重的挑战，可是当代理论家们往往回避这一经典困难，而选择了比较温和的罗尔斯方案。这一避重就轻、掩盖问题的做法是错误的。

　　2．罗尔斯方案的疑问

　　社会契约难免有着特定的社会和时代背景，在特殊背景下形成的社会契约未必是公正的。罗尔斯引入“无知之幕”这一人为博弈条件试图制造平等处境，由此考察人们所能够做出的真正公平的选择。罗尔斯的初始状态中的博弈各方都是自私的，完全无视别人利益，又都是充分理性的，尤其还处于“无知之幕”这一“完全公平的”博弈环境中，人人对自身状况一无所知，不知道自己与他人在各方面的差异，甚至不知道自己的价值观点以及所处的社会和时代[3]。这相当于既不知己又不知彼，甚至不知“魏晋”。罗尔斯设计虽然新奇，但有许多疑点。

　　首先，在博弈条件的设计上，博弈方被假定为只有思维（mind）而没有心(heart)，这种理解在单纯经济学中或许合适，但对于解释社会和生活则是严重缺陷。社会中许多根本性的冲突是心的冲突而远不仅是利益冲突，而且没有理由证明物质利益比精神价值更重要。罗尔斯在规定“人人都需要的”基本物品时就忽视了精神需要，这对于人和生活都是歪曲，因为生活根本不是那样的活法。仅仅从理性和物质利益去理解的社会太过单调，以至于无法由此辨认出任何一个实际上可能的社会。这是现代学术的流行错误。

　　“无知之幕”虽然独具匠心，但无知状态的博弈与有知状态的博弈之间有着无法过渡或无法兑换的鸿沟，因为它们已经是本质不同的世界，不能互相兑换或转换。任何真实的社会博弈都是某种程度的有知状态，人们必须知道自己有什么需要保护的、有什么值得争夺的以及是否有条件争取自己想要的东西，否则这个游戏是无意义的。人们不可能不知道一个游戏是什么样的就盲目同意参加游戏。当然，罗尔斯需要一个充分公平的博弈环境，而自然差异无法改变，弱者对于强者无力以抗，于是罗尔斯用“无知之幕”来让自然差异暂时失效，这样人们在黑暗中就只好选择一个公平的社会契约，以免自己万一吃大亏。这是个很让人佩服的想象，可惜存在着一些严重的困难。

　　其中有一个难以自圆其说的规定：“无知之幕”规定人们甚至不知道“关于好东西的理解”（conception of the good）以及自己的“生活计划”（plan of life），这样人就不知道他想要的是什么了，可是人必须知道想要的是什么才会做出选择，否则又能够选什么呢？这不仅行动不可能，在思想上也是不可能的，其错误相当于说有个“我思”（cogito）却没有“所思”(cogitatum)，或者相当于及物动词没有宾语，仅仅“我要……”是说不通的。罗尔斯知道这个麻烦，为了自圆其说，他假定，虽然人们不知道他们的特殊偏好，但仍然知道那些“对任何人生计划”都必需的“基本必需品”（primary goods）。可这是个更大的麻烦，它涉及一个从来也没有得到解决的“价值排序”问题：在哪些东西算是“基本必需品”这个问题上人们并没有一致意见，而所以没有统一意见，是因为人心各异。把人看成“有思无心”显然是在回避困难，而如果把所有博弈者看作是同心同好的特殊人群（比如说一群葛兰台或者一群弗洛伊德），那倒是说得通了，可是罗尔斯理论就缩水为特殊有效理论而不是普遍有效理论了（罗尔斯不会满意的）。

　　就罗尔斯强调的“基本必需品”来看（个人权利、个人自由、机会和财富），他想象的大概是个自由主义群体。但人是多种多样的，事实上非常多的人会首推“权力”（尼采会同意），很多人会首推“家庭利益”（孔子会同意），如此等等。也许罗尔斯可以把“基本必需品”看作是显而易见的，以避免与无知约定互相矛盾，但即使这样还是有困难，比如说，权利的好处恐怕就没有权力的好处那样明显，权利、自由和机会甚至财富不见得能够换来权力，而权力却能够换来一切，这才是更加显而易见的。即使局限于罗尔斯所罗列的那些“基本必需品”，人们也必定有不同意见，哪些权利是基本的？哪些权利更应该优先？各种权利之间的冲突如何解决？这些都是未决的问题。在这样情况下，罗尔斯隐去了对价值的理解（conception of the good）而又承认关于“基本必需品”（primary goods）的知识，此间矛盾恐怕难以避免，因为后者依赖着前者。对尚为确定的知识的非法透支是一种很隐蔽但不可接受的学术赤字。

　　罗尔斯的初始状态背叛了霍布斯思路并且回避了霍布斯问题。荀子/霍布斯问题才是必须克服的真困难，而且它把各种可能的困难都考虑在内。而罗尔斯问题在规模上要小得多，基本上局限于如何理性地形成社会契约。实际上，即使有了社会契约，合作的难题也并没有因此被真正缓解，契约并不能限制人们以合法手段互相坑害并且在必要时撕毁契约。社会始终存在着这样一个悖论性的局面：在大多数情况下，尤其从长远考虑，合作对于博弈各方（无论强弱）明明都有利可图，但合作却总是非常困难，人们总是难以超越个人的眼前利益。罗尔斯的“无知之幕”削弱了这个博弈问题的难度，它使得人们在黑暗中人人自危，只好“几乎必然地”选择了罗尔斯预先准备好了的合作方式。这个事先安排好的圈套不能代表人们真正自愿的选择。“无知之幕”下的选择是对初始博弈这一严重问题的一个轻浮解决。

　　即使按照罗尔斯的游戏条件而就事论事，“无知之幕”也并非必然地产生罗尔斯式契约，特别是其中最有名的“差异原则”。“差异原则”声称，如果社会不得不出现某些不平等的制度安排，那么这些不平等的制度安排必须为了最弱势群体的利益最大化。很多人赞赏这一劫富济贫倾向的制度安排（也有许多人坚决反对，例如诺齐克等）。但问题是，它虽是个广得人心的道德要求，却不见得是一个必然的博弈结果，即罗尔斯契约并不是罗尔斯条件的唯一必然结果，而只是多种并列的可能结果之一，甚至不是最为可能的结果。如果罗尔斯契约只是或然结果的话，罗尔斯方案的意义又将有进一步的损失，即罗尔斯原则不但并非普遍有效，而且并非人们的必然选择。

　　罗尔斯以“无知之幕”得出其公正原则的过程中存在着博弈论上的技术性疑点。他应用博弈论的“极大极小定理”(maximin principle)去分析“无知之幕”条件下的理性解。给定人人自私而无视他人利益，人们将理性地避免对自己最不利的情况而选择风险最小的结果。无知之幕让人们人人自危，无法知道揭开无知之幕之后自己的资本和地位，因此人们宁愿选择一种最保险的社会契约，以免处于不利地位时完全成为失败者。罗尔斯相信，出于风险规避的考虑，人们将必然选择一个保证每个人同等自由权利、机会均等然后又保证照顾弱者的制度安排。问题在于，罗尔斯方案未必是唯一的理性解，而只是多个可能解中的一个，而且未必是最可能的解。可以这样分析：

　　（1）罗尔斯以一个自由主义偏好去猜想人人必然优先考虑个人自由，这已经可疑。事实上人类经过无数残酷经历之后才认识到个人自由的好处，人们不可能先验地拥有“个人自由比别的事情更重要”这一经过长期实践才产生的知识，何况这也不是普遍必然的知识。在某些社会和自然条件下，个人自由未必优于集体利益，比如说资源非常匮乏的情况下，集体共产很可能就是大家勉强存活的条件。按照“无知之幕”，人们并不知道社会、时代和资源的情况，因此在“自由”、“平等”、“平均”、“共产”等等选择之间，并没有根据和理由去证明哪一种能够避免最坏结果。缺乏清楚的语境，一切都是未知数。假如一定要做出选择，在“无知之幕”的压力下，人们恐怕更容易接受保险系数最大的集体主义契约，因为“有难同当，有福共享”的集体主义契约比自由主义更符合风险规避原则。罗尔斯似乎算错了自己出的题。“差异原则”虽有平等主义倾向，但自由主义要求的制约使它不是真正的平等主义，只是比较保险的而决非最保险的策略。相比之下，利益均分的平均主义就比罗尔斯的选择更符合理性要求了。

　　平均主义策略可以这样分析：由于无知之幕，每人落在任何一种地位的概率是同样的，类似于抓阄，根据博弈理性，利益均分是风险最低的策略，(点击此处阅读下一页)

　　但我们又知道仅仅有这些条件是不够的，那么，到底漏掉了什么条件呢？许多人寄希望于信任[12]，可是“信任如何可能”与“合作如何可能”是等价的（尽管不等同），因此不能把信任看作是合作之前就已经存在的条件（在许多时候，合作是信任的条件而不是相反）。有信任就可以有合作，反过来，有合作就可以有信任。我们需要的不是信任和合作之间的循环解释，以信任去解释合作等于废话。人们苦恼的是在没有信任的情况下怎样才能形成信任，或者，如何从不合作形成合作。显然，如果有信任就不可能有“囚徒困境”了。人们还知道公正的制度能够维持合作，但公正制度更加不是在合作之前能够出现的条件，而是合作的成果。由此发现，公共领域既然是一个话语制度，也是在合作之后的产物。于是，前面总结的三个条件又必须修改为：（1）每个人都拥有自由选择的能力；
（2）长时间的未来；
（3）语言交流。

　　这是一组弱化了的条件，在（1）中，“自由”不再是作为权利的政治自由（liberty）而只是作为能力的自由（freedom），因为权利体系也是一个制度；
在（3）中，作为制度存在的公共领域也被弱化为自然状态的语言活动，它无须是理想的对话，人们可以说谎，可以说不正当的话，但这仍然能提供大量信息，能进行谈判。这样的博弈环境几乎回到了荀子\霍布斯的初始状态。如果说对荀子\霍布斯的初始状态有什么修改的话，仅仅强调了语言活动。在语言中进行博弈可以象征性地代替许多实际冲突。既然语言活动是代价最小的博弈方式，就应该是博弈的首选方式。从维特根斯坦到哈贝马斯对语言游戏的强调是正确的。

　　给定修改版的荀子\霍布斯初始状态，从冲突到合作的进化是否可能并且如何可能？冲突使人们只能获得最差收益，因此，从利益上考虑，人们有合作动机。唯一缺少的是克服“囚徒困境”的决定性条件，或者说，必然导致由冲突向合作进化的充分条件。艾克斯罗德实验似乎证明了合作进化的条件是“好人帮好人”，它使好人集团拥有胜过坏人的集体力量，可是任何一个好人都没有赢过任何一个回合，最后的胜利只是累计高分。这并没有解决“囚徒困境”问题，因为游戏中存在着太多的善良策略，因此才形成好人力量大的局面，而我们显然不能寄希望于好人多多。荀子和霍布斯所见略同地假定人们会选择有能力建立公道秩序的强人作为代理人，把属于自己的部分权利委托给代理人，代理人因此拥有了权力。那么接下来的问题是：（1）人们到底是因为什么而选择了代理人或代理制度？（2）什么样的制度才能使人们都满意，因而把对制度的反叛降到最低程度？这两个问题的答案非常可能是同一个，即人们发现策略S对所有人都有好处，并且，没有人会因为选择了S而被欺骗并蒙受损失。

　　艾克斯罗德证明，当TFT在长期博奕中获得明显优势，人们不会视而不见而会被诱惑去模仿这一拥有最好收益的选择。TFT所以成功是因为游戏的特殊规则对它有利，这与真实世界有差距。因此，TFT还不是我们所寻找的答案S。但艾克斯罗德实验还是给出了一个重要启示：既然模仿最好收益的策略是挡不住的诱惑，那么优越的合作关系总会被普遍接受而变成制度。现在问题进一步明确为：什么可能是比TFT更有优势而且更具真实性的策略？

　　根据真实世界，我们必须考虑人生的有限性。它限定了“未来”的实在意义。假如人寿千年，未来的分量变得如此之重，人们就更容易合作，但事实上人生苦短，偶然机遇稍纵即逝，“背叛”总是巨大诱惑。那么，什么样的关系才能抵制背叛的诱惑？我们不能寄希望于伦理规范，对于大多数人，伦理规范从来只能抵抗微不足道的诱惑。因此，需要寻找的是一个即使在充分自由的情况下仍然能够形成合作的策略。于是，唯一的可能性是，如果S是最优策略，它就必须形成一种同步对称的利益互相依存关系（SS），即一种连锁的即时现报关系：如果X或Y中任何一方获得正面回报，另一方也必定同时获得正面回报；
如果X或Y中任一方获得负面回报，另一方也必定同时获得负面回报。SS是唯一绝对保险的策略，无论在什么样的可能世界中都是保险的，尤其能够避免“最后的背叛”这种没有机会报复的致命一击。在SS中，没有人能够通过背叛获得任何利益。

　　为了使SS顺利形成，就需要有效的对话。人们需要确定在哪些具体事情上可以形成SS，于是需要有效的试探和协商活动来确定别人也同意如此这般的策略，人们需要达成SS的足够信息。于是，事先的对话就成了唯一可以利用的试探性行为。哈贝马斯的对话游戏包含许多错误，因此我们放弃哈贝马斯式的“理想说话环境”而寻找一种要求比较低的“有效对话环境”。只要对话双方各自提出明确要求，就足够了，至于“真实性”、“真心”和“正当”，都是过分或多余的要求。事实上，明确的信息正是博弈者真正需要的，有了明确的信息就足以在其范围内查明是否存在SS合作的可能性。

　　什么样的条件能使人们决心形成双方利益绝对挂钩的关系SS？对于这个问题，目前的最好答案应该是中国的一个传统观点，即“和”策略（现在称为和谐）。春秋时有过关于“和”的一个至今富有学术意义的争论，按照当代学术语言可以表达为：给定世界的差异状态，差异可能形成冲突，于是至少有两种解决方案，一是“同”，就是消灭差异成一统，这个方案不可取，因为“同则不继”；
另一种是“和”，就是在差异中寻找并且建立互相利益最大化的协作关系。其中的关键论证是这样的：（1）事物之间的和谐是其中任一事物能够生存的必要条件。一种东西单靠它自身不可能生存，任何一种东西都不得不与另一种东西互相依靠而共存，于是，共存（co-existence）成了存在（existence）的先决条件。这是一个深刻的存在论观点；
（2）各种事物只有互相配合才能使其中任一事物发挥其最大价值和意义，事物之间或人之间的互惠关系将使其中任何一方的利益都获得改善，并且这种改善非常可能大于任何其它的可能改善。经典表述是：“和乃生，不和不生”[13]；
“夫和实生物，同则不继。以他平他谓之和，故能丰长而物生之，若以同裨同，尽乃弃矣……声一无听，物一无文，味一无果，物一不讲”[14]。

　　我们可以把SS策略进一步修改为“和策略”：（1）对于任意两个博弈方X，Y，和谐是一个互惠均衡，它使得，X能够获得属于X的利益x，当且仅当，Y能够获得属于Y的利益y，同时，X如果受损，当且仅当，Y也受损；
并且（2）X获得利益改进x+，当且仅当，Y获得利益改进y+，反之亦然。于是，促成x+ 出现是Y的优选策略，因为Y为了达到y+ 就不得不承认并促成x+，反之亦然。在“和策略”的互惠均衡中所能达到的各自利益改进均优于各自独立所能达到的利益改进。从逻辑结构上看，“和策略”是一个互相依存、互为条件的关系，大概相当于逻辑的互蕴关系。

　　“和策略”的要求比较苛刻，它需要存在着各方都满意的利益改进，这样就比帕累托改进的要求更高。问题是，帕累托改进远不足以保证社会幸福。帕累托改进与经济学喜欢说的“把馅饼做大”的观点是一致的，毫无疑问，当财富“馅饼”做得足够大，对大家都有好处，至少没有坏处，但物质上的好处未必能够消除所有问题。可以考虑我另文讨论过的一个“心理学馅饼”问题：当帕累托改进仅仅改善了某些人的利益而维持其他人的利益没有受损，或者所有人利益都获得改善，但某些人的利益改善程度不如其他人那样大，那些利益改善比较小的人们未必感激变大了的“经济学馅饼”，因为人们还需要“心理学馅饼”，而在“心理学馅饼”上之所失可能大于在“经济学馅饼”上之所得。经济学仅仅考虑生存所需要的物质利益而忽略心灵所需要的精神世界，这样恐怕不能解释冲突与合作的问题。只有“和策略”才能达到人人同样满意，不仅在“经济学馅饼”上人人满意，而且在“心理学馅饼”上人人满意。假如与艾克斯罗德的合作原则“自己活也让他人活”（live-and-let-live）作比较，“和策略”则是一个强化的合作原则，表现为“自己活当且仅当他人活”（live-iff-let-live）而且“自己发达当且仅当他人也发达”（improved-iff-let-improved）[15]。表现为“和策略”的利益改进可以称为“孔子改进”。

　　关于“和策略”，最后的问题是：（1）“和策略”是否能成为解决任何冲突问题普遍适用的模式？这一点还没有充分理由来证明；
（2）保证“和策略”得以成立的客观条件是存在着某些巨大可分享的公共利益，而且，各人所能分享的公共利益大于或重于各人所能独占的私人利益。这一点并非普遍现象，很难想象任何一个游戏总能有足够大的公共利益；
（3）另外一个足够诱导人们选择“和策略”的客观条件是存在着互补性利益。但是，是否存在着互补性利益的判断以及对互补性利益的评估显然需要理性对话，有效的理性对话需要人们对各种形势各种事情有着正确认识，而“正确的认识”是很难达到的——正如苏格拉底指出的，如果人们真的有了正确知识就不会犯错误了，可问题就是人们总是没有正确知识。

　　注释：

　　[1] （美）肯·宾默尔著，王小卫、钱勇译：《博弈论与社会契约》第一卷，上海财经大学出版社，2003，§1.2.4.

　　[2] 荀子：《荀子/礼论》：“人生而有欲，欲而不得，则不能无求，求而无度量分界，则不能不争，争则乱，乱则穷，先王恶其乱也，故制礼义以分之”。

　　[3] Rawls: A Theory of Justice. Cambridge, Massachusetts, the Belknap Press of Harvard University Press. 1971, p. 137.

　　[4] 类似的智慧可以参考宋朝张咏公断“兄弟分家产”的故事：兄弟分家，哥哥主持分家，弟弟认为少分了，哥哥不承认，张咏说，其实解决方法很简单，哥哥的财产和弟弟的全部对换就可以了。

　　[5] 石元康：《罗尔斯》，广西，广西师范大学出版社，2004。pp91-97.

　　[6] Rawls: A Theory of Justice, 1971, p.302.

　　[7] （美）艾克斯罗德著，吴坚忠译: 《合作的进化》，上海人民出版社，1996，p.3.

　　[8] R. Axelord: Effective Choice in the Prisoner’s Dilemma. Journal of Conflict Resolution. 24: 3-25. 1980.

　　[9] Habermas：Moral Consciousness and Communicative Action. Cambridge, UK, Polity Press, 1990. p.89.

　　[10] （德）哈贝马斯著，曹卫东译：《交往行为理论》第一卷，上海人民出版社，2004，pp.99-100.

　　[11] 我关于“理解不能保证同意”这个命题的论证参见Understanding and Acceptance, 《les Assises de la connaissance reciproque》，France，Le Robert, , 2003.

　　[12]从齐美尔、卢曼到福山等人有关于信任的研究。许多关于信任的解释其实只是解释了信任的积极作用，例如卢曼发现，信任是对社会事务复杂性的简化机制。同样，许多经济学家也认为信任可以降低交易成本。

　　[13] 《管子》。

　　[14] 《国语/郑语》。

　　[15] 孔子的原始表述是：“己欲立而立人，己欲达而达人”。见《论语\雍也》。

　　（本文原载于《世界经济与政治》2007年第6期）

相关热词搜索：博弈冲突哲学和谐合作

赵汀阳：冲突、合作与和谐的博弈哲学

热点文章阅读