注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

叶 航

学术人生

 
 
 

日志

 
 

同情与惩罚——仿真实验工作札记(6)  

2007-11-17 01:29:26|  分类: 默认分类 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

  仿真实验工作札记(6):同情与惩罚

 

引子

    很久以前,当我还是一个孩子的时候,我就梦想成为一名科学家:在天文望远镜里探索无垠的宇宙,在电子显微镜中观察神奇的原子。好奇,是人类天性中最纯洁、最美好的元素。好奇,是创造人类文明最原始、最持久的动力。

    后来,我不得不以社会科学作为我的职业,但是我仍然无法割舍童年的梦想。我梦想有一天社会科学家可以告别宏大叙事的研究方法,我梦想有一天社会科学家也会建立自己的实验室,我梦想有一天社会科学家也可以通过望远镜和显微镜来观察自己的研究对象……

    今天,当我们坐在ICSS(浙江大学跨学科社会科学研究中心)的仿真实验室里,看着计算机中的agent为我们重现史前社会人类文明的诞生过程,为我们重现从非洲大峡谷走出来的人类先祖如何构建早期的社会秩序,我终于相信了,梦想是可以实现的,只要我们永远不轻言放弃,只要我们永远为之奋斗,美梦终可成真!

 

社会何以可能?

    在典型的公共品博弈中,合作者X的贡献C经过一个r倍的放大后在全体参与者M中平均分配,如果M=X,则所有参与者的收益R都将提高r倍。但如果M中出现了背叛者Y,不贡献C而同样参与分配(搭便车),则可以获得比合作者更高的净收益NR=R-C。从纳什均衡的角度看,背叛显然一个占优策略。从演化均衡(ESS)的角度看,Y将侵入X所组成的群体,并最终都取代X。这是一个非常令人沮丧的结果。正是基于这样一种理论背景,齐美尔100年前就曾经追问:社会何以可能?(How is society possible?)因为,人类社会事实上是建立在类似于公共品博弈的基础上的。

    但是,大量关于公共品博弈的行为实验并不支持上述理论假设。参加实验的人会在很大程度上表现出合作的倾向,不论他们是否知道纳什均衡的推断。在其他类似的博弈实验,例如“最后通牒博弈”、“劳动市场博弈”和“偷袭者博弈”中,实验的参加者也没有像理论假设所推断的那样表现出单一的背叛倾向。毫无疑问,人们在现实生活中所表现出来的合作倾向,正是人类社会得以存在的基础。但是,这种合作倾向却与传统的生物进化理论和博弈均衡理论产生了巨大的矛盾。以至于许多西方的研究者把这种矛盾称为人类的“亲社会之谜”(the Puzzle of Prosociality)。

    西方学者最近的研究表明,人类的合作倾向依赖于一种被称为“强互惠”(Strong Reciprocity)或“利他惩罚”(Altruistic Punishment)的行为:在一个社会中,如果有一些人宁愿以个人承担成本为代价去惩罚那些合作的背叛者,则可以在一定程度上构建合作的社会秩序。但是,由于惩罚是有成本的,它在降低背叛者收益的同时也降低了惩罚者自身的适存度(fitness),这就导致一个所谓的“次级社会难题”(second-order social dilemma):在不去惩罚别人比惩罚者境遇更好的情况下,惩罚行为的进化机制是什么?哈佛大学社会演化研究中心的诺瓦克(Nowak)教授认为,对这个问题的解释甚至已经在某种意义上取代了对合作倾向本身的解释。

    诺瓦克(Nowak)等人组成的研究小组在一项发表于今年627日《科学》(Science)杂志的最新研究成果中,通过引入一个具有自由裁量权的所谓“非参与者”(non-participants),对惩罚行为的进化机制进行了解释。由诺瓦克小组提供的计算机演化仿真表明,在一个大小为M的混合人群中,如果存在着合作者X、背叛者Y、非参与者Z和惩罚者W,则惩罚行为与合作行为将出现共生演化,从而使社会建立起稳定的合作秩序。

    但是,在同一期《科学》杂志上发表的鲍依德(Boyd)和马修(Mathew)对这一研究成果的评论文章却指出,诺瓦克等人的模型依赖一些极强的假设条件,比如,模型中的公共产品必须是排他性的,否则,“非参与”便不再是一种可能的策略选择;再如,必须假设非参与行为在初始状态下就是优于背叛行为的,但这样一来,我们又不得不面临如何解释非参与者进化优势的难题;最后,在诺瓦克等人的模型中不存在规模经济,即他们假定合作的收益并不取决于合作者的数量,而这一假定通常是不符合实际的公共品生产的。鉴于这些理由,鲍依德和马修认为,诺瓦克等人的模型至多只能说明很少一部分符合这些假设条件的人类合作;因此,这是一条“狭窄的合作之路”(A Narrow Road to Cooperation)。

 

“我看见了天堂!”

    对于如何解决上述关于人类社会合作秩序演化之谜,ICSS近年来一直走着一条不同于西方学者的研究进路。我们的研究首先希望提供一个全新的视角:除了惩罚,人类是否还可以通过其他途径来维持合作秩序?休莫、斯密、达尔文、以及中国的孟子等人都认为,对他人的同情与怜悯是人类挥之不去的天性。那么,同情心与怜悯心这些表面上与人类生存竞争格格不入的行为特征,为什么会通过严酷的自然选择被保留下来?它们是否可能在人类合作秩序的构建过程中起到某种隐蔽的作用,从而得以与合作行为实现了共生演化?如果答案是肯定的,则我们不但可以解释同情心与怜悯心进化优势的难题,而且可以为人类合作秩序的演化找到一条不同于惩罚机制的新路径。

    定性的思考告诉我们,同情可以像惩罚一样对人类社会的合作秩序起到支撑作用。其机理应该是容易理解的:同情可以增加合作者的收益,从而改变他们与背叛者在适存度上的相对差异。这一机理事实上与惩罚具有异曲同工之处:惩罚可以减少背叛者的收益,从而改变他们与合作者在适存度上的相对差异。但是,这一研究迟迟得不到突破,关键在于我们一直无法找到合适的数学表达。其实,西方研究者对惩罚的研究也曾经碰到过我们同样的困境:对一个演化的群体博弈至今还缺乏适当的数学刻画。2003年以后,西方研究者在这方面取得了重大突破,即他们开始引进计算机仿真技术来处理这类问题。从而,我们看到,最近几年来,通过计算机仿真和模拟来描述演化的群体博弈已经成了这一领域最前沿、同时也是最基本的研究工具。ICSS2003年以后一直密切关注和跟踪西方的这一研究动态,但由于苦于国内实在缺乏这样的技术人才,从而不得不屈从于一种无为状态。我曾经一度悲观地感到,仅此一点,又将使中国的社会科学研究与西方同行拉开15-20年的距离。

    王志坚博士加盟ICSS成了一个重要的转折!今天,我们也许可以毫不夸张地说,浙江大学跨学科社会科学研究中心是国内惟一完全掌握了西方这一社会科学研究新工具的研究机构。王志坚博士可以在1-2天内编制出计算机代码,重复西方研究者在这一领域最新的仿真实验。我们知道,在自然科学研究领域,任何理论创新首先是建立在重复别人已经进行的科学实验的基础上的。否则,你如何才能判断你的idea是别人没有想到过的呢?或者,你如何才能判断别人的idea是存在缺陷需要改进的呢?王志坚博士毕业于浙江大学物理系,大学期间就是一名“神童”,曾经在国际一流的物理学杂志上发表过学术论文并获得过浙江大学首届竺可桢奖。他精湛的计算机编程技术,简直令人叹为观止。当然,更为重要的是,志坚对人文社会科学的领悟能力和对学术研究的热爱和献身精神。

    有了志坚的技术,我们的idea就可以变成一个“附加同情的公共品博弈仿真模型”。经过志坚艰苦的努力,基础模型的代码终于编制完成了。由于中心目前的计算机还比较落后,志坚估计如果按照西方同类研究运行500万代的要求起码得3-4个月的时间。因此,我们先进行了一个50万代的测试性运行。

    前天深夜,一直呆在实验室里的志坚突然给我打来了电话。他这样描述我们的仿真实验:如果不按动“同情心按钮”,这一程序就是一个传统的公共品博弈仿真,那么任何经突变而来的合作者都无法在背叛者群体中生存下来,这是一个经典的“纳什均衡”的世界,就像一个地狱,整个世界被“自私的魔鬼”统治着。他说,“当我决定启动人类的同情心时,我突然感觉我就像一个上帝……”。奇迹可能发生吗?由千分之一的遗传变异所产生出来合作者和同情心携带者能够改变这个世界吗?

    “时间在一分一秒地流逝,它似乎在重塑一个上帝创世纪的神话……。在大约1000代的时候,我突然发现,仿真模型中代表合作者的蓝色开始聚集,它们所占的领地开始慢慢扩张……计算机仍然在高速运行中,突然,我的眼前一亮,我发现蓝色占据了计算机的大部分面积,我忽然感到脑袋一片空白……我的感觉好像是——我看到了天堂!” 

    “我看到了天堂!”凭着志坚这句话,我知道我们的研究成功了!我立刻驱车赶向中心实验室——一个能够看见天堂的地方!

 

后记

    接下来,我们还将面临各种参数的鲁棒性实验。另外,我还根据鲍依德和马修对诺瓦克模型的批评,设计了一个规模报酬递增的公共品博弈模型(由于BoydMathew批评的前两点是针对诺瓦克模型中的非参与者的,因此我们的模型中不存在这两个缺陷)。我们将用用一个非齐次的柯布—道格拉斯生产函数来刻画该模型的规模报酬递增性质:博弈总收益R=rCX1.2Y0),其中r为公共品放大倍率,C为合作者的贡献,XY分别分别合作者与背叛者的数量,X1.2为合作者对总收益的贡献率,Y0为背叛者对总收益的贡献率。一个基本的判断是,如果合作带来的收益是依赖合作者的人数规模递增的,则对于合作秩序的形成和稳定具有正面作用。因此,它不应该改变现有模型的基本结论。

    当然,根据我的设想,如果我们在模型中同时附加同情与惩罚两种行为,合作秩序将更加稳定。我们可以看到由同情所演绎出来的道德感以及由惩罚所演绎出来的公平感和正义感,在人类社会秩序构架过程中所起重要作用。无疑,我们把同情与惩罚作为支撑人类合作秩序演化的两个最重要的机制,包含着我们对现代人类社会生活中道德系统与司法系统在调节人与人之间关系方面重要性的重新评估与深刻认识。

    参考阅读——

仿真实验工作札记(5)

仿真实验工作札记(4)

仿真实验工作札记(3)

仿真实验工作札记(2)

仿真实验工作札记(1)

  评论这张
 
阅读(82)| 评论(10)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017