错误管理在自适应决策中的应用

[ 下载 ]

摘要：人类在判断和决策时总会出现一系列的错误，然而，在违反直觉的情形下，错误偏见本身代表了对决策判断问题的自适应性解决办法。

本文描述错误偏见在自适应性决策过程中的逻辑关系，通过对错误管理理论在自适应性决策中的运用，解释了人们为什么愿意与陌生人合作的决策过程。

下载论文网　　关键词：错误管理理论自适应决策错误肯定错误否定　　Application of Error Management Theory in the Selfadaptive Decision— making 　　Wang Ligang（Shanxi Normal University， Linfen， 041004， China）　　Abstract：A serial of errors occur in the human judgment and decision—making. Counterintuitively， these biases， however， represent adaptive solutions to the decision—making problems. In this paper，we systemically outline the logical relationship in the self—adaptive decision—making state，through the application of error management theory in the self—adaptive decision—making. Finally this claim strongly suggests that why humans prefer to cooperate with strangers. 　　Keywords： Error management theory； The decision—making of self—adaptive ；False—positive；False—negative 　　毋庸置疑地说，错误是普遍存在而且是无孔不入的。

小到微观世界阻碍一种微生物病毒的传播和变异，大到宏观世界中对自然界的环境恶化治理。

在社会经济体中的个体、群体或团队都要面临平衡的问题，因为每一天的决策和判断都是潜在成本――收益平衡的问题。

数以百万年以来，在面临可能会花费不同成本时，在人类的活动和其他有机体的运行轨迹中都不得不处理这一平衡。

都可以说明决策错误的普遍存在这一问题并不新颖。

在过去的时间里，我们可以推断出错误或者偏见有助于我们因为做出错误的决策或判断而减少成本的花费。

在国内，刘世勇、郭开仲等人提出了错误理论和错误逻辑对管理实践、决策过程以及管理系统建模的重要作用，是管理科学中的一个创新性研究。

当陌生人在需求帮助时，你是否会伸出援助之手？当在公共场所观看危机事件发生时，你是更愿意作为一位旁观者，还是认为这是一件危机事件需要采取行动责任的承担者？相对而言，城市居民比乡村居民更加冷漠是代表城市社会道德水平比乡村社会道德水平更高吗？面临老人倒地后，我们是否都要考虑我们所付出的时间、精力以及可能导致的打击报复，甚至于是忘恩负义的反咬一口之后，才做出拍照后帮助老人的行为决策？心理学家提出了旁观者效应，他们通过大量的数据和研究认为，人们在看待自己是否应该采取行动措施帮助陌生的受害者时，与围观的人数成本负向变动，旁观人数增加时，愿意承担责任采取行动措施的人就更少。

经济学家通过经济学中的纳什均衡的应用方法，运用理性人假设人类行为总是偏好自我效益最大化而选择最优战略。

冯昊宇更是通过《货币哲学》中的精准描述的现代社会人际关系，就是理性思考而缺乏情感对物质的需求特征，说明中国社会陌生人之间互动利己的普遍性。

传统的理性分析方法更多拘泥于完全理性假设与帕累托最优，完全忽视人类有机体的认知决策存在偏差。

Kahneman和Tversky在西蒙有限理性的决策行为基础之上，更注重非理性行为对人类经济决策的心理和认知的考察，开创性的将心理学和经济学二者交叉融合，不单纯地追寻贝叶斯最优。

在与陌生人的互动中是否正如理性人假设那样，人们都会采取避让和冷漠的态度，而不是慷慨的选择提供帮助？当这个决策问题的结果不确定性或者成本不对称性的情形下，一个违背直觉的普遍情景就会出现：许多人做出的决策往往被证明是错误的。

这种情况并不足为奇，从自然选择和人类进化演进的视角去探寻这一偏见的产生。

本文从演化的视角讲述与陌生人互动合作的形成机制：一是介绍错误管理理论（Error Management Theory，EMT）；二是概括描述适应性决策偏见的逻辑过程；三是解释为什么人们要把偏见纳入到适应性决策行为中去；四是应用错误管理理论解释在具体生活实践中人们更愿意选择与陌生人合作。

一、错误管理理论（EMT）　　错误的决策有两种模式（见表1）。

当世界客观状态X是真实的，可以假设非X（一种否定错误）；或者当世界客观状态非X是虚假的，可以假设X（一种肯定错误）。

错误管理的适用条件可能有限制，但是在一个广泛的决策问题中的应用是普遍的。

结果的真实可能性很少被精确知晓，而且产生不同的结果具有不相同的成本。

我们注意到尽管EMT 关注成本，但是收益也没有被忽略。

错误否定和错误肯定的决策紧要的是净收益――收益减去成本。

EMT 预测的一种偏见指向最大程度的适宜，而非最大程度的收益。

这就易于从EMT中字面意义上用“最小的成本”的言语表明，这也是起初谜题的遗赠：在个体行为决策自适应期间，我们如何解释显著的耗费成本的行为？　　二、自适应性决策的逻辑过程　　有证据表明，这些错误/偏见代表了在过去进化的历程中对决策问题的自适应性解决办法。

例如，当自然资源丰富而且危险稀少时，有机体将会避免危险的决策，正如标准经济模型做出的预测一样。

然而当饥饿或者其他危险威胁到有机体生存时（在进化的眼中是预期繁殖价值），选择钟爱有机体（或策略）承担任何的风险都必须留下一线生机而不是死亡。

这些策略并不需要最大程度预期的补偿（如食物）。

相反，它们需要的是能够最大程度预期补偿的非线性达尔文适应。

因此，决策和判断的“偏见”（和通过标准的经济模型做出的判断相比较）能够被预期，而且更重要的是它们的出现被导向选择性错误的决策管理。

（一）适应性行为偏见　　如果有人能够精确的评估出一些事件的成本和可能性，那么他就可以通过“谨慎行动策略”管控过失（一种贝叶斯更新的形态）。

例如，在横穿马路前，我们可能习惯性地看一下，不是因为我们对汽车的恐惧，而是因为我们计算、学习或者发现，如果我们不这样做导致的成本是很严重的。

我们根据不同的情形调整我们的行为――即使没有汽车靠近也会习惯地用一些时间去看看。

从第三方来看，这种行为偏见就出现了“经济的不合理性”，因为我们习惯地浪费时间去担心一件几乎不会发生的事情。

但是，这一偏见帮助我们最大程度的增加生存的机会（或者繁衍），这就是“适应性的合理”。

换句话说，我们的行为并不完全符合预期收益的模型，但却与预期的适宜性模型合拍。

因为这一原因，如果我们完全知道所有与陌生人首次互动所采取行动而产生结局的信息，一种看起来是偏见的行为也就不再是偏见了。

与陌生人互动可能拥有长期的收益，例如信仰、爱情、满意、友谊等都无法用通用货币来衡量。

也就无法将它们与商场中的商品或者付出的成本进行转化。

哪怕我们假设愿望或者友谊存在一种“通用货币”，这种通过单一的信息转化方式也是成本巨大的，再加上数量化的收益和概率计算并不总是符合我们看待世界唯一的方式，也就是说与陌生人合作本身就是一种“合理性的适应”。

Andrew W. Delton和John Tooby描述人类在不确定性情景下，与陌生人的互动中能很好地展现人类的慷慨，决策系统必须平衡，因为未来的重复性互动而导致首次互动错误担负的成本，与首次互动而导致随之而来的未来重复性互动错误担负更多的成本（妨碍从未来多重互动中受益）。

解释了在不对称性线索中有机体建立的自然性选择，慷慨合作是决策选择的必要副产品。

尽管这能说明为什么某一种偏见能够有益，但是还不足以证明这种偏见产生的原因。

Andrew W. Delton和他的同事向McNally 和Tanner质疑他们的研究模型缺陷时的回复：人类与陌生人合作互动中经常选择承担成本，这些成本是由于向他人支付收益时产生的，而不是关注产生成本损失的可能性。

这一经验性的模式挑战了标准的经济和进化理性的标准模型（它们仅仅关注贝叶斯最优），而且提升曾经更繁琐解释的发展（比如，群体选择、基因—文化协同进化、文化的群体选择），模型脆弱的依靠于许多很难证实的假设。

模型充分展现了在不确定性下，一种直接互惠的行为决策使得社会体制选择显而易见地愿意与陌生人合作状态。

（二）适应性认知偏见　　决策涉及一系列复杂的变量，我们经常不能够追踪到关于肯定错误和否定错误的成本和可能性相关的精确统计学信息（我们甚至不能觉察到错误，更不用说，当错误发生时，他们未来适宜的结局）。

即使我们有了这些信息，多重相关变量的处理将使我们的认知出错，而且是大脑自身主观的错误。

因此，自然选择可能钟爱避免复杂计算的偏见。

否则，相比较人类大脑对现场的计算，需要最优的决策。

Yamagishi， T等在社会交际的启发式研究中表明：在不确定性情景下个体在社会交互的行为中是存在某种偏差的。

这个研究结果表明认知的偏见影响个体对错误的管理。

人类似乎辜负了成为最优贝叶斯决策者这一常常自夸理念。

诺贝尔桂冠获得者Daniel Kahneman和 Amos Tversky回应人们可以至少是近似于贝叶斯这一理念时总结说：人们显然不是保守的贝叶斯，他一点也不可能是最优贝叶斯决策者。

三、错误管理的实践应用　　人类在应用错误管理理论决策过程中，引起了特别的关注。

人类进化的历程中，如果由错误的决策导致成本是均衡的，自然选择可能更加偏爱这一偏差，是因为它降低了由于犯错所产生的更多成本。

在古往今来的社会中，我们可以理解人们之间存在的互动交往不是一次性的。

如果没有未来的交互活动，如果互动是一次性的，那么自然选择的策略将一直存在缺陷。

狩猎采集的社会特征，通过直接的观察和人口条件表明大量的陌生人会重复相遇，我们的祖先在人类的社会生态发展中互动是一种稳定的特征。

有理论表明，陌生人之间的合作是可以预见的，并不是因为古代或乡村人的淳朴就比现代人或城市人冷漠而互助，是因为人们认知偏见而引致的成本风险的差异在不确定性的情况下做出的自然决策。

下面我们看一看个体与陌生人的互动变化，个体不能完美的区分一次性互动和多回合互动在合作性决策中自然选择的影响。

假定两人互不相识，现在参与一轮或者多轮的互动。

在一轮互动中，不管对方如何决策，背叛总是比合作担负的成本更多。

然而，相关的成本和收益被这样安排，互相合作比互相背叛更好（见表2）。

互动产生两种不同的状态：一次性互动仅含有一个回合的互动；无限的多回合互动包含第一轮互动和随后更多数量的互动。

人们常常犯两类错误。

一类错误是在一次性互动中合作，没有增加可获得的收益，承担了因为合作而引致的成本。

第二类错误在多回合互动中的背叛，从长期来看错失了决策者与陌生人联合的机会，使之产生相互收益的交互。

这类错误是典型的要承担更多的成本。

表2（ii）中表明，当首轮合作中的净收益和互动轮数增多时，这一收益补偿将比其他任何补偿都要多。

这一表格表明无论是一次性互动还是多回合互动，收益将被作为参与者决策的补偿功能。

收益补偿假设认定合作策略含有以牙还牙或冷酷；同时，背叛限定为永远背叛。

b―首轮分配给合作对象的收益；c―向陌生人分配收益时引致的成本；平均轮数*（b—c）―在多回合互动中参与者获得的多轮收益。

假定每一个人只有两种选择，合作或者背叛。

对任意一人，合作的收益成本，背叛的收益为c。

双方都选择背叛，没有合作，收益为零。

我们得到这样一个收益矩阵（i）。

如果此前一方背叛，另一方合作。

假设此前有过背叛，一方记得对方背叛，另一方可能向对方实施报复（以牙还牙或者冷漠），次轮互动中另一方将以牙还牙，让对方损失成本c。

经过多回合互动，背叛的人被排除在互动范围内，除非对方选择宽恕，并且背叛的一方修正自己的决策，选择合作。

否则，损失惨重。

假设此前均是合作，此时可以继续合作。

在第一次互动中通过合作所产生的收益就等于首次向对方分配的收益（b）减去向对方分配收益而引致的成本（c），而在随后的互动中，每一轮互动都会产生补偿的收益（b—c）。

随着互动的回合增加，补偿的收益随之增加到平均轮数×（b—c）。

我们得到一个这样的多回合互动收益矩阵（ii）。

上面两个模型非常简陋，旨在说明在于陌生人合作中的决策过程是一种自适应的决策过程，如果选择背叛的策略所承担的成本可能性非常巨大，因此更倾向与陌生人的互助交往。

四、结束语　　值得注意的是，当我们认为互动的对象不能够观察到你的决策行为时，背叛将会成为选择的压力，它也将屈从于相类似的选择压力。

个体行动的判断伴随着不确定性和错误不会被观察到，而且错误肯定的结果和损失的不对称性，将改变在决策领域使背叛具有吸引力的状态。

简单地说，促使高收益交互进化的多回合互动的状态，同时也能促使一次性互动的合作。

通常来讲，结果就是陌生人之间的合作与收益的交互在同时进化。

这一论断不意味着利益的交互是人类合作唯一的驱动力，人类慷慨的本质可以证明在任何明显的潜在收益缺失的状态下选择合作。

因为长期的合作，第一次互动的重要性肯定被人口结构影响（例如，社会类型）。

允许个体决策判断的策略自由地选择将顾及在陌生人互动中偏爱合作的社会结构的检测。

我们认为一次性合作更可能涉及在一个非忍受错误的马基雅弗利社会。

但是一个马基雅弗利社会并不符合现代社会对高尚品质的追求，对此还有待观察。

EMT的中心信息就是错误管理原则的应用去理解人类判断和决策，表明偶尔的错误是被期待的，他们发生了，就泄露了适应性行为，不是适应不良的，而是达尔文适宜。

本质上，错误管理可能帮助我们避免困扰人类决策行为的高成本选择，在面临不确定性决策判断时，人们更愿意屈从于自然选择。

参考文献：　　[1] 刘世勇，郭开仲，孙东川.管理科学中的一个创新性研究――错误理论的提出、进展和展望[J].管理学报，2012（12）：1749— 1758. 　　[2] 冯昊宇.“目的序列中的货币”与现代社会人际互动的思考[J].中共济南市委党校学报，2013（01）：67— 69. 　　[3] Kahneman， D. and Tversky， A. Prospect theory： an analysis of decisions under risk [J]. Econometrica 47， 1979：263— 291. 　　[4] Haselton， M.G. and Nettle， D. The paranoid optimist：an integrative evolutionary model of cognitive biases[D]. Pers. Soc. Psychol. R ev. 2006（10）：47— 66. 　　[5] Trimmer， P.C. et al. Decision— making under uncertainty：biases and Bayesians[J]. Anim. Cogn. 2011：465— 476. 　　[6] 刘永芳，哥德?吉戈伦尔，彼得?托德.理性观的革命：从无限理性到快速节俭启发式[J].陕西师范大学学报（哲学社会科学版），Vol.33，2004（04）：112～116. 　　[7] Delton AW， Krasnow MM， Cosmides L， T ooby J Evolution of direct reciprocity under uncertainty can explain human generosity in one— shot encounters. Proc Natl Acad Sci USA，2011，108：13335— 13340. 　　[8] McNally L， Tanner CJ. Flexible strategies， forgiveness，and the evolution of generosity in one— shot encounters. Proc Natl Acad Sci USA .2011，108：E971. 　　[9] Delton AW， Krasnow MM， Cosmides L， Tooby J.R eply to McNally and T anner： Genero — sity evolves when cooperative decisions must be made under uncertainty. Proc Natl Acad Sci USA ，2011，108：E972. 　　[10] Y amagishi， T . et al.T he social exchange heuristic： managing errors in social exchange [J]. R ation. Soc.19，2007：259— 292. 　　[11] Kahneman， D. and Tversky， A.Subjective probability：a judgement of representativeness In Judgment under Uncertainty： Heuristics and Biases[M]. C ambridge University Press.1982， pp.32— 47.

2 次访问