90岁去世,诺奖得主丹尼尔·卡尼曼的成长实录
3 月 27 日,诺贝尔经济学奖得主、认知心理学家丹尼尔·卡尼曼(Daniel Kaheman)逝世,享年 90 岁。他的著作《思考,快与慢》自2011年出版以来,已被翻译成多种语言,影响全球无数读者。卡尼曼教授的研究深刻影响了我们对人类决策和判断偏误的理解。如今大师已逝,让我们从卡尼曼教授的自传中了解其生平,以作缅怀。
早年岁月
1934年,我出生于当时的特拉维夫,这个城市如今属于以色列,那时我母亲正在那里探访她的大家族;而我们平常居住在巴黎。我的父母是20世纪20年代初从立陶宛移民到法国的犹太人,他们在法国的生活过得颇为顺遂。父亲在一家规模庞大的化工厂担任研究主管。
尽管我父母对法国的许多事物怀有深厚的爱,并结交了一些法国朋友,但他们在法国的根基并不深厚,始终感到有些不安。当然,随着德军在1940年突袭法国,他们仅存的安全感也荡然无存。我记得自己在1941年绘制的第一张图表,描绘了我们家庭的财富随时间的变化——大约在1940年,曲线跌入了负值区。
我永远无法确定,我成为心理学家是否源于我早年对各种有趣闲话的接触,或者对闲话的兴趣本就预示着我对心理学的天赋。我猜,和许多犹太人一样,我成长在一个由人和言语构成的世界里,而这些言语大多与人有关。自然界在我的世界里几乎不存在,我对识别花卉或欣赏动物毫无兴趣。
但是,我母亲经常向她的朋友们以及我父亲讲述的那些人物,以他们的复杂性吸引了我。这些人中有的比其他人更优秀,但最好的人也远非完美,没有人完全是坏蛋。她的故事中总是充满了讽刺意味,每个故事都不是单一的面向。
在我印象深刻的一次经历中,我感受到了丰富多彩的人性。那应该是1941年底或1942年初的事。犹太人被要求佩戴大卫之星,晚上6点后必须守宵禁。那天我去了一个基督徒朋友家玩,不小心玩得太晚。为了走几个街区回家,我把棕色的毛衣里外翻过来穿。当我沿着一条空无一人的街道走时,看到一位德国士兵向我走来。他穿着那种据说最令人畏惧的黑色制服——特别是被征召的SS士兵的制服。当我试图快步走过时,我注意到他正专注地注视着我。接着,他示意我过去,把我抱起来紧紧拥抱。我极其恐惧,害怕他发现我毛衣里的大卫星。他用充满感情的德语和我说话。放我下来后,他拿出钱包,向我展示了一张小男孩的照片,并给了我一些钱。回家的路上,我比以往更加确信我母亲的话:人性是无比复杂而又饶有兴趣的。
我的父亲在首次大规模搜捕犹太人时被捕,被关押在德拉西集中营六周,这里是通往灭绝营的中转站。后来通过他工作的公司的干预被释放,而这家公司,据我后来从一篇文章中了解到,竟是1930年代法国法西斯反犹太运动的经济支柱。
关于我父亲被释放的经过,我从未完全明白,其中还牵涉到一位美丽的女士和一个爱慕她的德国将军。不久之后,我们逃往维希法国的里维埃拉,那里相对安全,直到德军来临,我们再次逃离,前往法国中部。1944年,我父亲因为糖尿病得不到妥善治疗而去世,距离他苦苦期盼的诺曼底登陆仅有六周。不久,我、我母亲和妹妹重获自由,并开始期待能获得前往巴勒斯坦与家人团聚的许可。
我自小智力超群,但在体育方面却笨手笨脚。这种笨拙在我1946年的法国高中最后一个学期表现得尤为明显,以至于我的体育老师因为我的极端不足而阻止我被列入荣誉榜。我那时候还真是个自负的孩子。我有一本随笔集,标题至今让我脸红:“我所思的我所写”,其中第一篇随笔是在我不到十一岁时写的,探讨了信仰的问题。他赞同地引用了帕斯卡的话:“信仰是上帝让心灵可感”的观点(“多么正确啊!”),然后指出,这种真正的精神体验可能相当少见且不可靠,并且大教堂和管风琴音乐是为了产生一种更可靠的、替代性的信仰兴奋感。
写下这些文字的孩子,对心理学有着天然的敏感和深刻的洞察力,同时,他也渴望一种平凡的生活。
青春期
移居巴勒斯坦彻底改变了我的生活体验,部分原因是我被留级一年,再次成为了八年级的学生——这意味着我不再是班级中最年轻或最弱小的男孩。我终于有了朋友。
抵达后几个月内,我发现了比独自写随笔更愉快的消磨时间的方式。我在高中期间经历了许多智力上的激动,这都归功于伟大的老师们,以及和我志同道合的同龄人共同分享。不再是那个特别的我,反而让我受益良多。
十七岁那年,我面临着一些关于军事服役的决定。我申请了一个单位,允许我在完成我的第一个学位之后再服役;这意味着我需要在夏天参加军官训练学校,并在军中利用我的专业技能。到了那个时候,我已经经过一番考虑,决定成为一名心理学家。在我十几岁时感兴趣的问题更多是哲学性的——生命的意义、上帝的存在,以及为什么不应该行为不端。但我发现,我对于人们为什么会相信上帝这一问题的兴趣,远超过上帝是否真实存在的问题;我对人们对于是非对错的独特信念的起源更加好奇,而不是对伦理学本身的兴趣。当我寻求职业指导时,心理学成为了我最推荐的选择,经济学紧随其后。
我在耶路撒冷的希伯来大学完成了我的第一个学位,用了两年时间,主修心理学,辅修数学。与我一起学习的一些人相比,我的数学只能算是一般——其中一些人后来成为了世界级的数学家。
但对我而言,心理学却是一片奇妙的领域。作为一名大一新生,我读到了社会心理学家库尔特·勒温的著作,并深受其对生活空间图的描述影响,这里面动机被描绘成一种从外部作用于个体的力场,推拉着个体朝各个方向运动。五十年后的今天,我在普林斯顿大学伍德罗·威尔逊公共事务学院给研究生的入门讲座中,仍然在使用勒温的行为改变分析。
我对早期接触到的神经心理学也感到非常着迷。我们尊敬的老师叶沙雅胡·雷比维茨的每周讲座是不容错过的——我曾经在发烧41度的情况下去听他的一场讲座。德国神经外科医生库尔特·戈德施泰因的来访也给我留下了深刻印象,他声称大脑的重伤会消除一个人的抽象思维能力,将他们变成具体的思维者。更令人兴奋的是,如戈德施泰因所描述,抽象与具体之间的界限并非哲学家所设想的那样。
我们现在知道,戈德施泰因的说法几乎没有什么实质内容,但当时,基于神经学观察来界定概念的想法是如此激动人心,以至于我认真考虑过转学医学来研究神经学。幸好,哈达萨医院的神经外科主任,也是我们的邻居,明智地劝阻了我,他指出医学的学习过程极为严苛,除非是为了从医,否则不应轻易选择这条道路。
军旅岁月
1954年,我以少尉身份应征入伍。在作为一个排的领导者度过了充满事件的一年后,我被调到以色列国防军的心理部门。我偶尔的任务之一是参与评估军官训练的候选人。我们采用了英国军队在二战期间开发的方法。其中一项测试是让八名去掉所有等级标志、仅用编号识别的候选人抬起一根电话杆,然后引导他们到一个障碍物前,比如一堵2.5米高的墙,他们需要让电话杆既不碰到地面也不碰到墙面,同时他们自己也不能触碰墙面,从而越过墙。如果发生了这些情况之一,他们需要报告并重新开始。我们两人会观察这个过程,这通常需要半小时甚至更长时间。
我们在寻找候选人性格的展现,看到了形形色色的人:天生的领袖、忠诚的追随者、虚张声势的人、懦夫——应有尽有。我们认为,在这种压力下,士兵们的真实本性会显露出来,我们能够辨别出谁会成为优秀的领导者,谁则不行。但问题在于,实际上我们无法做到这一点。
每个月或者每隔一个月,我们会有一个“统计日”,那天我们会从军官训练学校那里得到反馈,看看我们对候选人潜力的评估有多准确。结果总是一样的:我们预测在学校表现的能力几乎为零。但第二天,又会有新一批候选人来到障碍场,我们再次面对他们和墙壁,看着他们的真实本性展现。我对统计信息与深刻洞察力的体验之间完全无关联感到震惊,因此我创造了一个术语来形容这种现象——“有效性幻觉”。大约二十年后,这一术语被引入到技术文献中 (Kahneman and Tversky, 1973)。这是我发现的第一个认知幻觉。
与有效性幻觉紧密相关的另一特点是我们对观察到的候选人进行讨论时,愿意基于有限的行为样本,对他们未来的表现做出极端预测。实际上,我们根本没有区分预测和观察。那个在团队遇到困难时,站出来并带领团队越过墙的士兵,在那一刻,就是一位领导者。
如果我们问自己他在军官训练或战场上的表现如何,最合理的猜测就是他将来会像现在这样是一个优秀的领导者。任何其他的预测似乎都与现有的证据不符。直到几年后我开始教授统计学时,我才清楚地认识到,预测应比其依据的信息更加保守这一点非常违反直觉。
直觉预测的主题,在我军中的一项重要任务中再次出现:开发一种面试所有作战单位新兵的方法,以筛选不适合的人并帮助将士兵分配到特定的职责中。那时已有一个面试系统,由一小部分面试官执行,他们大多是年轻女性,刚从优秀的高中毕业,凭借在心理测验中的出色表现和对心理学的兴趣被选中。面试官被指导先对新兵形成一个总体印象,然后给出一些全面的评估,预测新兵在作战单位的表现如何。但结果再次令人失望,面试官的评估并没有准确预测我们关心的任何标准。
我的任务包含两部分:首先,确定哪些人格特质在某些作战职位中比其他职位更重要;然后,开发面试指南以识别这些特质。为了完成第一个任务,我参观了步兵、炮兵、装甲等部队,收集了对每个部队士兵表现的总体评价以及几个人格特质的评分。这是一项无望的任务,但那时我并未意识到。相反,我花了几周甚至几个月的时间,使用一个手摇式Monroe计算器进行复杂分析,这个计算器的手柄相当不可靠,我发明了一种分析多属性异方差数据的统计技巧,并用它来描述各个单位的心理需求。我是在碰运气,但这个技巧足够吸引人,以至于我的一位研究生导师——著名的人事心理学家Edwin Ghiselli——将其写成了我的第一篇发表文章。这标志着我对预测和描述统计学终生兴趣的开始。
我为标准度量制定了性格档案,现在我需要设计一个预测性的面试。那是1955年,恰逢Paul Meehl的经典著作《临床与统计预测》(Meehl, 1954)出版之后不久,他在书中展示了临床预测始终不如精算预测。肯定是有人把这本书给我看,这本书对我产生了巨大的影响。我设计了一个结构化的面试程序,包含一系列关于平民生活各个方面的问题,面试官应使用这些问题来评估候选人六个不同性格方面的表现(包括我记得的“男子气概”和“责任感”等)。
很快,我面临了一场几乎是叛变的局面。一直以自己的临床技能为傲的面试官团队,觉得他们被贬低为了没有思考能力的机器人,我的自信宣告——“只要确保你们的评估一致,有效性的问题交给我”——并没有让他们满意。因此,我让步了。我告诉他们,在完成了我指定的六项评估之后,他们可以根据自己的临床判断自由地对新兵的潜力做出全面评价。
几个月后,我们得到了第一批有效性数据,以新兵的表现评价作为标准。有效性比以前高得多。我的记忆是,我们达到了接近0.30的相关系数,与之前的方法相比大约是0.10。最具启示性的发现是,面试官在结构化面试结束时做出的全面评价,是所有评级中预测性最强的。努力做到一致性反而让他们的评估变得有效。当时我努力解决的这些难题,后来成为了我和Amos Tversky发表的关于直觉预测心理学的论文的种子。
这套面试系统以几乎未经修改的形式被使用了几十年。如果说一个二十一岁的少尉被委以为军队建立面试系统的重任看起来有些奇怪,那么人们需要记住的是,当时的以色列及其机构仅成立了七年,临时应变是常态,专业主义几乎不存在。我的直接上司是一位具有出色分析能力的人,他在化学领域受过教育,但在统计学和心理学方面完全是自学成才。而作为拥有相关领域学士学位的我,在军中算是受过最好训练的专业心理学家。
1956年,我结束了我的军旅生涯。希伯来大学的学术委员会决定资助我出国攻读博士学位,这样我就能回到心理学系任教。但在我踏入更广阔世界之前,他们希望我能再磨练一番。因为心理学系暂时关闭了,我修读了一些哲学课程,进行了一些研究,并自学了一年的心理学。1958年1月,我和我的妻子Irah抵达旧金山机场,迎接我们的是如今成为著名社会学家的Amitai Etzioni,他带我们去伯克利的Flamingo Motel,那里标志着我们研究生生涯的开始。
我的研究生经历与今天的学生大不相同。主要的经历是考试,包括一个涵盖整个心理学的庞大多项选择测试,(我依稀记得,一个以“以下哪项不是潜在学习研究?”为前缀的经典研究列表。)对正式师徒制的强调较少,而且在学校期间发表论文的压力几乎不存在。我们上了很多课,广泛阅读。我记得Rosenweig教授在我的口试时曾评论说,我应该享受我当前的状态,因为我再也不会像现在这样了解心理学了。
他说得对。我是一名广泛涉猎的学生。我从Richard Lazarus那里学习了关于潜意识感知的课程,并与他合写了一篇关于感知时间发展的推测性文章,这篇文章被彻底且正确地拒绝了。
从那个主题,我转向了对视觉的更技术性方面的兴趣,并从Tom Cornsweet那里学习了关于光学工作台的知识。我旁听了临床系列课程,从Jack Block和Harrison Gough那里学习了性格测试。我在哲学系学习了有关维特根斯坦的课程。我也涉猎了科学哲学。虽然我所做的似乎没有特别的规律或理由,但我玩得很开心。
研究生岁月
在那些年里,我最重要的智力经历并没有发生在研究生院。1958年夏天,我和我的妻子驾车穿越美国,去马萨诸塞州斯托克布里奇的Austen Riggs诊所度过了几个月,在那里我跟随著名的精神分析理论家David Rapaport学习,他几年前在耶路撒冷访问时与我结识。Rapaport认为,精神分析包含了一个关于记忆和思维的有效理论。他认为,这一理论的核心思想在弗洛伊德的《梦的解析》第七章中得到了阐述,该章勾勒了一个关于心理能量(投注)的模型。与Rapaport的其他年轻学徒一起,我像学习塔木德文本一样研究那一章,并试图从中导出关于短期记忆的实验预测。
这是一段美妙的经历,如果Rapaport那年晚些时候没有突然去世,我一定会回去的。我非常尊重他那颗敏锐的头脑。在那个夏天十五年后,我出版了一本名为《注意力与努力》的书,其中包含了一种将注意力视为有限资源的理论。直到我为那本书写致谢词时,我才意识到我重新探访了Rapaport最初引导我去的领域。
Austen Riggs是精神分析的一个主要智力中心,主要致力于治疗富裕家庭功能失调的后代。我被允许参加案例会议,这些会议通常安排在周五,通常是为了评估一个在诊所住院观察了一个月的患者。参加的人会在前一晚收到并阅读一份文件夹,里面有关于相关人士的每个部门的详细笔记。会议中会有员工之间关于印象的热烈交流,其中包括传奇人物Erik Erikson。然后患者会进来参加一个小组面试,随后是一场精彩的讨论。
在那些周五中的一次,会议照常进行和召开,尽管患者在前一晚已经自杀。这是一次非常诚实和开放的讨论,其特点是对事件不可避免性的强烈后见之明与明显的事实相矛盾,即这一事件并未被预见。这是另一个需要理解的认知幻觉。多年后,Baruch Fischhoff在我和Amos Tversky的指导下撰写了一篇精彩的博士论文,阐明了事后诸葛亮效应。
1961年春,我撰写了我的论文,对语义差异中形容词之间的统计和实验分析进行了研究。这让我能够从事我最喜爱的两项活动:复杂的相关结构分析和FORTRAN编程。我编写的一个程序在大学主机上运行需要二十分钟,我可以通过它使用的七个磁带机的运动顺序来判断它是否正常运行。
我在八天内完成了论文的撰写,直接在当时用于复印的紫色“复写纸”上打字。那可能是我最后一次轻松写作。与之形成鲜明对比的是,这篇论文本身是如此复杂和沉闷,以至于我的导师Susan Ervin形象地描述阅读它的经历就像是“在湿泥浆中艰难前行”。1961年夏天,我在眼科部门进行了关于轮廓干扰的研究。
然后是时候回到耶路撒冷,在希伯来大学的心理学系开始教学了。
专业化训练之路
我热爱教授本科生,并且我在这方面表现出色。这段经历一直让人十分满意,因为学生们异常优秀:他们是通过高度竞争的入学考试选拔出来的,多数人都有潜力成为博士。我主讲了一年级学生的基础统计学课程,并且连续几年教授这门课程及第二年的研究方法课程,后者也大量包含了统计学内容。为了高效教学,我深入思考了可以依赖的正确直觉以及我应该教导学生克服的常见误区。当然,我当时并不清楚,但我实际上正在为关于不确定情况下判断的研究项目奠定基础。我教授的另一门关于感知心理学的课程,也直接为这一研究项目做出了贡献。
我在伯克利学到了很多,但我感觉自己在研究训练方面准备不足。因此,我决定为了掌握基本的研究技能,我需要建立一个适当的实验室并进行常规的科学研究——在成为大厨之前,我需要先成为一个出色的快餐厨师。于是我建立了一个视觉实验室,在接下来的几年里,我完成了关于视觉敏锐度中能量整合的可靠研究。
同时,我也试图发展一个研究项目,以研究儿童的社交动机,采用了我所称的“单一问题心理学”方法。我的灵感来自Walter Mischel的研究,他设计了两个问题向加勒比海岛屿上的儿童样本提出,其简洁而深刻的问题与回答让我深受启发:Mischel成功地将重要的心理学概念与简单的测量操作联系起来,在心理学中这几乎是独一无二的。
我在“单一问题研究”中取得了不错的成果,但因为我为自己设定了过高的标准——只报告至少详细复制过一次的发现,以避免污染文献——而从未发表这些研究。我逐渐意识到,我对研究的期望需要更大的统计力量,因此需要比我直觉上倾向进行的样本量更大。这一观察后来也证明是有用的。
我的早期研究成果相对平淡,但我对将心理学应用于现实世界的几个机会感到兴奋。在这些任务中,我与同事兼朋友Ozer Schild合作。我们共同设计了一个培训项目,为那些将向来自不发达国家的新移民介绍现代农业实践的工作人员提供培训。
我们还为空军飞行学校的教官开发了培训课程。我们对心理学的实用性充满信心,但也清楚地意识到,不改变体制和激励机制,改变行为是困难的。我们可能做了一些有益的工作,而且肯定学到了很多东西。
我在试图向飞行教官证明赞扬比惩罚更能有效促进技能学习时,经历了我职业生涯中最满足的顿悟体验。当我热情洋溢地结束演讲时,一位经验丰富的教官提出了反对意见,他的实际经验与我的理论相悖,但这却让我理解了一个重要的世界真理:由于我们倾向于在别人表现良好时给予奖励,在表现不佳时给予惩罚,加之回归平均值的现象,我们在奖励他人时往往会受到惩罚,在惩罚他人时反而会得到奖励,这是人类条件的一部分。我立即安排了一个演示,展示了即便在没有任何反馈的情况下,首次表现最佳的人在第二次尝试时大多表现变差,反之亦然。但我知道,这个演示不会消除终生接触到的错误连带反应的影响。
我第一次真正成功的研究经历发生在1965年,当时我在密歇根大学度过了我的休假年。在那里,我被引入到一个实验室,志愿者在被催眠诱导的强烈情绪状态下执行各种认知任务。因此我对瞳孔大小变化的原因和后果产生了兴趣。利用原始设备,我和研究生Jackson Beatty取得了一个真正的发现:当人们被暴露于一系列他们必须记住的数字时,他们的瞳孔在听到数字时稳定扩张,在复述这一系列数字时稳定收缩。我们很快发表了这些成果,并在一年内完成了四篇文章,其中两篇发表在《科学》杂志上。
心理努力在随后的一年里仍然是我的研究焦点,那一年我在哈佛度过。在那一年里,我还听了一位名为Anne Treisman的英国心理学明星关于注意力实验研究的精彩演讲,十二年后她成了我的妻子。我印象深刻,以至于我承诺为一本认知心理学手册写一章关于注意力的章节。这本手册从未出版,而我的章节最终成了一本相当雄心勃勃的书。我那一年所做的视觉工作也比我在耶路撒冷所做的更有趣。
当我在1967年回到家时,我终于成为了一名训练有素的研究心理学家。
与Amos Tversky的深入合作
在1968至1969年间,我授课于一个研究生研讨班,探讨心理学如何应用于现实问题中。在这个转折性的事件里,我邀请了我的年轻同事Amos Tversky,向我们分享他在判断与决策领域的新发现。Amos为我们介绍了他的前任导师Ward Edwards的研究,该研究利用了一种特殊的研究模式,即让被试观察两个装满扑克筹码的书包,这两个书包在筹码的颜色比例上有所不同(比如,70:30或30:70的白色/红色比例)。随机挑选其中一个书包,参与者需要连续从中抽取筹码,并在每次试验后判断这些筹码更可能来自哪个书包。Edwards的研究结果表明,人们通常是保守地使用贝叶斯定理的人:他们几乎总是正确地调整他们的判断,但调整的幅度往往不足。Amos的演讲引发了热烈的讨论。
大家普遍认为,将人们归类为保守的贝叶斯派与我们日常观察到的人们容易仓促下结论的现象不符。此外,人们怀疑这种连续抽样的实验结果是否能延伸到更常见的情形,即所有证据一次性呈现的情形。最后,“保守的贝叶斯派”的标签似乎暗示了一个不太可能的过程:即先得出正确答案,然后再加入偏见。
我最近了解到,就在那天,Amos的一位朋友听说了我们的讨论后,Amos对新贝叶斯理论的信仰产生了动摇。我记得Amos和我决定共进午餐,深入探讨我们关于概率“真实”评估方式的直觉。在那里,我们分享了彼此在这一领域反复出现的判断失误,并决定去研究专家的统计直觉。
我在1969年夏天在剑桥的应用心理学研究单元进行研究。Amos在前往美国的途中在那里停留了几天。基于我个人错误研究规划和未成功复现的经历,我准备了一份关于抽样变异性和统计效力直觉的问卷。问卷包含了一系列独立的问题,这是又一次尝试以单个问题进行心理学研究。Amos带着问卷参加了数学心理学协会的一次会议,并在几周后我们在耶路撒冷见面,审视了调查结果并撰写了论文。
这段经历充满了魔力。我之前有过合作的经验,但这次与众不同。人们常说Amos是他们见过的最聪明的人,他也非常幽默,总能根据每个场合的不同寻找到合适的笑话。
在他的陪伴下,我也变得风趣,结果是我们能够在连续不断的欢笑中完成大量的工作。我们撰写的论文刻意带有幽默感——我们描述了人们普遍相信的“小数定律”,认为大数定律同样适用于小样本。尽管我们后来没有再写过幽默的论文,但我们在工作中继续找到了乐趣——我可能与Amos共享了我一生中超过一半的笑声。
我们的合作不仅仅是为了乐趣。我很快发现,Amos对我在写作上遇到的所有困难都有解决办法。对他来说,不存在任何难以把握或模糊不清的问题:他有着不可思议的方向感。与他一起,我们总是在前进。进展可能缓慢,但我们每一次的草稿都有所改进——这是我在独立工作时不能确信的。
Amos的工作总是充满自信和清晰的优雅,我发现这些特质现在也体现在了我的想法上。在撰写我们的第一篇论文时,我意识到他比我自己可能写出的更加犹豫不决的作品要好得多。
我不确定Amos具体喜欢我们合作的哪一点——我们并不习惯交换赞美——但显然他也很享受这个过程。我们是一个团队,并且在十多年的时间里我们始终保持这种合作状态。诺贝尔奖是对我们在这段密集合作期间成果的认可。
在我们合作的开始,我们很快就建立了一种我们一直保持的工作节奏。Amos是夜猫子,我是早起者。这自然而然地让我们能在午餐和一个漫长的下午见面,同时还有时间做各自的事情。我们每天花几个小时只是聊天。当Amos的第一个儿子Oren,那时只有十五个月大,被告知他的父亲在工作时,他便说出了“爸爸在和Danny聊天”。当然,我们不仅仅是在工作——我们谈论了所有的事情,并且彼此了解对方的思想就如同了解自己一样。我们可以互相补充对方的句子,并讲出对方想要说的笑话,但我们也总能给对方带来惊喜。
我们几乎所有的合作项目都是在一起时完成的,包括问卷和论文的起草。我们避免了明确的分工。我们的原则是讨论每一个分歧,直到我们都满意为止,我们只在两个问题上设立了决定规则:是否应该在参考文献列表中包含某项内容(Amos有最终决定权),以及谁应该解决任何英语语法问题(我负责)。最初我们没有设立首席作者的概念。我们通过抛硬币来决定我们第一篇论文的作者顺序,并从那以后就轮流更换,直到80年代我们的合作模式发生了变化。
这种工作方式的一个结果是我们所有的想法都是共有的。我们的互动如此频繁和密切,以至于区分启发想法的讨论、想法的提出以及随后的发展几乎没有必要。我相信许多学者都有过这样的经历:在他们真正理解其意义之前,他们发现自己已经表达(有时甚至已经发表)了一个想法。对一个新思想的欣赏和发展需要时间。我们合作中的许多巨大乐趣——可能也是其成功的很大一部分——来自于我们能够发展彼此的初步想法:如果我表达了一个未成形的想法,我知道Amos会理解它,可能比我自己更清楚,并且如果它有价值,他会认识到。
像大多数人一样,我在向他人展示初步想法时会有些谨慎——我必须首先确保它们不是愚蠢的。在我们合作的最佳时期,这种谨慎完全消失了。我们之间建立的相互信任和完全缺乏防御性尤其值得注意,因为我们两人——尤其是Amos——都被认为是严厉的批评者。我们的合作魔力只有在我们独处时才能显现。我们很快就意识到,应避免与任何第三方合作,因为那会让我们变得有竞争性。
Amos和我一起拥有了一只能下金蛋的鹅——一个比我们各自的头脑更出色的集体智慧,这是我们共同的惊奇。统计记录证明,我们的共同工作要么更优秀,要么至少更有影响力(Laibson and Zeckhauser,1998)。在我们合作的黄金时期(1971-1981年),Amos和我发表了八篇期刊文章,其中五篇到2002年底被引用了超过一千次。
在我们各自的作品中,总共大约有200篇,只有Amos的相似性理论(Tversky,1977)和我关于注意力的书(Kahnean,1973)超过了那个门槛。我们合作的独特风格很早就被我们的第一篇理论论文的一位评审员所认可,他导致该论文被《心理学评论》拒绝。这位著名心理学家在多年后透露了他的匿名身份。他指出,他熟悉Amos和我分别进行的研究工作,认为两者都相当可敬。然而,他还说了一句不寻常的话,我们似乎激发了彼此最差的一面,绝对不应该合作。他最不满意的是我们使用多个单一问题作为证据的方法——而在这一点上他完全错误。
1974年的《科学》杂志文章以及关于理性的辩论
在1971至1972年间,Amos和我在俄勒冈研究所(ORI)的尤金度过了我一生中最有成就的一年。那一年,我们深入研究了可获得性启发式、预测心理学、锚定效应和过度自信现象,得到了同事们赋予的“动感二人组”的称号。除了夜以继日的工作,我还全面重写了关于“注意力与努力”的书籍,该书于那年出版,成为我在心理学领域最为重要的独立贡献。
在ORI,我首次接触到了一个由Amos在密歇根大学学习期间就已经熟知的令人兴奋的研究群体,包括Paul Slovic、Sarah Lichtenstein和Robyn Dawes等人。我还有幸学习到Lewis Goldberg在临床与精算判断方面的工作,以及Paul Hoffman关于参数建模的创见。ORI成为了判断研究的重要中心,许多该领域的杰出人物,如Ken Hammond,都曾来访。
在离开尤金后不久,Amos和我开始整理我们对判断启发式(代表性、可获得性和锚定)以及这些启发式相关的十几种偏见的所学。我们享受地度过了一年时间,专注于撰写一篇文章。我们的日常安排是下午一起工作,一天能前进一两句就已经很有成就感了。我们对这个过程的享受让我们展现出了无限的耐心,我们挑选每个词汇就像它们都极其重要一样。
我们选择在《科学》杂志上发表这篇文章,因为我们认为,直觉评估和预测中的系统性偏见可能会引起心理学之外学者的兴趣。然而,我在耶路撒冷一个派对上与一位知名美国哲学家的交锋让我意识到,这种兴趣并非理所当然。当被鼓励谈论Amos和我的研究时,他几乎立刻转身离开,表示对“愚蠢的心理学”并不感兴趣。
然而,《科学》上的这篇文章成为了一种罕见的现象:一篇被一些哲学家和少数经济学家认真对待的实证心理学文章。是什么让文章的读者比那位派对上的哲学家更愿意倾听?我认为,吸引人的不仅是信息本身,同样重要的是传达媒介的方式。Amos和我继续实践“单一问题心理学”,文章中引用了直接引用的问题。我相信,这些问题让读者产生了个人参与感,使他们认识到我们探讨的不是大众的愚蠢,而是像他们这样的聪明、成熟和有洞察力的人易受错误直觉影响的问题。不管原因如何,这篇文章很快成为反对理性代理模型的标准参考文献,并催生了认知科学、哲学和心理学的大量文献。这是一个我们未曾预料到的成果。
直到最近,我才意识到,我们之所以如此幸运,并非因为我们有意针对我们偶然击中的大目标。如果我们本意是挑战理性模型,我们可能会以不同方式撰写文章,而挑战可能就不那么有效了。讨论理性需要定义理性概念、讨论偏见出现的边界条件以及许多其他我们并不感兴趣的话题。结果可能会更加模糊、不那么挑衅,最终也不那么有说服力。就像现在这样,我们提供了一份关于我们对不确定判断研究的进展报告,包含了大量的实证证据。所有关于人类理性的推论都是由读者自己作出的。
读者得出的结论通常过于绝对,这主要是因为在传播过程中,存在量词往往会消失。虽然我们展示了(一些,而非全部)对不确定事件的判断是通过启发式来中介的,这(有时,而非总是)会产生可预测的偏见,但我们经常被解读为声称人们无法进行合理思考。有人曾不止一次地用人类登月的事实来反驳我们的立场。因为我们的处理被误解为全面包含,因此我们的沉默变得颇具含义。例如,我们没有讨论社会因素在判断中的作用,这被解读为我们认为这些因素不重要。我认为我们本可以预防至少一些这样的误解,但代价将非常高昂。
我们的工作被解读为对人类理性的广泛攻击——而不仅仅是对理性代理模型的批评——这引发了大量反对,有些甚至相当尖锐和贬低。一些批评是规范性的,认为我们将判断与不恰当的规范标准相比较(Cohen, 1981; Gigerenzer, 1991, 1996)。我们还被指责传播了一种夸大人类认知缺陷的倾向性和误导性信息(Lopes, 1991, 以及许多其他人)。从进化论的角度拒绝系统性偏见的观点被认为是不成立的(Cosmides & Tooby,1996)。一些作者抨击我们的研究,将其视为一系列设计来愚弄本科生的人造谜题。多年来,进行了众多实验,试图表明认知错觉可以“被消除”,并且启发式是为了解释“根本不存在的偏见”而发明的(Gigerenzer, 1991)。在80年代初参与了几场公开辩论后,Amos和我决定不再批评针对我们工作的批评,虽然最终我们觉得有必要做出一些例外(Kahneman and Tversky, 1996)。
我和一位年轻同事最近重新审视了实验文献,得出结论:当从双过程模型的视角观察时,关于认知错觉的实证争议就消失了(Kahneman and Frederick, 2002)。这种模型的核心是,判断可以通过两种方式(及其各种混合)产生:一种是快速、基于联想、自动和无需努力的直觉过程(有时称为系统1),另一种是较慢、基于规则、经过深思熟虑和需要努力的过程(系统2)(Sloman, 1996; Stanovich and West, 1999)。系统2“知道”直觉推理倾向于违反的一些规则,并且有时会介入以纠正或替换错误的直觉判断。因此,直觉错误的发生需要满足两个条件:系统1产生了错误,而系统2未能进行纠正。从这个角度看,能够“消除”认知错觉的实验实际上是通过促进系统2的纠正操作实现的。它们对被抑制的直觉判断提供了很少的信息。
如果争议可以这么简单地得到解决,那为什么它没有在1971年或1974年就被解决呢?Frederick和我提出的答案涉及到早期工作进行的会话背景:
一种全面的直觉判断心理学不能忽视这种受控思维,因为直觉可以被自我批评的操作所覆盖或纠正,而且直觉答案并不总是可用的。但是,在判断启发式研究的早期,这种明智的立场似乎是不相关的。《小数定律》的作者们认为没有必要检查正确的统计推理。他们认为,在设计中包括简单的问题会侮辱参与者并使读者感到无聊。更一般地说,早期的启发式和偏见研究对直觉推理被抑制或覆盖的条件几乎不感兴趣——将导致正确答案的受控推理视为默认情况,无需解释。对边界条件的忽视是“年轻”研究项目的典型特征,它们自然专注于展示新的和意想不到的效应,而不是让这些效应消失。(Kahneman and Frederick, 2002, p. 50)。
我想,由于1974年的论文产生了重大影响,它改变了随后几年中人们阅读它的背景。它被误解是因为它被认真对待的直接结果。我想知道这种情况多久发生一次。
Amos和我总是反驳那种认为我们关注偏见反映了对人类心智普遍悲观看法的批评。我们认为,这种批评将偏见研究的媒介与关于理性的信息混淆了。这种混淆确实很常见。例如,在我们展示可获得性启发式的一个实验中,我们要求受访者比较某些字母在单词的第一个和第三个位置出现的频率。我们选择了实际上在第三个位置出现更频繁的字母,并显示即使对于这些字母,第一个位置也被判断为更频繁,正如基于这个理论所预测的那样,通过第一个字母搜索心理词典更容易。
一些批评者将这个实验用作我们自己确认偏见的一个例子,因为我们只在这种启发式导致偏见的情况下展示了可获得性。但这种批评假设我们的目标是展示偏见,并错过了我们试图做的事情的要点。我们的目标是展示即使在启发式导致错误时,可获得性启发式也控制着频率估计——当启发式导致正确反应时,就无法提出这个论点,因为它经常这样做。
然而,不可否认,我们的方法和方法的名称在启发式和偏见之间建立了强烈的联系,从而有助于给启发式一个坏名字,这不是我们的意图。我最近意识到,启发式和偏见之间的联系也影响了我。在与Ralph Hertwig(不是启发式和偏见的粉丝)交换信息的过程中,我注意到“通过代表性判断”的短语在我的脑海中是直觉统计判断中一系列错误的标签。通过代表性判断概率确实与系统性错误相关联。但是这个过程的很大一部分是代表性的判断,而这个判断往往是微妙和高度熟练的。能够立即认出一个位置为“白方三步必胜”的大师级国际象棋选手就是代表性判断的一个例子。能够立即认出喜欢双关语更具有计算机科学家而不是会计师的代表性的本科生也展现了在社会和文化判断中的高技能。我长期未能将特定的好处与代表性的概念联系起来是一个揭示性的错误。
我从关于启发式和偏见的争议中学到了什么?像大多数辩论中的主角一样,我几乎没有记忆在对抗压力下改变我的想法,但我肯定学到了比我知道的更多。例如,我现在会迅速拒绝任何将我们的工作描述为展示人类非理性的描述。当机会出现时,我会仔细解释说,关于启发式和偏见的研究只是驳斥了一种将理性视为全面一致性的不现实概念。
我一直都这么小心吗?可能不是。在我当前的观点中,研究判断偏见需要关注直觉和反思思考之间的相互作用,这有时允许有偏见的判断,有时又覆盖或纠正它们。
这对我来说一直都很清楚吗?可能不是。最后,我现在对我之前提到的观察非常印象深刻,即最高技能的认知表现是直觉的,许多复杂的判断与日常感知的速度、信心和准确性共享。
这个观察对我来说不是新的,但它在我的观点中是否总是像现在这样占据重要地位?几乎可以肯定不是。正如我对这个主题的明显挣扎所揭示的,我彻底不喜欢明显不会改变任何人想法的争议。当我处于得分模式而失去客观性时,我感到自己变小了,当我生气时,我感到彻底羞辱。实际上,我对职业愤怒的恐惧是如此之大,以至于我允许自己多年来享受不评审可能引发那种情绪的论文的奢侈:如果语调刻薄,或者对事实的回顾比正常更倾向于一方,我就会不加评论地将论文退回给编辑。我认为自己很幸运没有经历过太多职业争论中的不愉快经历,并且感激偶尔在尖锐辩论的界限上遇到开放心态的机会(Ayton, 1998; Klein, 2000)。
前景理论
在1974年我们关于判断的论文在《科学》杂志上发表之后,Amos建议我们一起研究决策制定。这是一个他已经是公认的明星的领域,而我对此知之甚少。作为介绍,他建议我阅读他是合著者之一的《数学心理学》教科书的相关章节(Coombs、Dawes and Tversky,1970)。书中讨论了效用理论和Allais及Ellsberg的悖论,以及一些领域内主要人物参与的经典实验,这些实验试图通过引出简单赌博的选择来测量金钱的效用函数。
我从书中学到的是,游戏的名字是构建一个能够简约地解释Allais悖论的理论。作为心理学问题,这并不难,因为Allais的著名问题实际上是一种优雅的方式,用来展示对概率的主观反应并非线性。主观的非线性是显而易见的:.10与.11之间的概率差异显然不如0与.01或.99与1.00之间的差异那样引人注目。困难和悖论仅存在于决策理论家那里,因为对概率的非线性反应产生了违反合理选择的强有力公理的偏好,因此与标准期望效用理论不兼容。决策理论家对Allais悖论的自然反应,肯定在1975年,甚至可能在今天,都是寻找一组具有规范吸引力的新公理,同时允许非线性。心理学家的自然反应是搁置合理性问题,发展一个描述人们实际拥有的偏好的描述性理论,不管这些偏好是否可以被证明是合理的。
我们为自己设定的任务是解释传统上关于选择理论争论所进行的古怪且受限的宇宙中观察到的偏好:具有少数(全部为正)结果和确定概率的金钱赌博。这是一个经验问题,需要数据。Amos和我用一种既高效又愉快的方法解决了数据收集问题。我们一起度过的时间都在构思有趣的选择并检验我们的偏好。如果我们对相同的选择达成一致,我们暂时假设其他人也会接受它,并继续探索其理论含义。这种不寻常的方法使我们能够快速前进,我们以令人眼花缭乱的速度构建和抛弃模型。我对编号为37的模型有着清晰的记忆,但无法保证我们的计数准确无误。
与我们在判断工作中的情况一样,我们的核心洞察很早就获得了,我们在发表总结这些洞察的论文之前,花费了大量的时间和努力(Kahneman和Tversky,1979)。第一个洞察是由于我的天真。当阅读数学心理学教科书时,我对所有选择问题都被描述为收益和损失的事实感到困惑(实际上,几乎总是收益),而应该解释选择的效用函数却以财富为横坐标绘制。这看起来不自然,也不太可能在心理学上成立。我们立即决定采用变化和/或差异作为效用的载体。我们并不知道这一显而易见的举措确实是根本性的,或者它将开启行为经济学的道路。Harry Markowitz,在1952年提出了将财富变化作为效用的载体,他在1990年获得了经济学诺贝尔奖,但他并没有深入发展这一想法。
将效用的载体从财富转变为财富的变化之所以重要,是因为我们后来标记为损失厌恶的偏好属性:对损失的反应始终比对相应收益的反应更为强烈,在参考点处的价值函数有一个明显的折点。损失厌恶体现在人们对接受风险的极端不愿意上,当人们被提供一次抛硬币的赌博时:大多数人会拒绝一场他们可能损失20美元的赌博,除非他们赢了可以得到超过40美元。我相信,损失厌恶是我们对决策制定研究最有用的贡献。
收益和损失之间的不对称解决了不少谜题,包括人们在机会成本和“真实”损失之间所做的广为人知且在经济上不合理的区分。损失厌恶还有助于解释为什么在价格下跌时房地产市场会长时间停滞,它也有助于解释决策制定中普遍存在的偏好现状的偏差。最后,收益和损失的不对称考虑也扩展到道德直觉领域,在这个领域中,造成损失和未能分享收益被截然不同地评价。但当然,当我们第一次决定假设一个折点价值函数时,Amos和我都没有看到这些——我们需要那个折点来解释赌博之间的选择。
当Amos建议我们改变我们一直在考虑的问题中结果的符号时,另一组早期的洞察涌现了。结果令人兴奋。我们立即发现了一个显著的模式,我们称之为“反射”:改变一对赌博中所有结果的符号几乎总是会导致偏好从规避风险变为寻求风险,反之亦然。
例如,我们俩都更喜欢确定获得900美元而不是有.9的概率获得1000美元(或无),但我们更喜欢有.9的概率损失1000美元的赌博而不是确定损失900美元。我们并不是第一个观察到这种模式的人。Raiffa(1968)和Williams(1966)知道负域中风险寻求的普遍性。但我们的似乎是第一次认真尝试利用它。
我们很快就有了一个风险选择理论的草稿,我们称之为“价值理论”,并在1975年春季的一个会议上展示了它。然后我们花了大约三年的时间打磨它,直到我们准备好提交文章以供发表。在那些年里,我们的努力被分配到探索我们理论公式的有趣含义和针对所有合理反对意见的答案之间。为了娱乐,我们虚构了一个雄心勃勃的研究生的幽灵,寻找缺陷,我们努力让那个学生的任务尽可能感激。
前景理论最新颖的想法是在这种防御性背景下出现的。它出现得相当晚,当我们准备论文的最终版本时。我们担心的是,我们模型的直接应用意味着前景($100, .01; $100, .01)的价值大于($100, .02)的价值。这个预测当然是错误的,因为大多数决策者会自发地将前者转化为后者,并在随后的评估和选择操作中将它们视为等同。为了消除这个问题,我们提出决策者在评估前景之前执行一个编辑操作,将相似的结果收集起来并添加它们的概率。我们接着提出了几个其他的编辑操作,为理论的核心提供了一个显而易见且心理上合理的防御,对抗各种表面上的反例。我们成功地让那个学究式的研究生的生活变得相当困难。但我们也做出了一个真正重要的进步,通过明确选择的对象是心理表征,而不是世界的客观状态。这是朝着发展框架概念的方向迈出的一大步,最终朝着对理性主体模型的新批评迈进。
当我们准备好提交工作以供发表时,我们故意为我们的理论选择了一个无意义的名字:“前景理论”。我们认为,如果这个理论变得广为人知,拥有一个独特的标签将是一个优势。这可能是明智的。
我最近看了1975年的草稿,惊讶于它与最终发表的论文有多相似,也惊讶于这两篇论文有多不同。大部分关键的想法、大部分关键的例子,以及很多措辞都存在于早期的草稿中。但那份草稿缺乏我们在预期反对意见的那些年里获得的权威性。“价值理论”不会在一篇重要文章最终受到的严密审查中幸存下来,那是数代学者和学生给予的审查,如果你给他们机会的话,他们只会令人讨厌。
我们在《计量经济学》杂志上发表了这篇论文。选择发表地点被证明是重要的;同一篇论文如果发表在《心理学评论》上,可能对经济学几乎没有影响。但我们的决定并不是出于影响经济学的愿望。《计量经济学》恰好是迄今为止发表最佳决策制定论文的期刊,我们渴望加入那个行列。
前景理论的影响在很大程度上取决于介质以及信息。前景理论是一种正式的理论,其正式性是它在经济学中产生影响的关键。我相信,每一门社会科学学科都有一些竞赛性测试,必须通过这些测试,一项工作才被视为值得关注。这些测试对于防止信息过载是必要的,它们也是学科部落生活的重要方面。特别是,它们允许内部人士几乎可以忽略其他部落成员所做的一切,并且对此不感到学术上的愧疚。为了有效地执行这一筛选功能,这些能力测试通常侧重于某种形式或方法方面,并且与内容几乎没有或根本没有关系。前景理论在经济学中通过了这样的测试,其观察结果成为该学科学术话语中的一个合法(尽管是可选的)部分。这是一个奇怪且相当任意的过程,它选择一些科学写作作品获得相对持久的名声,同时将大多数发表的内容几乎立即遗忘。
框架效应与心理账户
在1977至1978学年间,我和Amos完成了前景理论(Prospect Theory),那时我在斯坦福的高级研究中心,而他则在心理学系进行访问。正是在这段时期,我们启动了下一个项目——研究框架效应,这也是我与Richard Thaler——我生命中极为重要的第二位专业伙伴——结识的开始。
框架效应是这样一种现象:通过构建一个问题的两个看似等价的版本,却能预测性地引导出不同的选择。一个典型的框架效应例子是关于“挽救生命 vs. 失去生命”的问题,它提出了两个处理即将夺走600条人命的疫情的公共卫生计划:一个计划能确保挽救200条人命,另一个计划有三分之一的概率挽救所有600人,但也有三分之二的概率一人也救不了。
在这个版本中,人们倾向于选择能确保挽救200人的计划。而在另一个版本中,第一个计划将导致400人死亡,另一个则有三分之二的概率导致600人死亡,三分之一的概率无人死亡。
这时,大多数人偏好于冒险一试。如果让相同的受访者在不同时间面对这两个问题,很多人会给出互相矛盾的答案。当他们意识到自己的这种不一致时,感到非常尴尬,但又无法解决,因为在选择不同规模生存人口时,没有道德直觉可循。
在探索前景理论的过程中,我和Amos设计出了一系列揭示框架效应的问题对,不仅展示了对收益与损失的敏感性,还指出了仅以最终状态作为结果的表述方式的不足。我们甚至展示了如何将单阶段赌博重新安排为双阶段赌博,改变偏好但不改变最终概率和结果。
之后,我们设计了让受访者面对涉及收益和损失的两个问题进行同时选择的实验,大多数人在面对收益时选择避险,在面对损失时选择冒险,但他们的选择组合实际上被他们拒绝的选项所支配。
框架效应的轻松展示揭示了人类心智的一个根本限制,而不是展示人类的愚蠢。在理性代理模型中,代理人的思维就像她希望的那样运作。框架效应违背了这种基本要求:那些表现出对框架效应敏感的人希望他们的思维能避免这种效应。
我们发现,只有两种心智可能避免框架效应:一种是对所有结果和概率反应完全线性的心智;另一种是保持一个统一全面的结果视角的心智。显然,这两种情况都不可能实现。框架效应违背了我们称之为“不变性”的理性的基本要求,这一发现我们在多年后的论文中有力地陈述了对理性辩论的贡献。
在我们的首篇框架效应文章中,我们还引入了无风险选择问题作为框架效应的展示,这得益于新朋友Richard Thaler的帮助。Thaler是一位具有敏锐且反传统思维的年轻经济学家。在研究生期间,他就以讽刺的视角批判自己的学科,并收集了一系列生动的例子,展示了在通常人类行为中,乃至于他在罗切斯特极为保守的教授们身上,经济理论基本原则的明显失败。禀赋效应就是其中的关键观察之一,Thaler用一个老酒瓶主人的例子进行说明。
1976年,Thaler得到了我们的前景理论草稿,这对我们的生活产生了重大影响。Thaler意识到,禀赋效应这一经济学中的谜团可以通过前景理论中的两个假设来解释:效用的载体是变化(得到或失去酒),而非状态(拥有或不拥有酒),且由于损失厌恶,失去比得到赋予了更大的权重。当得知我和Amos将在斯坦福时,Thaler便在斯坦福的国家经济研究局获得了访问职位。我们很快成为了朋友,并从此在彼此的思考上产生了深远的影响。
我们从Thaler那里学到的不仅仅是禀赋效应。他还开创了我们如今称之为“心理账户”的一系列现象。心理账户描述了人们如何因未能保持对结果的全面视角以及未能将金钱视为可互换而违反理性。Thaler展示了人们是如何将决策划分到不同的账户中,并努力使每个账户保持盈余。他的例子之一是,一对夫妇冒着暴风雪去看篮球比赛,仅因为他们已经买了票,尽管如果票是免费的,他们宁愿待在家里。这个例子展示了Thaler在进行“单问题经济学”的独到技巧。他的这种思维启发了我,构想了一个人到剧院发现丢失了票或等值现金的故事。人们通常会在丢失现金后仍愿意买票,因为损失被算入了总收入,但如果丢失了已买的票,他们倾向于回家,因为他们不愿为同一场演出付费两次。
行为经济学
与Thaler的合作最终成果远超我们当时的想象,这也是我获得诺贝尔奖的关键因素之一。奖项评委引用了我的贡献:“成功地将心理学研究的洞察整合入经济学科……”。尽管我不打算否认我所做的贡献,但我认为,这一整合工作实际上主要是由Thaler以及很快围绕他形成的一批年轻经济学家完成的,起始于Colin Camerer和George Loewenstein,随后是Matthew Rabin、David Laibson、Terry Odean和Sendhil Mullainathan等人。
Amos和我提供了许多最初的想法,这些想法最终被一些经济学家所吸纳,并且毫无疑问,前景理论为从心理学汲取经济代理人的现实假设提供了一定的正当性。
然而,行为经济学的开山之作实际上是Thaler在1980年的一篇文章中提出的,他通过一系列挑战消费者理论基本原则的小故事。我相信,行为经济学在学科内目前所享有的声望,部分是由Dick在现在被称为行为金融学的领域中所做的一些重要发现,以及他从1987年到1990年在《经济展望杂志》的每一期中发表的一系列“异常”专栏,并自那时以来偶尔继续撰写所确立的。
1982年,Amos和我在罗切斯特参加了认知科学学会的一次会议,在那里我们与斯隆基金会时任副总裁的心理学家Eric Wanner共度了愉快时光。Eric向我们表达了他希望促进心理学与经济学融合的兴趣,并征询了我们的建议。
我清晰记得我们的回答:我们认为,对于这样一个项目“诚实地投入大量资金”是行不通的,因为跨学科的兴趣不可强求。我们还认为,鼓励心理学家向经济学家发声是无济于事的,但鼓励和支持那些愿意倾听的少数经济学家则可能是有益的。
毫无疑问,Thaler的名字在讨论中被提及。那次对话不久后,Wanner成为了罗素·贝奇基金会的总裁,并将心理学与经济学整合项目带到了那里。他在该项目中做出的第一笔资助是为了支持Dick Thaler在1984-1985学年期间来访问我在温哥华的不列颠哥伦比亚大学。
那一年无疑是我职业生涯中最精彩的一年。我们与经济学家Jack Knetsch组成了三人团队,Jack已经和我一起开始就包括环境评估和市场公平观念等议题开展了一系列调查。Jack进行了禀赋效应的实验研究,并洞察到了该效应对科斯定理和环境政策的启示。我们组成了一个非常出色的团队:Jack的睿智和沉着,平衡了Dick波澜壮阔的性格,以及我的完美主义焦虑和思想的不安。
那一年,我们共同完成了许多工作。我们进行了一系列涉及实物商品(“马克杯”研究)的市场实验,这些实验最终成为该领域的标准(Kahneman、Knetsch and Thaler,1990)。我们还进行了多项调查,通过实验性变化的小故事来识别公众会将哪些公平规则应用于商人、房东和雇主(Kahneman、Knetsch and Thaler,1986a)。
我们的核心发现是,在许多情境中,现有的情况(如价格、租金或工资)定义了一种“参考交易”,交易者(消费者、租户和员工)对此有所期待——违背这些期待被视为不公平,并可能引发报复。例如,仅因为某员工可以被接受较低工资的人替代而削减其工资是不公平的,尽管向辞职员工的替代者支付较低工资则完全可接受。我们向《美国经济评论》提交了论文,并对其被毫无修正地接受感到惊讶。幸运的是,该杂志的编辑邀请了两位对我们方法持开放态度的经济学家进行评审。我们后来得知,其中一位评审员是George Akerlof,另一位是曾研究过一次严重的汽油短缺期间市场无法清算的情况的Alan Olmstead。
在这项研究过程中,一个问题浮现了:人们是否愿意为惩罚对他们“不公平”对待的另一方支付一定代价,在某些情况下,他们是否会与陌生人分享意外之财,以体现“公平”。我们决定通过实际赌注的实验来探索这些观念。我们为此目的设计的游戏被称为最后通牒游戏和独裁者游戏。遗憾的是,在撰写我们关于公平的第二篇论文(Kahneman、Knetsch和Thaler,1986b)时,我们发现Werner Guth及其同事使用相同设计的实验几年前已经发表了,我们被抢先一步。当我得知这一点时,我感到相当沮丧。如果我当时知道最后通牒游戏最终会变得如此重要,我会更加沮丧。
那一年,我从我的两位乐于教导的老师——Jack和Dick——那里学到了我所知道的大部分经济学知识,这实际上是我第一次跨越部落界限进行沟通的经历。我还对Dick Thaler、James Brander和我共同设计的实验游戏——N游戏——印象深刻。这个游戏由一组约十五人进行,每轮游戏中会宣布一个0<N<15的数字。参与者随后同时做出是否“参与”的选择。那些选择参与的人同时宣布他们的选择。参与者的收益根据以下公式计算:$.25(N* – N)。我们进行了几轮游戏,其中一次是与不列颠哥伦比亚大学心理学系的教员进行的。结果虽然对经济学家来说并不意外,但对我来说却像魔法一般。仅仅几轮之后,就出现了一个模式,其中参与者的数量N与N*相差1或2,没有明显的系统性偏差。
这个群体在整体上做得很好,尽管与参与者的对话和明显的统计分析并未揭示任何一致的策略。我花了一些时间才意识到我们观察到的“魔法”实际上是一种均衡状态:我们看到的模式之所以存在,是因为没有其他模式能够持续下去。这个概念之前并不在我的知识工具箱中。我们从未正式发表过N*游戏——我在Kahneman(1987)中非正式地描述了它——但它已被其他人采用(Erev & Rapoport, 1998)。
这是我研究最接近核心经济学的时刻,自那以后,我主要是作为旁观者为Thaler和行为经济学加油助威。有许多值得欢呼的时刻。作为一个标志性的进展,我回想起我与George Akerlof共同教授的心理学和经济学研讨会,这是在Anne Treisman和我1986年从不列颠哥伦比亚大学搬到伯克利之后的事。我记得对理性假设即使在像George这样的自由思想家中也被如此崇敬,以及他频繁警告学生们不要被我们所介绍的材料所诱惑,以免他们的职业生涯遭受永久性损害。他给学生们的建议是至少在他们的职业生涯稳定之前,坚持所谓的“主流经济学”。当时这种观点相当普遍。当Matthew Rabin作为一名年轻的助理教授加入伯克利经济系并选择深入心理学时,许多人认为这是职业自杀。大约十五年后,Rabin获得了克拉克奖章,而George Akerlof发表了题为“行为宏观经济学”的诺贝尔演讲。
Eric Wanner和罗素·贝奇基金会多年来一直支持行为经济学。我在使用其中一些支持来为该领域的研究生和年轻教师设立一个暑期学校的想法中发挥了作用,并帮助Dick Thaler和Colin Camerer组织了第一个,即1994年的暑期学校。当第五届暑期学校在2002年召开时,David Laibson,他在1994年参加过,那时已在哈佛大学获得终身教职,并成为三位组织者之一。Terrance Odean和Sendhil Mullainathan也曾作为学生参加,后来作为在世界顶尖大学任职的成功研究人员回来讲课。听Matthew Rabin教授一套行为经济学理论发展的指南是一次非凡的经历——包括建议标准经济模型应该是构建的更复杂、更普遍模型的一个特例。我们已经走了很长的路。
尽管行为经济学在过去十五年里取得了远超预期的进展,并在经济学界获得了更多的认可,但它仍然是一种边缘方法,其对经济学的大多数领域的影响微乎其微。许多经济学家认为这是一种昙花一现的潮流,有些人甚至希望它是如此。未来可能会证明他们是对的。但现在许多聪明的年轻经济学家正在押注他们的职业生涯,期待当前的趋势将持续下去。而这样的期望往往能够自我实现。
后来的岁月
Anne Treisman和我于1978年结婚,并一同搬至不列颠哥伦比亚大学,同年,Amos和Barbara Tversky定居斯坦福。那时,我和Amos正处于我们合作的巅峰时期,全身心投入到了我们的共同事业中。在接下来的几年里,尽管我们通过每两周共度周末和每天多次、有时长达数小时的电话沟通,努力维持这种合作关系,我们还是完成了框架效应和“联结谬误”判断(Tversky and Kahneman, 1983)的研究。但最终,这个曾孕育金蛋的合作关系开始衰减。
虽然这种结局现在看来是不可避免的,但对我们来说,这却是一个痛苦的惊讶。我们彻底没能意识到,我们成功的互动是多么依赖于我们在每一个重要想法诞生时都在一起,我们拒绝任何形式的工作分工,以及当我们只能偶尔见面时,曾经视为理所当然的无尽耐心变成了奢侈。我们努力了多年,想要重拾失去的魔力,但都未能成功。
当Amos去世时,我们还在尝试中。1996年初,当他得知自己只剩几个月的生命时,我们决定共同编辑一本关于决策的书,覆盖我们二十多年前开始合作研究这一主题以来取得的进展(Kahneman and Tversky, 2000)。我们计划了一篇宏伟的前言作为合作项目,但我想我们俩从一开始就知道,我们不会有足够的时间完成它。我独自撰写的前言可能是我最痛苦的写作经历。
当然,在这期间,我们继续进行工作,有时一起,有时与其他合作者合作。Amos在我们最重要的共同作品之一中起了领头作用,即将前景理论扩展到多结果情形,反映了等级依赖模型的精神。他还与Eldar Shafir和Itamar Simonson合作,对决策中的争论和冲突角色进行了杰出的研究,以及与Shmuel Sattath和Paul Slovic合作,对程序不变性的违反进行了有影响力的工作。他还与Peter Wakker深入探讨了决策理论的数学结构。在他生命的最后几年,Amos投入到支持理论的发展中,这是一种处理不确定性下思维的通用方法,他的学生们继续探索。这些仅仅是他在决策领域的主要研究努力——他做了更多。
我也保持忙碌,并且继续搬迁。Anne Treisman和我在1986年搬到了加州大学伯克利分校,然后在1993年搬到普林斯顿大学,在那里我很高兴地获得了一份在伍德罗·威尔逊公共事务学院的兼职职位。搬到东部也使我更容易与以色列的朋友、孩子和深爱的孙子孙女保持频繁联系。
多年来,我与Dale Miller在反事实思维理论的发展上进行了富有成效的合作,以及与Anne Treisman在视觉注意力和对象感知研究上的合作。除了我们与Dick Thaler一起关于公平性和禀赋效应的研究外,Jack Knetsch和我进行的公共物品估值研究引起了相当大的争议,并对我自己的思考产生了深远的影响。随后与Ilana Ritov的进一步研究最终引出了一个观点,即将态度转化为货币涉及几乎随意选择的比例因子,导致一些价值观非常相似的人表达了截然不同的支付意愿,毫无充分理由(Kahneman, Ritov, and Schkade, 1999)。与David Schkade和著名法学家Cass Sunstein合作,我将这个想法扩展到了对惩罚性赔偿决策中任意性的研究项目,这可能对政策产生一些影响(Sunstein, Kahneman, Schkade, and Ritov, 2002)。
过去十五年,我研究的重点是体验效用的各个方面——人们实际生活中对结果的效用度量。
我感兴趣的效用概念是Bentham和Edgeworth所考虑的那种。然而,体验效用在二十世纪的经济学讨论中大部分时间里消失了,转而偏好一种我称之为决策效用的概念,该概念是从选择中推断出来的,并用来解释选择。对于完全理性的代理来说,这种区分可能无关紧要,因为他们假定同时最大化体验效用和决策效用。但如果不能假定理性,那么结果的质量就值得衡量,最大化体验效用成为一个可测试的命题。实际上,我和我的同事进行了一些实验,在这些实验中这个命题被证伪了。
这些实验利用了一个简单的规则,它管理着被动暴露于愉快或不愉快体验(如观看可怕的电影或有趣的电影,或接受结肠镜检查)的过去事件中分配给记忆效用的规则(Frederickson and Kahneman, 1993; Redelmeier and Kahneman, 1993)。记忆效用主要由事件期间经历的愉悦或不适的最高强度,以及事件结束时的愉悦或不适强度决定。事件的持续时间几乎不影响其记忆效用。
与这个规则一致,一个手被浸入痛苦冷水中的60秒事件将留下比较长的事件更不好的记忆,后者在相同的60秒后跟着30秒温度略有上升的时间。尽管额外的30秒很痛苦,但它们提供了一个改善的结束。当实验参与者暴露于这两个事件时,然后给予选择哪个重复的选择时,大多数人选择了更长的一个(Kahneman, Fredrickson, Schreiber and Redelmeier, 1993)。
在这些和其他同类型的实验中(Schreiber and Kahneman, 2000),人们在可能暴露的经验之间做出错误的选择,因为他们对自己的情感记忆系统性错误。我们的证据与标准的理性模型相矛盾,该模型不区分体验效用和决策效用。我将其作为对理性假设的新型挑战提出(Kahneman, 1994)。
近年来,我大部分的实证工作是与我的朋友David Schkade合作完成的。我们当前的研究主题是对幸福感的研究,这建立在我之前对体验效用的研究上。我们组建了一个多学科团队,试图开发出经济学家愿意认真对待的福利测量工具。
另一个主要努力投入到了更新判断启发式概念的论文中。这项工作是与一位年轻同事Shane Frederick紧密合作完成的。我们在每个词的选择上所付出的努力几乎可以与我和Amos的经历媲美(Kahneman and Frederick, 2002)。我的诺贝尔演讲是该论文的扩展。
我希望可能变得有影响力的一条工作线是对抗性合作程序的发展,我倡导它作为当前在社会科学中进行辩论的批评-回应- 再回应格式的替代品。无论是作为参与者还是读者,我都对这些交流的荒谬对抗性感到震惊,在这些交流中,几乎没有人承认错误或承认从对方那里学到了什么。对抗性合作涉及一种真诚的努力,通过进行联合研究来进行辩论——在某些情况下,可能需要一个公认的仲裁者来领导项目并收集数据。因为没有期望争论双方在练习结束时达成完全一致,对抗性合作通常会导致一种不寻常的联合出版物,其中分歧作为联合作者论文的一部分被列出。
我进行了三次对抗性合作,与Tom Gilovich和Victoria Medvec(Gilovich, Medvec and Kahneman, 1998),与Ralph Hertwig(Barbara Mellers是公认的仲裁者,见Mellers, Hertwig and Kahneman, 2001),以及与英国的一群实验经济学家(Bateman et al., 2003)。Mellers等人文章的附录提出了对抗性合作进行的详细协议。
在另一个案例中,我没有说服两位同事我们应该进行对抗性合作,但我们共同开发了另一种比回应- 再回应格式更具建设性的程序。他们写了一篇批评我的工作线的文章,但我们决定不进行通常的不愉快评论交换,而是决定写一篇联合文章,从我们确实同意的内容开始,然后继续进行一系列关于我们不同意的问题的短辩论(Ariely, Kahneman, & Loewenstein, 2000)。我希望更高效的争议进行程序将成为我的遗产的一部分。■
相关阅读:在不确定的世界里,如何像贝叶斯一样思考
当你走到人生十字路口,面对选择不知如何决策?当你遭遇重大挫折,心情低落找不到前行的力量?当你看到了自己技能的天花板,想要向上突破又找不到人指点?
人生发展咨询依托强大的认知科学、神经科学和心理学的研究,建立了一套21世纪的大一统模型:人性系统论。在过去2年,我们帮助近300位一线城市和新一线城市的来访者,解决了他们的人生发展难题。点击下方「阅读全文」加入东木咨询知识星球。
如果你想报名人生发展咨询,请关注东木咨询公众号,添加客服”东小木“了解吧。