概论
前言
由于受到托马斯·索维尔的影响,我很早以前就打算找一本说明统计误导相关的书看,现在总算实现了这个愿望。
书中提到了很多美国体制的问题,这对我驳斥民小言论很有帮助。比如美国选举中的种种乱象、美国司法审判中的诸多冤假错案……都说明我们需要建立一套更加合理完善的制度。
书中提到了一个「反统计」的概念来说明那些不准确的统计量。我以前就觉察到这一点,但是没有找出适当的词语概括。维特根斯坦和奥威尔都认可语言的威力,这算是一种语言威力的展示。无法准确表述则就无从进一步探究或是驳斥。
我觉得作者的思想偏左,麦卡锡的数字固然不准确,但是维诺那计划表明美国国务院确实存在大量的苏联间谍,而麦卡锡的失败以及杜威败选也让中国人民陷入了史上最大的浩劫当中迄今也没能恢复正常。
当然,本书翻译质量不行,作者还是一个教新闻学的教授。
学习如何正确地说话以及摆事实讲道理是从政人员的必备素质,毕竟人的注意力有限,而大脑可塑性很高。
美国选举制度的弊病确实值得深挖。
列数字的作用是很明显的,就像编简历使用的「STAR」法则一眼,借助数字(即使不太准确)也能增强说服力。
这就反映到选举人素质判断问题上来了,能看出数字当中一些基本的问题,保持良知和常识就是选举人要有的素质。
选举其实可以使用基于区块链技术的电子投票系统,每位选民都能检阅自己的投票结果,民间机构可以查阅某次选举匿名投票的所有数据。
我设计的未来中国独特的选举制度,可以让我们规避掉这些问题。
作者对辛普森案的看法也存在一定的偏颇。辛普森脱案和那个杀妻比率无关。
作者还提到了平均数和中位数的区别。这个确实毕竟重要。宽泛点讲,真正重要的指标是人均可支配收入(或购买力)而不是人均GDP。此外是每个人出色所以全体才突出,不是全体突出所以个体优秀,这个主要是针对认为中国人口变少自己就能过上好生活的傻子说的。人口众多,投资才多,导致消费旺盛。否则黑龙江、西藏、青海等地就成了中国最发达的地区。
修改坐标轴、忽略题目难度来评估学习考试水平,这些都是比较常见的把戏。
说到民意调查中「不同的问法,结果截然相反」,大傻瓜阿普比应该深谙此道。
书中还提到了阿罗不可能定理,但是没有提后续的阿玛蒂亚·森的解决办法。
美国人口统计难题让我重新审视了原本关于国民大会的设想,常设委员会(众议院)可以先固定名额,剩余的再按人口分配。元老院可以考虑一下各地主政官员。
在经验丰富的人手中,“格里蝾螈”行为可以让政党凌驾于民意之上以获得更大的权势。它可以牢固地确立不太受欢迎的政客的地位或者驱逐受欢迎的政客,它可以让某些选票失去实际意义而让另外一些选票显得更加重要。更糟糕的是,“格里蝾螈”行为的实际应用导致选民们难以惩罚那些侵害选民权益、窃取了权柄的政客,重新划分选区的方案使得那些需要为“格里蝾螈”行为负责的在位者更容易连任。
“数字的骗术”已经暗中侵蚀和损害了民主制度的基础,即那些用以清点公民人数、决定他们在国会中享有公平代表权的机制。政治斗争性质的“格里蝾螈”行为被认为是可以接受的,尽管它明显消解了部分公民的选票价值。而统计抽样被认为是无法接受的,尽管禁止使用它会迫使美国政府不得不接受明知不够精确的数据。无论有多少善于巧言令色的议员、法官竭尽全力为自身立场辩护,事实仍然不变:糟糕的数学手段正被用来剥夺美国公民主要是非美国裔公民的正当投票权。在一个民主国家中,这是最为严重的罪行。
死刑裁决中的种族歧视因素一节提到了一些例子,但现在是反过来了。
书籍简介
作者: [美] 查尔斯•塞费
出版社: 中信出版社
原作名: Proofiness: The Dark Arts of Mathematical Deception
译者: 佘引
出版年: 2011-9
页数: 258
定价: 42.00元
装帧: 平装
ISBN: 9787508629049
内容简介
“使用手机会让罹患脑瘤的风险提高2倍”,“某公司员工的平均年薪为10万美金”,“上个月的通货膨胀率为5.8%”,“全球变暖冰山融化会使海平面上升20英尺”……这样包含有数字的耸人听闻的新闻标题随处可见,如果你相信它们,那你就中了数字的圈套了。
在人们心中,数字天生就具备凌驾于个人主观意志之上的权威性,它一看就懂的特性,往往比长篇大论的文字更容易吸引我们的注意力。甚至无论某种说法多么不靠谱,只要它包含了貌似精确的数字,我们通常都会选择相信它。跟其他炒作手段一样,数字可以被用来解除怀疑、蒙蔽记者、愚弄公众。于是,假专业人士、政客、企业、科研组织、学校、调研公司、新闻媒体之手,“数字的骗术”出现了,而且愈演愈烈。捏造的“原始”数据、伪造的统计结果和刻意歪曲事实的算法,以各种实实在在、令人担忧的方式影响着我们每个人的生活:不合格的新药上市,不合适的人选就任政府要职,不合理的新经济政策出台,被包装成低风险的投机产品,天价理发店,天价医疗费,等等。
数字的角色真假难辨,它既有说服力,又有欺骗性,到底我们要如何看穿数字?作者查尔斯·塞费引领我们拆穿波将金数字、成果包装、润色数字等唬人的数字伎俩,引用发生我们身边的新闻事件,教我们用普通人所具备的常识、生活经验与能力,去找出数字背后的真相,练就受用一生的数字透视力。
作者简介
查尔斯·塞费(Charles Seife)出版了4本个人著作,其中包括《瓶中的太阳》和《零》,后者是首部荣获美国马尔塔·阿尔布朗文学奖的非小说类文学作品,也是《纽约时报》推荐图书。其个人作品经常见于《科学》《纽约时报》《新科学家》《科学美国人》《经济学家》和《连线》等报刊杂志上。他生活在纽约,现任纽约大学新闻学教授。
正文摘录
引言 用数字编织的谎言
麦卡锡演讲的巨大威力完全来自数字。虽然这个数字是虚构的,但是它让整个谎言显得很有说服力。它似乎暗示着,麦卡锡手上的那沓文件都是关于美国国务院工作人员的糟糕透顶的黑幕。或许,正是“205”这个数字强有力地“证实”了麦卡锡的指控必须被认真对待。
正如麦卡锡所知的,数字可以成为强大的武器。在野心家的手中,虚假的数据、捏造的统计结果和暗箱操作的数学论证可以产生意外的见解、无耻到可以以假乱真的谎言。它们可以被用来打击对手、伤害批评者和压制言论。事实上,某些人在捏造数字来“证明”自己的谎言是真实的方面的技术已经达到了“炉火纯青”的地步,他们成了“数字骗术大师”——使用假的数学论证过程来证明某些大家都心知肚明的东西是真实的,即便它的确是假的。
我们的社会充斥着“数字的骗术”。借助一些强有力的技巧,成千上万的人正在制造各种数字谎言来让人们轻信这些不实之词。广告商捏造数据来诱惑消费者购买其产品;政客篡改数据来欺骗选民改变初衷为他们投票;权威人物和预言家们使用虚假的数学论证方法来忽悠大众相信他们子虚乌有的预言;商人使用不真实的数据来骗顾客的钱;民意调研专家假装倾听被调研对象的意见,却利用“数字的骗术”,把他们希望人们相信的意见当成主流民意来传播。
有些人使用这些技巧是为了说服人们相信无聊和荒谬的事情。科学家和其他一些人已经通过“数字的骗术”来表明,奥运短跑选手终有一天会跑得比声音还快。还有一个数学公式据说可以判定谁的屁股长得最完美。看来,“数字的骗术”能够发展到“谬无止境”的程度。
同时,“数字的骗术”已经带来非常严重的后果。它让大选变得没什么用处,给不配赢得选举的人加冕,不管他是共和党人还是民主党人。更糟糕的是,它还被用来扭曲未来的选举结果。政客们使用僵化的数学计算方法来操纵选举结果,并且暗中破坏与各州在国会的代表席位有关的美国人口普查。“数字的骗术”应该为美国经济危机负责,并且为超过万亿美元的财富从国库流失负责!检察官和法官们使用“数字的骗术”来开释罪人并给无辜者定罪甚至将其处死。简而言之,糟糕的数学论证正在侵蚀着美国的民主!
威胁同时来自左翼和右翼。事实上,“数字的骗术”有时似乎是美国共和党人和美国民主党人的唯一共同点。不过,识别它也是有可能的。那些懂得识别“数字的骗术”的人们会发现,它几乎无处不在并试图诱使公众陷入由显而易见的谎言所编织的假象中。对警觉的人们来说,“数字的骗术”成了黑色幽默与愤怒的来源。
一旦人们知道了使用数字制造谎言的办法,“数字的骗术”就无法再蒙蔽人们了。当读者们学会将“数字的骗术”追根究底,最有争议的一些话题会变得简单明了。例如,“究竟谁应该在2000年美国大选中胜出”将会变得清楚无比。(令人惊奇的答案或许是没有人愿意接受的:不是小布什,不是戈尔,也不是投票给他们两个人之一的任何选民。)戳穿“数字的骗术”,读者们就可以发现很多之前曾经被谎言的阴霾所遮蔽的真相。
第一章 伪造的事实,捏造的数字
如果你希望让人们相信某些非常愚蠢无趣的信息,你只需要在其中加入一个数字就可以了。一旦采用数字来描述,即便最糊涂可笑、荒谬绝伦的事情也可能变得真实可信。
天生金发碧眼的人种已经濒临灭绝了吗?几年前,媒体界纷纷就一份据称来自世界卫生组织的研究报告发表意见,这份报告宣称天生金发碧眼的人种在不久的将来就会成为“历史”。英国广播公司宣告,天生金发碧眼的人种会“正式灭绝于2202年”。《早安美国》节目则告诉观众,天生金发碧眼的人种会“在200年内在地球上彻底消失”,因为控制金发碧眼外貌的基因“不如控制黑发褐肤外貌的基因强有力”。此类说法喧嚣一时,以至于世界卫生组织不得不发布了一份非同寻常的辟谣声明:
世界卫生组织希望澄清事实,本组织从未就此课题进行过任何研究。而且,据世界卫生组织所知,本组织从未发布过这样一份预测天生金发碧眼的人种会在2202年灭绝的报告。世界卫生组织并不了解这些相关的新闻报道有着怎样的源头、依据,但必须重申我们对于天生金发碧眼的人种在未来是否存在并没有任何看法。
很明显,整份报告是被捏造出来的,完全是无稽之谈。人们应该在世界卫生组织公开否认以前就认识到这一点。一位遗传学家早就在接受英国广播公司采访时就表达了同样的立场,“基因不会灭绝,除非拥有那些基因的生物处于进化的劣势之中。”他说,“所以控制金发碧眼外貌的基因不会消失。”但是英国广播公司所倡导的不轻信的职业操守已经完全不起作用了。记者们轻易相信了这份虚假的报告,其部分原因就是报告中存在着捏造的数字。这种特征,这种似乎非常真实、精准地描述了最后一个金发碧眼外貌的人的出生时间的预言,给整份报告加上了似乎合理的特殊光环,并成功地蒙骗了那些本来应该更明事理的新闻工作者。
无论一种观点多么白痴,多么站不住脚,数字都能让它显得很可信。“在美国,58%的健身活动都会通过电视节目播出,”微软全国广播公司的主持人德博拉·诺维尔在2004年的某期节目中面无表情地读出这组数据,接下来她说,“比如说,美国人在2003年做的35亿次仰卧起坐运动当中,230万次出现在健身类电视节目上。”诺维尔丝毫没有停下来思考一下这些前后不一致的数据是否存在问题,就轻信了这些虚假的数字并原封不动地将它们告诉听众,其实她只需要略微思考一下就可以发现这种说法纯粹是胡说八道。几个月过后,也许是出于不愿意被同事“赶超”的心态,微软全国广播公司的另一位主持人基思·奥尔伯曼“探听”到印第安纳大学刚刚结束了一项长达5年的“研究”的“独家新闻”,据说这项“研究”证明了“在第一个孩子出生后,100%的父母的智商都会至少下降12个点,而平均下降值则高达20个点”。当然,这些数字同样是胡说八道的结果。数字就这样让诺维尔的大脑出现了短路,致使她完全无力进行审视性思考。这种现象很典型。数字有着凌驾于个人主观立场之上的权威性,因为数字凭借着最纯粹的形式来彰显着真理。
痛苦或快乐是无法准确计量的
每个真实世界中的数字都伴随着计量单位,这种情况是普遍的。而且,由于计量手段本身就易于出错(计量行为毕竟是由人来执行并且使用人造仪器完成的),得到的数字也不可能是完美可靠的。正如我们接下来要介绍的那样,甚至最简单的计数行为也蕴涵着出错的可能。因此,每一次计量行为和每一个真实世界中的数字都有一点点模糊,都有一点点不确定,它只能略带瑕疵地反映真相。数字则因此变得总是不够纯净,它实际上是真实、差错和不确定性的混合体。
“数字的骗术”有着凌驾于我们主观立场之上的权威性,这是因为我们对事物的不纯净性视而不见。数字、图解和曲线图都拥有貌似完美的光环,它们看上去似乎代表了绝对真实,似乎不容置疑,但这仅仅是错觉而已。存在于我们日常生活中的数字,也就是那些我们真正关注的数字,是存在缺陷的,它们未必有着充分的依据,因为计量行为是有漏洞的。它们可以被人们随便改动、胡乱修补、熟练控制、刻意杜撰,甚至用来颠倒是非。而且这些谎言借助数字的魔力披上了标有“无可辩驳的事实”字样的神圣外衣,变得难以撼动。这正是“数字的骗术”显得如此危险的原因。
所有计量行为都不是完美的,的确如此。然而,某些计量行为会显得比其他的更加不完美。因此,所有数字并不是同样不可靠和易于出错的。某些基于非常可靠和客观的计量行为得出的数据可以相当接近绝对真实。而其他数据——那些基于不可靠的或者主观的或者荒谬的计量行为的数据——更接近绝对谬误。但是,一个具体数字究竟属于哪一种呢?这常常是不明显的。
可靠的数字应该来源于正确的计量行为,正确的计量行为应该是可以“复制”的——反复进行两次或者10次甚至500次计量,你应该每一次都得到相当精确的同一结果。正确的计量行为也应该是客观的——即使不同的观测者使用不同的计量仪器来执行同样的计量行为,他们也应该就结果达成共识。例如,对时间或长度的计量行为就是客观的、可以“复制”的。如果你把一堆跑表器分给一群人,让他们去看同一场比赛,比如说肯塔基州的德比大战,并且要求他们对比赛时间进行计量,他们就会向你汇报出几乎相同的结果(只要他们都能胜任这项工作)。假设整个体育场里的所有人都掏出不同的跑表器、闹钟来对比赛时间进行计量,他们几乎都能得到相同的结果,比如说,这次赛跑一共花费了1分45秒,各个结果之间最多会有一丁点儿差异。同样,如果你让一群人对铅笔的长度进行测量,那么他们可以采用直尺、卷尺还有激光计量仪来得到最终结果,具体计量方式也是无关紧要的。当所有计量行为结束后,这些人会达成共识,比如说,这根铅笔长4.5英寸,各个结果之间也最多会有一丁点儿差异。计量行为的结果并不会随着执行者、工具之类的因素的改变而更改,答案总是大致相同的。这就是正确的计量行为的本质特征。
另一方面,错误的计量行为会欺骗我们,使得我们相信错误的结论,甚至蓄意捏造的谎言。而且很多错误的计量行为也是很常见的。幸运的是,当错误的计量行为出现时,你总能发现警告信号。
无处不在的“波将金数字”
最离谱的“荣誉称号”只能属于那些被捏造出来的计量行为——毫无意义的甚至完全不存在的计量行为——得出的数字。这样的数字也是无处不在的,不过它们在商品标签上最为常见。我们不妨回忆一下,欧莱雅使用怎样的计量方法来断定自己的极致卷翘丰盈睫毛膏可以“给睫毛带来12倍的冲击力”。(或许他们找了人来反复眨眼睛,再用专业声音计量仪器来检测睫毛在使用睫毛膏之前和之后闭合时发出的声音强度。)你觉得凡士林公司在研究上下了多大工夫,以至于他们可以确认新款保湿霜能“将每一滴的保湿效果增强70%”?(这类产品保湿效果的增强应该是存在上限的,毕竟,它们总不可能与提供100%保湿效果的水达到同一水平。)无论某种说法多么可笑,把它变换成具体的数字表达出来都会让它变得值得信赖,哪怕这种说法明显是荒谬绝伦的。正因为如此,那些超自然现象的研究人员才会认为有必要刻意一本正经地声明,而不是嘻嘻哈哈地说,29%的天主教圣徒曾经展现过超能力。
把计量行为粉饰得似乎具备充足的科学依据,这对于人们来说是很有成就感的,也是人们轻车熟路的习惯性行为。烟草制造商在这方面就表现得相当内行,这总比在广告中加入大量模棱两可的废话要好得多。“从开始抽到抽完一根烟,切斯特菲尔德香烟总能给你带来可计量的柔和与清凉感受……不愧是你的最佳选择!”这是一则出现于1955年的香烟广告。你根本无法计量一支香烟能带来的柔和与清凉感受,就像你无法计量睫毛闭合时的冲击力一样。即便人们尝试去计量冲击力、柔和与清凉感受,计量出的结果也是毫无实际意义的。此类计量行为就是典型的捏造出来的,它们就像是演员穿上了实验室人员专用的白大褂。它们看起来具备某种意义上的科学依据,但是它们完全是被捏造出来的。因此,与此类计量行为相关联的数字也是完全不具备真实意义的。它们就是捏造的数字,也就是所谓的“波将金数字”。
……
“波将金数字”就是“波将金村”在数字范畴内的具体表现。它们是数字化的假象,看起来很像是真实的计量数据。存在真实世界中的有意义的数字都会与某一类相当可靠的计量行为相关联,有可能这种关联是含蓄的。而“波将金数字”则毫无意义,因为它们要么来自虚假的计量行为,要么与真实的计量行为毫不相关,它们完全是由造假者捏造出来的。
例如,1995年10月16日,美国伊斯兰教协会的领导者路易斯·法拉罕组织了一次大规模的集会——百万人大进军。当然,这次集会的名称在很早以前就确定了,那时可没人能确认是否真的会有100万人来参与这次集会。当集会参与者拥挤在公交、大巴、列车和飞机上向华盛顿的国家大草坪涌去时,这的确称得上是一次影响力巨大的活动,但它的规模达到了它的名称所标榜的程度了吗?法拉罕自然会宣称确实如此,他提供的非官方参与人数统计结果甚至超过了100万人。然而,法拉罕的统计结果就是典型的“波将金数字”。我们完全可以预料到,无论确切的参与人数是多少,百万人大进军的组织者都会宣称确实有那么多人参加了集会,不然他们会感到局促不安的。真正负责进行官方统计的国家大草坪公园管理部门感受到了需要夸大这个数字的压力。“如果我们事先宣称参与人数是25万人,那么事后我们会宣称实际人数是50万人,”一位执勤警员在集会即将开始时告诉《华盛顿邮报》的记者,“如果我们事先宣称参与人数是50万人,那么我们事后会说实际人数是100万人。实际上或多或少会差一些,如果你有兴趣我们俩不妨打个赌。”尽管如此,公园管理部门还是忠实地采用航拍方式来逐个计算人头以便迅速估计出真实的人数。正如预测的那样,当参与人数的官方统计结果——40万人,偏差在20%以内——揭晓时,法拉罕狂怒并且威胁要起诉公园管理部门。(虽然公园管理部门提供的官方统计结果或许是最接近实际的,但是某些非官方的统计结果达到了大约90万人,这自然离100万人也有一定差距,但居然比参与人数官方统计结果的两倍还多。这体现出表面上很简单的统计行为实际上可能会变得很复杂,而且会极具政治敏感性。)结果,公园管理部门在以后10多年中就再也不去统计集会人数了,任凭集会组织者们随意编造那些只能算是“波将金数字”的非官方统计结果,而不用担心与来自可靠来源的统计结果相冲突。
每当有大型公众活动举行时,某些人总会在互联网上造势,捏造出一个夸大的数字,使观众人数看起来似乎很庞大。几乎每一年,加州帕萨迪纳举行的玫瑰花车游行的主办方都会宣称(大概是专门说给赞助商听的),他们统计出的观众总数有100万以上,可是实际观众总数可能只有一半左右。围观奥巴马总统就职仪式的观众总人数被统计为多达500万人,这个数字可能是真正的观众总数的2~3倍。和左翼人士一样,右翼人士也喜欢篡改参与人数的统计结果,他们是乌合之众。2009年9月,许多右翼时事评论员宣称,美国广播公司新闻频道报道了到华盛顿参与反政府“茶话会”抗议活动的总人数达100万以上,实际上美国广播公司报道的参与总人数只有6万~7万。两个月后,美国共和党众议员米歇尔·巴赫曼在肖恩·汉尼蒂主持的有关保守派倾向的综艺节目中宣称,有2万~4.5万愤怒的美国公民参与了她组织的一次抗议活动,她拿出的一份“现场”视频剪辑似乎可以证明她的断言。尽管如此,真实统计结果离此有很大的距离,《华盛顿邮报》估算出现场参与人数只有1万人左右。更恶劣的是,在肖恩主持的节目中播放出来的那段视频剪辑中的部分内容来自9月份一场更大规模的抗议活动,这当然会让参与人数看起来比真实情况多得多。(当这个骗局被喜剧演员乔恩·斯图尔特在日常综艺节目中被揭穿后,肖恩·汉尼蒂迅速承认他“犯了一个错误”:“我们弄错了,是因为粗心大意而犯了错,但这毕竟只是个错误而已。”然后,他强装欢笑地感谢乔恩·斯图尔特认真观看了自己的节目。)
“波将金数字”的捏造者们几乎不在意他们所给出的数字是否基于任何客观的事实依据。然而,长期以来,它们好像很有说服力,这些“波将金数字”可以成为支持在辩论中处于下风的一方和给固执的辩论对手带来沉重一击的有力武器。甚至连最不值得相信的“波将金数字”都可以带来极大的损害。例如,麦卡锡参议员那个关于美国联邦部门中存在着205个“潜伏”的共产党员的著名“声明”,就很显然是胡编乱造的结果,但却让他成了国家级的标志性人物。
最危险的数字——反统计结果
使用“波将金数字”是耍弄“数字的骗术”的最常见形式,干这种事情基本不需要技巧。毕竟,为自己想要陈述的论点捏造出一个正适合佐证的数字,这样做真的简单到令人难以置信的地步,这正是“波将金数字”为啥如此普遍的原因。所有的统计结论当中,有78%都是因为这类目的而捏造出来的,而且36%的读者会真的相信这些捏造的统计结论。然而,“波将金数字”的说服力毕竟是有限的,只要有人具备足够的独立思考能力,更加仔细地检验这些数字,谎言就会被戳穿。我们需要当心的是那些更加难以捉摸且更加危险地耍弄“数字的骗术”的形式。
下面介绍一则与美国自然历史博物馆中的生命进化过程展览有关的轶事。每一天,参观博物馆的游客们都会观看这个展览,人们必然会在展览的最后部分看到博物馆中最壮观的景致,那就是一具庞大的可怕的雷克斯霸王龙的骨架,它耸立在惊讶好奇的游客们面前。终于有一天,一位天真少年注视着这具骨架向导游发问:“它到底有多少岁了?”
“65000038岁。”导游自豪地回答道。
少年追问道:“你怎么可能了解得那么准确?”
“很简单!我在这里上班的第一天就问过一位科学家这个问题了,当时他告诉我这只恐龙已经6500万岁了。从那时候到现在正好38年。”
这件轶事似乎并不是很滑稽,但它阐明了很重要的一点:博物馆的导游所给出的数字——65000038岁——是很荒谬的。当导游在估算的数字中加上38年时,他就犯下了一个数学上的错误,使得他的回答变成了谎言。他的做法就是耍弄“数字的骗术”的典型表现。
当科学家告诉博物馆的导游这条恐龙已经6500万岁时,这个回答被潜在地绑定在一整套计量行为上了。古生物学家以某种方式计量了恐龙存活的真实年代,或许依靠观测它的骨架中含有的放射性物质的衰减状况来估算,或许依靠观测化石所在的地层的实际年代推算出6500万岁的结论,但是这个数字仅仅是一个估算出的近似值,化石年代可能存在数十万年甚至上百万年的偏差,因此,6500万岁的结论并不是准确无误的。计量不可能真的准确无误,它们总会包含着差错。
拥有严谨细心的计量态度,借助尖端、精密的计量器材,你可以将差错的程度降低。常见的直尺会带来大约半毫米的计量偏差。如果你拿它来计量诸如铅笔一类的东西,当你很专业地将眼睛贴近直尺以确保铅笔与直尺上的刻度完全平行对准时,你就可以确认你所测得的150毫米的结果与铅笔的真实长度之间的差异在半毫米以内。然而,这并不是计量的极限。如果你愿意,你完全可以得到一个更理想的答案。你只需花钱去买更专业的设备,也许你可以使用一款昂贵的、带有更精密的刻度标志的工程用直尺,或者更好的测径器、千分尺等设备,对同一对象的长度进行更精密地计量。利用这类设备,你可以把偏差减小到一微米、100纳米以内。老旧的木制直尺会表明这根铅笔长150毫米,偏差在半毫米以内;昂贵的测径器或许会表明这根铅笔长150.112毫米,偏差在一微米以内。凭借偏差更小的优势,比起木制直尺,测径器更能让你了解铅笔的真实长度。
在实验室里,科研人员使用激光、原子干涉仪或其他专业仪器来使得长度计量更加精确,把偏差减小到一纳米或更微小的量级。理论上,某人可以测得这根铅笔的准确长度是150.1124835毫米,偏差极其微小。你的计量越精密而且代价越贵,你就越容易把计量中存在的偏差减小到最低程度,获得的结果也越接近真相。我们假设“真相”确实存在,而这一点并不总是显而易见的。事实上,把长度计量细化到原子量级以后,就算你还在试图进行更精密的计量,“长度”的概念也会变得不再准确。铅笔上的原子会不停地运动,铅笔的各部分在不停地伸展、收缩,所以测得的铅笔的实际长度仅仅在那一瞬间是有意义的。越过某个临界点后,自然性质就会导致你一直延续着希望寻找这跟铅笔的“真实”长度的努力,但你却发现要寻找的“真相”始终处于模糊状态。但是,重要的一点还在发挥其效力——任何计量总会带来一定程度的差错并掩盖住真相。不管怎样,这种偏差永远不会消失。无论你多么小心翼翼,计量在某种意义上只能接近于真相,只能是真相的不完美映像。差错掩盖了真相,并且会在计量中加入一点点捏造的因素和不确定因素。无论最终偏差在半毫米以内、一微米以内还是一纳米以内,差错始终存在着,并且略微掩盖了真相。
差错的存在使得任何计量行为仅仅是在某个幅度内准确,具体的幅度则由计量仪器的本质属性决定。尝试去得到超越计量仪器所能达到的精确度的结果是徒劳的。最高档的直尺也只能保证在你计量铅笔长度时存在1/4毫米、1/10毫米等范围以内的偏差。无论你多么小心翼翼,无论你反复计量多少次,无论你盯着多么专业的放大镜仔细读数,你都无法要求直尺为你提供比“大约150.1毫米”更精确的铅笔长度的计量结果。那是你通过直尺所能得到的精确度的极限值。
如果你非常认真地关注数字,你会发现,它们早已明确表现出近似值的本质。它们会表现出它们的精确度极限值,更妙的是,它们还会提醒你可以相信它们到什么程度。这些信息就潜藏在我们谈论数字的方式中;你对此早已习以为常,尽管你很可能还没意识到这一点。当有人说出一根铅笔长150.112毫米时,你会自然而然地认为这个计量结果非常准确。与之相对应的是,如果他说这根铅笔长150毫米,你就会认为这个计量结果不够精确。取整数的结果会传达一个潜在的信号,那便是与其相关联的计量行为存在着较大偏差,你不能太过信赖它,因为它是粗略的近似值。位数足够多而且相当准确的数字则传达着相反的信号,那就是它们出自更加值得信赖的计量行为并且更接近绝对真相。所有真实世界中存在的数字都会这样表现。当有人说自己买车花了15000美元时,你就会自然而然地认为这个数字中存在着较大的水分,真实的金额会在15000美元左右,与15000美元存在着几百美元的差距。但如果有人说自己买车花了15232美元时,你会认为这是他真正付出的价钱,顶多只存在几毛钱的偏差。类似的是,如果有人说自己18岁了,你会觉得他实际上正处于18~19岁之间。如果他说自己18岁2个月零3天了,你知道他的说法顶多只存在几个小时的偏差,而且他对自己的年龄相当在意。数字本身的圆满程度为你提供了线索,让你理解到这个数字的精确度,以及你应该以怎样的态度来对待它。
这就是那个有关恐龙骨架年龄的轶事的关键所在。当科学家说这具霸王龙骨架已经6500万岁时,这个数字很明显就是一个粗略的近似值,计量偏差大约是100万年左右。(大量科研计划可以让计量的精确度随数字位数的增加而越来越接近真实结果。例如,在过去20年间,科学家对宇宙年龄的估计从“约150亿年”、“约140亿年”变成了“约137亿年”。这一步步出现在数字上的微小变化表现出人类对外太空的了解有着非同寻常甚至革命性的进展。)事实上,恐龙骨架的真实“年龄”或许是64963211岁,或许是65031844岁。无论如何,古生物学家的计量行为还不能准确反映出真相。当他说这具骨架已经6500万岁时,他任凭这个计量结果存在着巨大的偏差——6500岁存在1万、10万甚至100万年数量级的偏差。
博物馆的导游把事情弄砸了,他单纯按照字面意思去理解6500万岁的含义。他无视恐龙骨架年龄的计量结果中潜藏着由粗略的计量手段所导致的巨大的偏差范围,与之相反,他认为当他开始在博物馆工作时,恐龙骨架的准确年龄就是6500万岁。只有这样理解,我们才能解释得通他说出65000038岁这个数字的原因。但由于计量中的偏差幅度明显远远大于他在博物馆里工作的这38年,所以他得出的65000038岁的结果是荒谬的。恐龙的年龄仍旧应该是6500万岁,而且在百年、千年之后仍旧如此。导游犯了错误,他犯了“反统计”错误。
“反统计”就是单纯按字面意义来理解数字,却较少地估计或无视与数字本身相关联的不确定性。“反统计”使得数字表现得似乎更加精确,并把原本表现得确实易于出错的计量行为粉饰得近乎确凿、真实。它是耍弄“数字的骗术”的一种隐蔽方式,它让数字表现得似乎更加值得信赖,但实际上却可能像导游所描述的65000038岁的恐龙一样愚蠢可笑、毫无意义。
每隔几年,政府相关部门和新闻媒体就会例行公事地展开一场有关人口数量何时会达到标志性临界点的“反统计”活动。各国人口普查部门和全世界范围内的人口学家会经常估算每个国家的具体人口数。他们的估算结果看起来很精确,甚至能够预言诸如世界人口恰好达到60亿的时点,能告诉大家第60亿个地球人会在几小时内出生。这似乎意味着人口统计可以得出任何精确结果。可是,人口数量总是起伏不定地变化着,出生和死亡则在无规律地、不对称地发生着,且通常发生在离人口统计人员很远的地方,所以,人们根本不可能确切了解某一时刻的世界人口总数。尽管如此,1999年10月13日,在闪光灯下,时任联合国秘书长的科菲·安南举起一个波黑男婴,恭喜他成为第60亿个活着的地球人。(联合国坚持说安南在萨拉热窝的出现只不过是一个偶然而已。那么,第60亿个活着的地球人真是足够幸运,他居然恰好在安南正好访问这个城市时出生。)
准确判断谁是第60亿个活着的地球人的办法根本不存在,因为计量行为当中的不确定性实在太显著了。你应该了解这一点,人们绝对不具备从几千个婴儿中找出那一个的能力,绝对无法判断某个婴儿到底是第60亿个、第5999998346个,还是第6000001954个。尽力施展“反统计”的伎俩,完全忽略人口数字中存在的不确定性,我们每个人都可以跳出来宣称某个婴儿是第60亿个活着的地球人。然而,在每一个人口数量的标志性临界点即将到来时,全世界的官员和新闻界人士就会再次联合上演这一幕荒诞的童话剧。2006年,《芝加哥太阳时报》公开宣称,一个名叫亚历桑德拉·鲁伊兹的芝加哥女婴成了第3亿个活着的美国人。(他们很聪明地抢在其他媒体之前发布了这则消息,甚至在美国人口普查部门所估计的美国人口达到3亿的那个时刻之前1小时就作出了这个武断的结论。)而且,世界人口总数预计将在2012年初达到70亿,那时候联合国或许又会宣称某个幸运的婴儿是第70亿个活着的地球人,而完全无视事实——这不过是在撒谎。
“反统计”伎俩比“波将金数字”更能持久欺骗大众。“波将金数字”纯粹出于想象而且以欺诈为目的,而“反统计”的源头是真实、有意义、可信的计量行为,它的问题在于我们没有足够精确地弄清结果数字的性质。这确实是相当难以捉摸的问题,因此,“反统计”伎俩很难被识别出来,而且它们不会像“波将金数字”那样一经仔细研究就露出破绽。一旦某项“反统计”的结果被公众相信了,它的真相就很难被揭穿。比方说,人的体温为多少算正常?如果你生活在美国或其他极少还在使用陈旧的华氏度标准的国家,你的回答必然是98.6华氏度。如果你的家用医药箱里恰好有一支液态体温计,它上面必然会在98.6华氏度的位置上有一个独特的箭头符号。用它测试体温,当你发现水银液体的平面高于那个箭头符号时,你大概会断定自己发烧了。然而,你或许还不知道,98.6华氏度就是一个典型的“反统计”的结果。
将人的正常体温定为98.6华氏度,这一主张来自19世纪60年代末期德国物理学家卡尔·文德利希所作的研究。这个数字看起来非常准确、具有权威性,但它的精确性只不过是假象而已。有不少理由告诫我们不要照字面意思去理解这个98.6华氏度。
文德利希或许篡改过他的原始测量数据。他相当含糊地宣称自己以令人难以置信的精确度测量了100万人的体温。在汇总了所有的体温测量结果以后,他得出了最终结论,将人的“正常”体温定为37摄氏度——在世界范围内通用的一个美妙的整数级的标准体温结果。把37摄氏度这个美妙的整数级的标准体温结果转换为华氏温度值,即为98.6华氏度,而且不经意地让这个数字看起来更加精确。此外,文德利希是从别人的腋窝测量出体温的,所以即使他的测量是有效的、精确的,他对于“正常”的定义也无法适用于从嘴或其他地方进行体温测量的行为,因为这些部位的实际温度存在着细微的差别。人体的温度并不是各部分都是一致的,其结果取决于你所选择的测量体温的具体部位。这正是大多数人没有重视过的根源性错误。他们不会重视体温在一天中会随时段波动的事实,更不会重视人与人之间的“正常体温”可能差距甚大的事实。事实上,必须牢牢遵守的“正常体温”的精确定义本身就不存在,我们更不用把98.6华氏度这个貌似精确到0.1华氏度数量级的标准奉为金科玉律。然而,我们仍然会锚定这个魔力数字,甚至某些医学辞典真的把体温高于98.6华氏度的现象认定为发烧。大家赋予这个不切实际的貌似精确的数字极大的重要性,即使“正常体温”的定义本身就是不精确的,难以判定的,甚至是来自主观臆断的。这就是典型的“反统计”,尽管它已被信守了近150年。
由于“反统计”的难以捉摸性和持久欺骗性,它算得上是“数字的骗术”中一种极其危险的类型。即使“反统计”并不像“波将金数字”那样毫无意义,它们也会在现实中掺入大量的幻想成分。未能成功认识到计量行为本身的局限性,可能会相当危险,因为这样做有可能创造出一个看起来极为可信却与真实结果相去甚远的数字。
被精心包装过的数字
有很多办法可以用来耍弄“数字的骗术”。“波将金数字”创造出毫无意义的虚假统计结果。“反统计”故意忽略数字蕴涵的局限性,把数字歪曲成谎言。第三种方法则是“成果包装”,它与前两种略有不同。在人们施展“成果包装”的伎俩时,单独的数字依旧是真实可信的,而对数据资料的歪曲解释导致了“数字的骗术”的得逞。
超市工作人员对批发来的水果进行精心挑选,然后调整布局和位置,再将水果码堆,让质量一般的水果看起来非常诱人。同样,那些专门对数字进行“成果包装”的人也对数据资料进行精心挑选并作出安排和调整,并将它们美化成看起来准确、可靠并且足以支持最终结论的数字,即使这些数据资料、结论本身就是值得怀疑的。最精通“成果包装”手法的人们甚至可以捏造出无懈可击的数字,然后故意把它们放入不合适的上下文中以便构成谎言。这是一种令人惊奇的、能给人留下深刻印象的骗术。
最优选择
在“成果包装”者的“兵工厂”里,“最优选择”是最强大的舆论武器之一。“最优选择”就是小心翼翼地筛选数据资料,只选出那些最能证明预设论点的内容,同时淡化或忽略那些不符合预设论点的内容。
由于真实世界中的数字总是不够准确的,与数字相关的问题的答案也就不会是很明确的。用不同的方法计量同一事物可能得出不同的答案;部分数字结果可能过高,部分则可能会过低,其他结果则会比较幸运地接近正确答案。找出正确答案的最佳办法就是把所有数字结果都放到一起来评判,弄明白每种计量方法的优点、不足所在,以便计量者选择出尽可能接近真实情况的结果。而另一方面,进行“最优选择”的人只会选择那些能支持自己论点的数据资料,把它们介绍给公众,而故意把无法支持自己论点的数据资料排斥在外,不管它们是否更接近真实情况。“最优选择”就是通过选择数据资料让论点显得更加有说服力的方式来撒谎的。这种行为相当普遍,在政治领域尤其普遍。它在科学领域也很普遍,主要是因为“发表性偏倚”现象。进行学术价值评定的期刊会对最出色的论文进行“最优选择”并且发表。这就意味着,拥有醒目结果的论文会被发表到影响力很大的权威期刊上,而影响力不够大(不能得出醒目结果)的论文就只能发表在没什么影响力的小期刊上,甚至无法发表。发表性偏倚现象导致科研成果被歪曲,甚至产生更恶劣的影响,比如它会迫使科研人员把结果包装得更加令人印象深刻。每个政客都或多或少有通过“最优选择”来撒谎的恶劣行为。
阿尔·戈尔在他主演的著名环保纪录片《难以忽视的真相》中就有过“最优选择”的行为。这部拍摄于2006年的纪录片的高潮部分令人紧张且激动不已:戈尔利用电脑模拟程序来展示地球表面各处遭受全球气温变暖影响后的状况。利用一系列的地形示意图,他指出地球上的海岸线会随着海平面水位上涨而不断侵蚀陆地,佛罗里达州和路易斯安那州的大部分土地将会淹没在加勒比海中,几乎整个孟加拉国都会在怒涛中沉入海底。为了阐述这个观点所制作的动画场景相当漂亮,让观众几乎毫无疑问地相信全球变暖会惊人地彻底改变整个地貌。然而,这段动画场景仅仅基于一个经过“最优选择”的数字,即只有当融化的冰山导致海平面水位普遍上涨20英尺时,地球表面才会发生这样剧烈的变化。
很多科学家曾尝试构造数据模型来模拟全球变暖所带来的影响,而他们大多得出了各不相同、差别明显的结论。他们基本认同全球变暖业已发生的事实,认为人类的活动是全球变暖的主要原因,而且相信海平面水位会在接下来的一个世纪中上升。我在这里指出戈尔的“最优选择”行为,但这并不意味着我否认全球变暖的事实。有很多不容置疑的观测数据可以证明全球变暖已经发生了的事实。问题仅仅在于,无论什么时候,海平面水位都应该不会上涨20英尺之多。但是,即便最坏的情况(例如格陵兰岛和南极洲西部的大冰原都受热融化)发生了,海平面水位都不太可能会上升20英尺甚至更多。无论如何,大多数严谨的科学预测报告所得出的海平面水位上升幅度都远远小于戈尔表达的这个幅度。一些气象学家表示,海平面水位会在接下来的一个世纪中上升大约2英尺,另一些气象学家给出的结论则是4英尺,这是当前最科学的预测结果。然而,戈尔忽略了这些更加科学的预测结论,而选择极端的海平面水位上升模型的结论——20英尺,以便于他在屏幕上展现的场景更为可怕。这的确让观众们惊叹不已,但这是一种“最优选择”的行为。
跟戈尔一样,小布什也有过“最优选择”的恶劣行为。跟每一任美国总统一样,小布什总爱把自己偏爱的规划项目说得天花乱坠。例如,“不让一个孩子落后”是他任职初期所制定的教育改革政策。根据2002年小布什签署的此项法案,各州教育行政部门将获得用于推行强制性学生统考和其他教育改革措施的经费。这是一次极富争议的举措。几年后,在美国国情咨文演说里,小布什宣告“不让一个孩子落后”的教育改革政策在美国各地中小学取得了惊人的成就。“5年前,国会议员们克服党派之争,团结起来批准了此项法案……而且,由于我们批准了这个方案,中小学生们普遍在英语阅读、数学科目中表现得更好了。”这个宣告就是很罕见的双重“最优选择”行为的范例。
首先,当小布什武断地宣告美国中小学生普遍在英语阅读、数学科目中表现得更好时,他就不得不进行“最优选择”。他用以立论的数据资料来源于美国教育部,美国教育部会举办周期性的全国教学水平评估测试,来考察美国中小学生在很多科目中的学习表现。当然,最终获得的数据资料表明,四年级、八年级学生的英语阅读、数学科目平均得分确实在“不让一个孩子落后”法案实施后明显提高了。但是,有一些数据资料则被他忽略掉了。十二年级学生的英语阅读科目平均得分在同一时期出现了明显下降。或许情况本身有些复杂(高年级测试题目类型有变化,变得更难),不过十二年级学生的数学科目平均得分也有轻微下降。所以,只有忽略掉十二年级学生的成绩,才能说学生们普遍在英语阅读、数学科目中都表现得更好,否则就是站不住脚的。强调正面的论据,忽略反面的论据,这就是第一重“最优选择”行为。
其次,将美国中小学生们普遍在英语阅读、数学科目中表现得更好的现象归因于“不让一个孩子落后”法案,这同样需要“最优选择”。如果你认真去查看小布什引用的数据资料,你就会发现,四年级、八年级学生的数学科目平均得分从20世纪90年代开始就在逐年按基本相同的比例提高,这种状况早在法案通过前就出现了。同样,四年级、八年级学生的英语阅读科目平均得分也从20世纪90年代开始逐年按这个(适当的)基本相同的比例提高。通过忽略掉2002年以前的数据资料的方式,小布什成功地把“不让一个孩子落后”法案的实施伪装成美国中小学生们普遍在英语阅读、数学科目中表现得更好的原因,而不顾这些年来学生成绩整体提高的趋势并没有发生变化的铁定事实。只有当人们未能列举出早年的数据资料,以至于无法按照正确的背景知识来评判学生的得分时,“不让一个孩子落后”法案的实施才会表现为似乎是学生成绩上升的原因。这就是第二重“最优选择”行为。事实上还存在着第三重“最优选择”行为。就算大家认可数学、英语阅读科目是很重要的,学校也提供了大量其他科目,如英语写作、科学、历史等。根据从这些科目采集来的数据资料,中小学生们的成绩仅仅是稍有提高,甚至在某些情况下还会出现下降,尤其是在高年级。只关注英语阅读和(部分)数学成绩的变化,并把它作为评价教育改革成果的标志,这是很片面的。看吧!就算“不让一个孩子落后”法案彻底失败了,小布什也能把它说成是一项成功的举措。
与教育行业相关的调查统计是“成果包装”的最佳温床。改进教育体制确实很难,想要在这个带有极大惰性的庞大官僚体制上作一番改动,需要大量金钱、努力和时间。对于政客来说,更困扰他们的一点是,好的教育政策必须要经历很多年后才会真正见效并让当届政府受益;或许当公民们意识到某位杰出领导人确实改进了教育体制时,他已经下台很多年了。“成果包装”则提供了展现“政绩”的捷径,它甚至使得政客压根不用费工夫修改教育政策,就可以享受到切实改进教育体制所带来的益处。
指鹿为马
在纽约州,全州学生统考得出的英语阅读、数学科目整体分数自2005年以来持续大幅提高。任何对教育政策提出过一丁点儿意见的政客,都年年因这持续提高的分数沾光。例如,在2008年,纽约市市长迈克尔·布隆伯格就宣称,在全州学生统考成绩中出现的这“令人激动的上升趋势”,展示了他接任以来全市公立学校发生的“翻天覆地的变化”。然而,当2005年全州学生统考实施后,教师们私下告诉记者们,这一年的考试题目其实比前一年的简单了不少。“跟2004年的考试题目相比,差别真是明显啊!”布朗克斯区某学校的校长告诉《纽约时报》的记者:“我为孩子们感到高兴,他们参加完2005年全州学生统考后心情都舒畅多了。”全州学生统考的整体分数逐年戏剧性地、令人难以置信地提高。然而,在全国学生统考中,纽约州看起来并没有这样成功。例如,在纽约市,全国学生统考的整体分数几乎没有变化。很明显,纽约州官方故意降低了考试题目的难度。通过让考试年复一年变简单的办法,人为制造了全州学生统考成绩提高的态势。看上去似乎是孩子们在考试中表现得越来越好了,但实际上这种分数的提升是毫无意义的。2004年全州学生统考的整体分数与2006年全州学生统考的整体分数具有完全不同的意义,而2006年全州学生统考的整体分数也与2008年全州学生统考的整体分数具有完全不同的意义。纽约州官方却佯称这些统考是同等水平的,他们展示了另一种“成果包装”的手法——指鹿为马。
这种特殊花招儿往往耍在数量单位上。正如本章前面所提到的那样,每个存在于真实世界中的数字都附带着某个计量单位——一个用以告诉人们这个数字与某种计量行为相关联的类似“英尺”、“秒”、“千克”或“美元”的小标签。当你比较两个数字的大小时,确认两者的单位相同是必不可少的,否则比较就完全没有实际意义。有时候这一点是明显的(如55秒与6.3英尺哪个更长),但有时候问题很棘手,需要艰难地判断出单位并不一致。在A考试中获得50分与在B考试中获得70分,哪个分数更理想?除非你有办法把A考试中的分数转换成B考试中的分数,反之亦然,否则这种比较是毫无意义的。
除非考试主办方确认某个给定的分数的价值始终保持稳定,否则直接比较各年份的考试分数是一件毫无价值的事情,而纽约州官方恰恰就在直接比较各年份的考试分数,并充分利用“指鹿为马”的手法让分数显得逐年攀升,从而令人感觉纽约州的教育体制正在逐年改进。“指鹿为马”的实际效果与“最优选择”很相似,当纽约州官方“指鹿为马”时,他们歪曲了数字的真实含义,让统计结果似乎可以支持预设论点,但事实上并非如此。
想要揭穿“指鹿为马”式的骗术,的确有些困难,因为计量单位本身是易变的。有些计量单位的含义一直在变动。例如,美元是美国人用来计量金钱的单位,但作为财富单位,美元本身的价值一直在波动。翻开一本旧期刊看看广告,美元的价值波动会让你眼花缭乱。我办公室里的一份1970年12月出版的《绅士》载明,一辆低档两厢轿车标价1899美元,一件名牌行李箱标价17美元,一双大批量制造的男鞋标价19美元。2010年,一辆低档两厢轿车标价12000美元,一件名牌行李箱标价130美元,一双大批量制造的男鞋大约标价100美元。尽管这些数字看上去都紧跟着同样的计量单位——美元,但1970年的美元实际上跟2010年的美元差别很大。1970年,1美元的价值相当于一双男鞋价值的5%以上,而2010年它的价值仅为一双男鞋价值的1%左右。这意味着1970年的美元比后来的更值钱。如果你仔细翻阅那本1970年的杂志,你很快就会得出结论:1970年的1美元的购买力是2010年的1美元的购买力的5~7倍。(例如,在2010年购买一辆轿车需要花费相当于在1970年购买它所需开支的6.3倍左右。)显然,1970年的美元和2010年的美元可以说是两个差别很大的计量单位了,它们之间的差别就像加仑与品脱。
读者大概知道,这种改变是由通货膨胀引起的。商品和服务的价格每一年都会略微——典型情况是3%左右——上涨。年复一年,买一加仑颜料需要花更多的钱,雇工人来家里装修粉刷、搭公交车上班也需要花更多的钱,总之任何需要花钱完成的事情都会需要花更多的钱。这样一来,貌似无所不能的美元随着时光的流逝变得越来越不值钱。这导致对不同时代的花销进行比较变得有些困难了,你不得不去除通货膨胀的因素以考虑美元的价值所发生的变化。然而,有时候人们会因图方便而“忽略”这种转换并让自己的观点显得更有力。2005年11月,号称“蓝狗联盟”的一群美国民主党国会议员就利用以下这点小花絮对时任美国总统的小布什进行攻击:
按照美国财政部提供的资料,在美国历史的前224年(1776~2000年)中,42位美国总统一共向外国政府和财团借债1.01万亿美元。而在刚刚过去的几年中,小布什政府的外债数字就达到了令人难以置信的1.05万亿美元。
这些数字都是真实的,小布什也的确是一位很会创造债务赤字的挥霍者。可是,这种单纯的数字比较是毫无意义的,因为它就是“指鹿为马”式的比较——2001、2005年的美元价值与1776年、1803年或者1926年的美元价值大不相同。1803年,美国向法国拿破仑政府购买路易斯安那地区只花费了1500万美元;之后美国向沙皇俄国购买阿拉斯加地区的开销还不到1500万美元的一半。当初,这已经是不够强盛的美国掏空家底才能拿得出的巨资了。现在,这两笔开支加到一起只够在曼哈顿买一套顶层公寓。过去的美国总统仅仅让国家债务总数略微上升,这就是因为当年那看起来不多的美元实际上代表了远远超过今天同等金额的美元的购买力。
“指鹿为马”的作用可以变得非常强大。只要有技巧地运用它,它就可以颠倒黑白,让真实显得虚假,让虚假显得真实。例如,2005年,美国国家自然科学基金委员会的负责人貌似坦诚地表示,该组织下一年的财政预算情况相当乐观。他说:“美国国家自然科学基金委员会将在2006财年得到1.32亿美元,这个数字在2005年预算的基础上增加了2.4%。这种适度的增幅使得我们可以承担新的项目、兑现我们不断提出的承诺,并且雇用更多的员工……”乍看上去,1.32亿美元是一个令人兴奋的数字。但是它不过是“成果包装”后的幻象而已。他单纯地将2006年的美元与2005年的美元比较却不去考虑通货膨胀因素,从而得到了预算增多的结论。但2006年的美元不如2005年的美元值钱,因此2006年“增多”了的预算实际上很可能比2005年的预算还要少。如果你以适当的方式来分析这些数据,那么你会发现“增多”后的1.32亿美元预算是一场祸事,事实上,该组织所获得的预算少了3000万美元(以2006年美元价值为基准)。根本就不存在多余的钱去承担新的项目或雇用更多员工。美国国家自然科学基金委员会的负责人显然在撒谎,他把一次挫败说成是胜利。
利用“指鹿为马”的手段,一个训练有素的官员可以把消减说成增长,把上升说成下降,把黑暗说成光明。就像奥威尔在他的著名作品《一九八四》、《动物庄园》里塑造的场景一样,“指鹿为马”可以令人感觉事实和幻象混淆不清。预算总会服从于“数字的骗术”。制订它们的人总会倾向于将费用处理成看起来很少的样子,批评家则试图把同样的数字说成看起来很多的样子。尽管本书中很难将细节表达清楚,我还是觉得有必要提一下,美国政府可以将某些预算(比如社会保障开支)从公共预算中除去,并将它们单独计算。正因为这一点,政客们可以进行“最优选择”,在他们自己觉得合适的时候将这些“额外预算”忽略掉。
润色数据
第三种类型的“成果包装”可以被称为“润色数据”。它是指在得出结论后,先对所有数据进行更改,让它们看起来更加讨人喜欢,再公之于众。这就像小贩们利用小聪明来让自己出售的蔬果看起来更新鲜美味一样,比如把苹果上蜡、抛光可以让它们看起来更新鲜,向西红柿喷气体可以让它们变红,给哈密瓜注射药液可以让它们的不足之处隐藏起来,玩弄数学手段进行“成果包装”的人歪曲数据的本来面貌,暗地里把数据润色得光彩照人。
人们构想了无数种办法来“润色数据”,我们很难把它们全部描述出来,这主要是因为那些挖空心思的“成果包装者”一直在编造新办法。但是,有一些常见的手段还是有必要提一下的。
图表——数据的可视化描述——特别容易受“阿谀奉承”行为的扭曲。进行“成果包装”的人能够随意更换数据的表现形式,胡乱修改图表的样式,以便让数据在最终图表上看上去更加令人印象深刻。
我们不妨分析一下桂格燕麦片的案例。燕麦片本身是一种淡而无味、比较令人没胃口的食品,以至于很难通过广告达到让它一炮而红的效果。由于人们愿意去吃那些据说能让身体更健康的食品,桂格燕麦片广告便以信息轰炸的方式出现,并且不厌其烦地向人们灌输新观念,硬把燕麦片这种易消化的纤维食品说成了天然的“人体内部吸尘器”,宣称它可以把胆固醇从血液中清除出去。厂商用如下示意图来强调这种观点:
会导致误解的燕麦片功能示意图
这张示意图的主旨很清楚:消费者一旦开始食用桂格燕麦片,几周内就可以让血液里的胆固醇浓度奇迹般地下降。然而,如果你仔细观察,你就会发现这张示意图很可能导致误解。我们通常会假设示意图的底端水平线代表着胆固醇含量为零,即细小的燕麦片纤维狼吞虎咽地吃光了血液里的胆固醇。不过,一旦你仔细查看示意图里的竖轴,就会发现其底端刻度并不是0,而是196,这使得数据看上去更能给人留下深刻印象。你不妨看看下图,它更加客观可靠,可以让你轻松明白这一点。
通过改动图轴刻度之类的办法,桂格燕麦片将燕麦片所能带来的影响成倍放大了。在遭到大量投诉以后,桂格燕麦片收回了这张示意图。在利用示意图操纵数据的许多方法中,这种方法最为常见。
“润色数据”的另一种常见形式就是借助“平均值”之类的术语,让数据显得比真实情况大或者小很多。人们往往把“平均值”当成“典型值”,也就是说,如果某公司员工的平均年薪是10万美元,那么人们会认为每个员工的年薪都在10万美元左右。事实上,真相往往不是这样的。
典型胆固醇浓度下降范例
不会导致误解的燕麦片功能示意图
一大堆数字的平均值——更准确地说是算术平均值——有着极为精确的数学含义:把所有数字加起来,然后再除以这些数字的个数。举例来说,有一家共有10个员工的公司,公司里每个员工的年薪都在10万美元左右,你不妨把它们全加起来(100000美元+101000美元+98500美元+99700美元+103200美元+100300美元+99000美元+96800美元+100000美元+101500美元=1000000美元),然后除以员工人数(1000000美元/10人=100000美元/人),即可得出算术平均值。在这个案例里,10万美元的平均年薪可以作为典型年薪的代表。然而,在另一家拥有10个员工的公司里,首席执行官可能挣到999991美元的年薪,而9个实习生只能挣1美元的年薪。算术平均值仍然等于所有工资的和(999991美元+1美元+1美元+1美元+1美元+1美元+1美元+1美元+1美元+1美元=1000000美元)再除以员工人数(1000000美元/10人=100000美元/人)。此时,“平均”年薪仍然是10万美元。然而,这10万美元无论如何也代表不了典型年薪。如果你随机从公司里抽出一个员工,你极有可能发现他只能挣到1美元的年薪。在这个案例里,把“平均”当成“典型”就会导致误解。在这种案例里,使用中位数的概念来代表典型年薪更为恰当。计算中位数的法则是,将数字从低到高按序排列,然后选择其位置在中间的那个。此时,中位数为1,很明显它比平均值更能表达出典型的含义。如果首席执行官吹嘘公司员工的平均年薪为10万美元,并以此来招募新员工,他就是在“润色数据”。新员工在收到第一份工资时定会大为震惊。
每当某个政客宣布退税时,他都会耍花招让退税额看起来更明显。他会公开发表演讲来讨论“平均退税额”——退税额的算术平均值,并且让他所在选区的选民尤其欢欣鼓舞。然而,这样的“平均退税额”通常与典型值相去甚远。
绝大多数人在收到退税邮件时都会感到相当失望。例如,小布什在总统任期内经常拿退税额来说事,每次描述退税政策时都在“润色数据”。在他的第一届总统任期结束时曾经发生过这样一个有代表性的小插曲,他宣布,“我们已经通过了退税计划,今年有1100万位纳税人每人会少缴税1086美元。”(白宫方面很快修改了这个数字,小布什原本是想说1.11亿位纳税人每人会平均少缴税1586美元。)然而,很凑巧的是,这两组数字都会导致误解。大多数美国纳税人所收到的退税额并不是1586美元或者1086美元,他们拿回的钱还不到650美元。情况与前面所提到的蓄意欺骗的首席执行官的案例一样:相对较少的人拿到了巨额退税,这就使得“平均值”显得不够典型。就技术层面来说,白宫方面修正后的乐观数字是对的,但这两组数字实际上都是谎言,它们都被润色过,以便看起来更大。
“最优选择”、“指鹿为马”、“润色数据”所有这些“成果包装者”玩弄的花招儿,都让数字以令人误解的方式展现出来,并被歪曲到虚假的程度。“波将金数字”将无中生有的事物伪造成有意义的数据。“反统计”把数字延伸到超越它们的真实性临界点之外,让或许有效的计量变成谎言。这些手段都是“数字的骗术”,它们都可以帮助肆无忌惮的人将谎言捏造得如同有数字为凭证的事实。而且,由于人类习惯于把数字看成绝对真实的,常常会习惯性地毫无疑问地接纳这些谎言。
“数字的骗术”有着超越我们想象的影响力,是因为我们的思维天生就容易接纳数学谎言。我们大脑受自身工作方式所限,容易忽略数字的不同类型,从而错误理解其含义。因此,我们人类会相信某些荒谬的、令人困惑的数字谎言。
第二章 是真规律,还是伪科学?
消耗的能源越多,人均寿命就越长?
所有这些数据都相互关联。能源消费量、平均寿命、快餐食品消费量、垃圾生产等,富裕的工业化社会拥有的这些数据都是庞大的,贫穷的农业社会拥有的这些数据则是微小的。同时,工业化社会往往拥有现代化医院和高超的医疗水平,因此生活在工业化社会的居民往往寿命更长,婴幼儿更不容易夭折。跟生活在农业社会的居民相比,生活在工业化社会的居民能够制造更多垃圾,在互联网上耗费更多时间,吃更多快餐食品,当然也需要消耗更多能源。所以,这些数据相互关联并不奇怪,它们的大小都依据特定社会的工业化程度而上下波动。但它们之间仅仅是相互关联而已,无公害内衣普及率、婴儿死亡率和电视机拥有率之间并不存在因果关系。霍尔特暗示修建更多发电厂就能提升国民平均寿命,这是愚蠢可笑的,就像说我们只要吃更多快餐食品就能更健康长寿一样可笑。事实上,霍尔特的报告正是一种特殊类型的“数字的骗术”的表现,我将这种“数字的骗术”称为“因果诡辩”。
你中过“因果诡辩”类说辞的圈套吗?
诡辩是一种利用似是而非、貌似有理的方法来作出具有误导性的论证的技巧。“因果诡辩”是特殊类型的诡辩,它在根本不存在因果关系的两类事物之间暗指出因果关系,并以此作出具有误导性的论证。
“因果诡辩”在卫生科学、营养学研究中尤其普遍。你很可能因听信“因果诡辩”类说辞而改变过自己的饮食习惯。例如,许多人因为害怕患上脑癌而不吃含有人造甜味剂阿斯巴甜的食物。这种理念起源于以华盛顿大学的约翰·奥尔尼为首的一群精神病学专家在20世纪90年代中期提出的典型的“因果诡辩”论调。这些专家注意到,当美国纽特公司发明的阿斯巴甜制品引入市场三四年后,脑瘤发病率令人恐惧地上升了。
瞧!研究精神病的专家们立刻推导出了显而易见的结论:阿斯巴甜可致癌!他们将这个大“发现”发表在专业类杂志《神经病理学和实验神经学》上,这篇论文立刻在全球各地成为头条新闻。
但是,只要认真观察这些数据,就能发现这种联系事实上是没有说服力的。的确,阿斯巴甜消费量与脑瘤发病率同时提升了,但许多事物也在这段时期呈现上升趋势,比如说有线电视、索尼随身听、汤姆·克鲁斯的事业。罗纳德·里根在1981年上台执政时,美国的行政开支也戏剧性地与脑瘤发病率同时走高。如果你标出财政赤字——政府比预算多花费的钱,另一种相关性就似乎惊人地清楚了——两者同时呈现上升趋势。数据似乎可以用来说明,财政赤字跟脑瘤发病率之间的关系比跟阿斯巴甜消费量之间的关系还要紧密!尽管如此,但写篇科学论文把财政赤字跟脑瘤发病率关联起来绝对是荒谬可笑的。(当然,这正是我没有把这个大“发现”投稿到《神经病理学和实验神经学》杂志的原因。我感觉如果该杂志总编愿意发表此类文章,那实在是太滑稽了。)
美国财政赤字和脑瘤之间的联系与阿斯巴甜和脑瘤之间的联系同样“稳固”。尽管奥尔尼的“因果诡辩”论调占据了世界各地报纸的头版头条,并且一些人也因此害怕而不再喝无糖苏打饮料了,但是令人尤其难堪的局面还是出现了,因为人们已经强有力地证实了阿斯巴甜不应当为脑瘤发病率的上升负责。
奥尔尼一定知道,脑瘤发病率已经停止上升了(甚至在20世纪90年代初期还略有下降),虽然阿斯巴甜的消费量还在稳步上升。这些令他烦恼的事实并不能阻止他发表那篇论文,也不能阻止反阿斯巴甜人士以那篇论文为依据来游说各国政府禁止使用阿斯巴甜。奥尔尼的做法让一直存在到今天的阿斯巴甜成了神话。
各国议会中会周期性地出现禁止使用阿斯巴甜的议题,其部分原因是阿斯巴甜被认为是致癌物质。(反阿斯巴甜人士也提出了许多不足信的指控,宣称阿斯巴甜可能导致多发性血管硬化、红斑狼疮、癫痫,甚至精神发育迟滞等疾病。他们似乎把缔造并使美国纽特公司发展起来的前任首席执行官描述成小布什总统手下的国防部长拉姆斯菲尔德了。)2005年,一位英国下议院议员试图让“这种致癌物质完全在英国食物和饮料市场上销声匿迹”。美国新墨西哥州的一位官方代表在2006年就试图禁止阿斯巴甜,夏威夷州的一位官方代表则在2009年提出了类似的要求。反阿斯巴甜的斗争完全基于错误的观念,这极有可能会延续很多年。奥尔尼的“因果诡辩”论调所传达出的观念需经过好几十年才会消亡。当然,无法证明某种事物有害并不等同于证明该事物安全,而且奥尔尼提供了其他证据,例如利用小白鼠做实验,来支撑自己的观点。尽管如此,我们不妨赌一把,相信阿斯巴甜以及手机一类的其他许多被误认为脑瘤的致病因子的事物是无害的,接下来叙述的理由在某种程度上可以证明。
问题依然存在。如果不是纽特公司,那么到底谁该为脑瘤发病率的上升负责呢?没人知道。有人推测,这仅仅是一种推测,在20世纪80年代中期,美国医院可以更好地确诊脑瘤了。1984年,整个美国只有108台磁共振成像设备。这些机器擅长在大脑一类的软组织中寻找问题。1985年,这种设备的台数就增加了两倍以上,总数变为371台。美国政府同意在医疗保险制度中广泛使用磁共振成像技术。新的诊断工具很可能让医生们突然发现更多脑瘤患者。在进行不同年代的物价比较时,注意美元价值的变化是很重要的;在分析不同年代的发病趋势时,注意医生诊断手段的进步也是很重要的。(公正地说,奥尔尼试图这样做过,但他的分析还是没有说服力。)
可以将诊断标准的改变看成一种趋势。例如,现在的医生比20年前甚至10年前的医生更容易诊断出孤独症患者。由于临床医生已经对这种疾病认识得更加深刻,而且诊断标准从1980年以来改变不少,我们就很难弄清楚到底是孤独症发病率真提高了,还是医生们为了诊断更容易而采用孤独症这一名称来描述多年前的好几种疾病。在2002年的一份科研报告中,研究者发现加利福尼亚的孤独症患者确诊人数在7年内出现了3次上升峰值。然而,与此同时,笼统的“智力缺陷”确诊人数却一直在下降。这暗示着孤独症确诊人数的提升多半是由医生对这种疾病的定性、命名造成的,而不是由出生的孩子们普遍出现了变化造成的。我们没办法就此向合适的陪审团提起诉讼,从而得到具有法律意义的确凿认定,但孤独症流行的现象很明显从未发生过。
我们这样认识问题就足够了。一旦人们认为病症流行开来,他们就会找出某些罪魁祸首并归咎于它们。“因果诡辩”是人们的基本武器。由于感觉孤独症流行,许多人把此归咎于大力推广的疫苗,比如麻疹、腮腺炎、风疹三联疫苗或者部分疫苗中含有水银的防腐剂。曾担任《花花公子》模特的詹妮·麦卡锡等活动家展开了严酷的“因果诡辩”式的言论攻击,以至于家长们开始认真反思自己是否应该让孩子从小注射疫苗。这些反疫苗活动家提出了一种关联性暗示:孩子在注册完疫苗后就会变得孤僻,甚至患上孤独症。然而,这种捏造的因果关系并不存在,事实上,存在着大量证明与之相反的情况。例如,早在1988年麻疹、腮腺炎、风疹三联疫苗引入前,孤独症患者的确诊人数就提升了,这表明注射三联疫苗引发孤独症的说法站不住脚。疫苗防腐剂会导致孤独症的说法也被推翻了,因为丹麦在1992年逐步淘汰了疫苗防腐剂,但孤独症患者的确诊人数仍在稳步增加。把孤独症归咎于注射疫苗,这种关联正是“因果诡辩”。
A和B,哪个是因,哪个是果?
即使吸烟确实造成了巨大的公共健康问题,它也不会导致我们的孩子沦为吸毒者。那些容易导致吸毒的人格特征——勇于冒险、对社交压力敏感——也很可能正是导致吸烟的人格特征。但是,吸烟绝对不是日后吸食烈性毒品的原因,只不过吸烟、吸食烈性毒品或许都是由同样的原因所导致的而已。然而,卡利法诺却非常乐意在逻辑上跳跃一步,宣称吸烟将导致孩子们最终跌入吸毒的深渊,而且把这种“因果诡辩”得出的结论作为关键论据来急切地要求征收很重的烟草税。
并非巧合的是,美国民主党人士也支持征收这种很重的烟草税。烟草厂商为美国共和党候选人赞助了500万美元以上的巨资(比它们为美国民主党候选人赞助的金额高很多),因此制裁烟草厂商对美国民主党有利,对美国共和党不利。“吸烟导致吸毒”的“因果诡辩”固然荒谬,但美国共和党人为反驳而提出的类似荒谬说法显得更加愚蠢,他们竟然宣称吸烟是有益健康的。“科学家和医生对吸烟的看法并不是一致的。到底它让人上瘾还是不让人上瘾,这根本说不清!”美国共和党参议员、总统候选人鲍勃·道尔在1996年发表了这样的言论。我们不妨认为道尔在烟草问题上的立场是堂吉诃德式的,他就像堂吉诃德大战风车一样徒劳无益地说着废话。他在发表上述言论之前还说过这样的话:“我们知道抽烟对孩子不好,但是其他很多东西也不好,比如有人说牛奶就不好。”美国民主党人采用一切手段来打击、削弱支持其竞争对手的资金赞助者,而不管这些攻击背后的逻辑依据到底合不合理。当然,美国共和党人也不会让客观事实妨碍他们攻击对手的举动。)尽管“吸烟导致吸毒”的论调完全是“数字的骗术”,它仍然成了有效的政治手段。
“因果诡辩”源自我们希望将每个结果以某种方式归结到某个原因的本能。无论何时,当我们看到两个事物以某种方式相关联,我们的大脑就会跳跃式地得出结论,认为必然是其中之一导致了另一个。但事实通常不是这样的。有时,我们误将结果当成原因,将原因当成结果。有时,原因隐藏在事物背后,我们无法立刻感知到。有时,原因根本就不存在,这一点或许是人们绞尽脑汁也难以理解的。有时事件先后发生,但根本不存在明显的因果关系,完全是随机的、偶然的。随机,正是人类需要花漫长时间来了解的概念。
关联诡辩:降低税率就会带来更多税收
我们的大脑天生就厌恶随机这个概念。即使当一大堆数据、一张图完全处于混沌状态时,即使当潜在秩序根本就找不到时,我们仍然会试图建立一种结构、规律,以便利用它来理解我们的研究对象。我们看到繁星在天空中随意分布闪耀着,于是将它们分组归纳成星座。我们会把墨西哥玉米饼上的纹路看成圣母玛利亚的画像或者在肉桂饼上看到的特蕾莎修女的头像。(这块“修女饼”是2005年在田纳西州被发现的,两年后在西雅图被短暂展示过,但在本书写作期间,它又被拿到其他地方去了。)我们被那种试图在混沌中找出秩序的思维捉弄了。
赌场很赚钱,是因为庄家利用了赌博者大脑的这一缺陷。这正是赌博者一直赌下去的原因。如果你仔细观察一下紧张的赌局,你总是会看到有人陷入“幸运轮回”之中——一轮下来他赢了一些,因为他赢了,他的大脑就似乎弄懂了规律,认为这种好运会继续下去,于是他继续赌博。你还会看到那些输家也在继续赌博。输家的大脑思考的是与此不同的规律——输了这么多轮总该转运了。这些可怜的傻瓜继续赌博是因为害怕错过翻本的机会。我们的思维急于接受任何有关好运或坏运的暂时状态,认为它相当重要,认为它预示着未来的规律并让我们有机可乘。不幸的是,赌博机和骰子的随机性意味着这些其实都不是规律。骰子的每一次转动,赌博机的每一次洗牌都会得出新的结果,每次得出的结果与之前得出的结果之间没有任何关联。这便是随机的含义,其结果之间没有任何关联,也不存在任何规律。然而,我们的大脑直接拒绝接受这个事实。这便产生了“关联诡辩”,即在混沌的随机事物中坚持寻找规律,在不存在规律的时候臆造规律。
“关联诡辩”在我们身上有着超乎寻常的影响力,它甚至能够让非常聪明的人们去相信某些愚蠢的事情。2005年,某些人类学家在《自然》杂志——它或许算得上是全世界最负盛名的学术类专业杂志——发表了一份研究报告。这份报告足以展现出“关联诡辩”是如何让最荒谬的想法变得值得信赖的。它是一份对2004年奥运会的摔跤、拳击和跆拳道等项目的比赛结果进行分析的报告。文章提到,一位运动员总是穿红色比赛服,而另一位运动员总是穿蓝色比赛服。在比赛当中,穿红色比赛服的运动员大约在55%的回合中会获胜,并最终击败穿蓝色比赛服的竞争对手。那么,结论是什么呢?穿红色比赛服有助于运动员获胜。
只要思索片刻,你就能想明白,这种推理是相当荒谬的。选择红色或者蓝色运动服怎么会对运动员的竞技水平造成如此明显的影响呢?但这份研究报告的作者们成功地编写了一个“井井有条”的故事,让这个“发现”似乎足够可信,达到了可在最好的科学杂志上发表的地步。他们还引用了另一份宣称实验人员为斑胸草雀套上红带子就可以让它占据种群“领导”地位的报告。如果在鸟群中能发生这样的事情,那么为什么在人群中不会发生类似的事情呢?杂志的审阅者认可了这种观点,这份报告得以发表,于是全世界的媒体都将这个“重大发现”添油加醋地传播给大众。
事实上,这份研究报告的作者们只不过是得到了一大堆随机数据,然后从这些随机事件中生硬地构建出所谓的规律而已。穿红色比赛服的运动员比穿蓝色比赛服的运动员赢得了更多场次的比赛,这不过是碰巧而已,而这些人类学家却专门写了份研究报告,把巧合阐述成必然。(如果他们发现穿蓝色比赛服的胜利者比穿红色比赛服的胜利者多,他们也可以利用另一种鸟——北美洲紫燕来说事,在那种鸟群里,羽毛带蓝色是占据种群“领导”地位的标志。)尽管如此,这些人得到的“研究结果”很明显就是“关联诡辩”的产物。如果这些人类学家花一些时间去检验其他几届奥运会的情况,毫无疑问他们会发现这貌似有理的伪规律失效了。事实就是如此,2008年奥运会的赛况就足以表明穿红色比赛服并没有任何优势可言;如果我们仔细检查与所谓的规律有关的那几个项目,你会发现穿红色比赛服的运动员甚至略微处于劣势。穿蓝色比赛服的运动员比穿红色比赛服的运动员赢得了更多场次的比赛,这种情况在自由式摔跤项目中尤其明显,我们完全可以归纳出大量数据来证明穿红色比赛服的“优势”在无形中消失了。每个失效的预测都可以充分证明某种规律纯粹是骗人的。每种规律都允许大家借此引申出预测。如果你真的相信穿红色比赛服比穿蓝色比赛服更占优势,你就可以预测通常情况下更常穿红色比赛服的运动员会赢得赛事,你甚至能够利用这个预测去赌博。可是,虚假的规律不具备预测力,它似乎能提供充足的依据来帮助人们理解过去的数据,但用它来验证新数据必然会失效。在本书中你将多次看到这类事例。对,这本身就是一种规律。
如果你从大量数据中随机收集了一部分,然后仔细研究它们,你就会发现某种形式的规律。如果你足够聪明,那么你会把规律介绍给其他人,让他们也来检验它。例如,你可以随机收集一些数据然后作出标记,你得到的图形可能看起来像炸弹爆炸现场那样一片混乱,根本找不到任何顺序。尽管如此,如果你在整片混乱的数据上划上一个圈,那么你就能够诱导别人和你一起去理解根本不存在的规律。如果你做得足够令人信服,你甚至能把这根本不存在的规律写下来并发表到学术类专业杂志上。上图就曾出现在《自然》杂志上,并被用来证明腰围大的女人更容易生男孩。这种说法原本不过是笑料而已,但这样一来人们似乎当真了。
在很多数据中画线是一种非常有用的方法,它可以用来辅助人们解释这些数据。线就代表着次序,它意味着有人已经从图中这些天然、随意、混乱的点中找出了规律。即使我们的眼睛暂时不能直接看到这些规律,线也给予了我们可以看到规律的信心,即使规律根本就不存在时也是如此。
例如,《华尔街时报》曾经在2007年刊载了一篇社论,该文章猛烈抨击美国政府征收过高的企业经营税的行为,但自相矛盾的是,该文章居然宣称降低税率会让税收总额提升。这种说法是违反直觉的。如果政府希望从公民中征收更多税,那么它肯定会提高税率,而不会降低税率。尽管如此,这种“降低税率会带来更多税收”的断言却是里根政府经济政策的核心(这曾被小布什称为“巫术经济学”),而且已经被很多保守派人士接受了。这种想法可以用图形直观地描绘出来,其图形就是以经济学家阿瑟·拉弗的名字命名的“拉弗曲线”。其含义是,当政府提高税率时,税收总额会随之增加,并达到最大值,然后迅速下降直到0。
当《华尔街日报》的编辑们将税率和对应的税收数字标记出来时,他们在数据中清晰地看到了一条拉弗曲线。
很明显,《华尔街日报》的编辑们依据数据画出了一条稀奇古怪的曲线,难道这就是里根经济政策所预示的吗?从这个特定的数据组合中画出那样一条升降幅度明显的拉弗曲线,却没有任何值得信服的理由。直接从左到右划一条直线或许更适合这些数据。但是,通过利用一个局外国家——挪威——的数据来捏造这条曲线的方式,编辑们耍弄着“关联诡辩”的花招儿,让阿瑟·拉弗显得神机妙算,尽管这些数据本来会让他露怯出丑。
胡乱回归分析:谁会是下一届美国总统?
即使当数据似乎与画线相吻合时,当能够“归纳”出数据特征的规律呼之欲出时,“数字的骗术”的风险也无处不在。因为就算统计学家、经济学家或科学家能够发现数据组合之间存在的真实关系,也不能确保这种关系有任何实际意义。数据图中的某条线、某个方程式、某个公式也许能描绘出存在于这大量数据中的紧密联系,然而这一切也许没有任何实用价值。
发布于2004年《自然》杂志上的一份由动物学家、地理学家和公共卫生专家们联合署名的研究报告就是一个极具代表性的范例。这群知名的科学家分析了田径运动员们在历届奥运会100米短跑项目中的比赛成绩,而且找到了一些显著的“规律”。男短跑运动员们越跑越快,他们花在100米短跑项目上的时间不断变短,以至于你可以画出一条下降趋势明显的直线(这也正是科学家们所干的事情)。同样,女短跑运动员们也越跑越快,她们的成绩也可以用近似的线条很好地描绘出来。
下图似乎可以完美地解释这些成绩的数据。它们绝不偏离画出的直线,因此科学家们表现出了充足的信心,坚信这两条线可以描绘出男女运动员们在100米短跑项目中的成绩提高趋势,并认为这种趋势甚至会延续到遥远的未来。而且,如果延伸这两条线,你会发现它们将相交——女运动员们的成绩赶上然后超过男运动员们的成绩——于2156年。最终结论是,女短跑运动员将在下世纪中叶跑得比男短跑运动员还快。(为了给自己的观点留下足够的余地,科学家们进行了复杂的计算机模拟操作,并指出女短跑运动员开始跑得比男短跑运动员快的那个“纪念日”将出现在2064~2788年。)毕竟,画出的这两条线看起来与实际数据相吻合,而且它们相交就代表了女短跑运动员的成绩超过男短跑运动员。
然而,这样画线实际上是荒谬的。继续将线延长下去,其荒谬本质就显而易见了。根据目前这两条线的走势,女短跑运动员在2224年左右就能在7秒之内跑完100米——其速度几乎达到了每小时32英里。他们耍弄花言巧语的手段,或许能把这说成是可能的。但这两条线还可以延伸。如果你一直延长它们,就可以发现再过150年女短跑运动员速度能达到每小时60英里。等到2600年,女短跑运动员的短跑速度居然会超过音速。之后不久,她们的速度甚至会赶超光速。如果当真如此,那么时光或许会倒流,她们会在比赛开始前就赢得比赛。所以,这两条线绝对不可能如实展示出未来的数据走势,它们不过是对真实事物的错误阐述而已。
尽管这两条线在最初阶段似乎非常值得信赖,但它们还是没有正确地反映数据中包含的真实规律。跟男短跑运动员相比,女短跑运动员更会因求胜心切而在很短时间内全力以赴地比赛,所以女短跑运动员的比赛成绩比男短跑运动员的提升得快。当短跑运动员逐渐成熟以后,这种提升会越来越慢,增长线会慢慢上升,趋近于最高水平。最终,男女短跑运动员都达到了各自的生理极限,这种提升就完全停止了,增长线也变为水平线。
这两条线永远不会相交,更确切地说,女短跑运动员的最佳成绩很可能会在很多年内相当接近于男短跑运动员的最佳成绩,但女短跑运动员永远超不过男短跑运动员。这是必然的,那样的结果不可能沿直线无限延伸下去,自然法则宣告了这一点。
仅仅依靠自然法则并不能阻止科学家们鼓吹他们的虚假预测结论,也不能阻止他们抛出“女短跑运动员将在2156年超过男短跑运动员”的“预言”占据报纸的头版头条,更不能阻止《自然》杂志的编辑接纳并发表这份研究报告。《自然》杂志的编辑本应当拥有辨别真伪的能力,单凭“女短跑运动员的奔跑速度会在几百年后超过音速”这一点就可以看出这种说法的荒谬之处,但他们却轻易被愚弄了。事实上,该杂志早就在同样类型的愚蠢预测上栽过跟头了。
两位生理学家在1992年分析了男女长跑运动员的比赛成绩,然后兴致勃勃却毫无意义地画出曲线。他们的结论是,女马拉松运动员的成绩会在1998年超过男马拉松运动员,届时她们的最佳成绩是2小时1分59秒。(正是这样,他们居然预测出了0.01秒数量级的精确时间,很明显这是一种“反统计”。)后来的实际情况当然与之大相径庭。在2000年奥运会马拉松赛场上,获得金牌的女马拉松运动员的成绩不过是2小时23分14秒而已,而她的竞争对手——获得金牌的男马拉松运动员轻轻松松地以领先13分钟的优势击败了她。尽管《自然》杂志上刊载了如此大胆的预测报告,而且该预测还被《纽约时报》等多家媒体轻信而转载了,但事实上,女马拉松运动员们跑完全程的时间普遍比男马拉松运动员们落后15分钟左右,而且就连男马拉松运动员的世界纪录也还没有达到2小时1分59秒。
画一条线或者建立一个方程或公式,并使得它似乎描述了存在于数集之中的规律,这样做相当容易,但没有任何实际价值。这些捏造出的虚假规律看起来令人信服,它们用数学语言来伪装自己,但是,当人们真的想运用它们来预测现实(利用这些规律来表明宇宙中出现的新鲜事物)时,它们就完全无效了。尽管如此,科学家、经济学家、公共卫生专家以及一切有权使用入门级统计软件的人,都以令人难以置信的速度捏造着毫无意义的线、方程式和公式。这又是一种特殊类型的“数字的骗术”——“胡乱回归分析”。
回归分析是一种数学工具,人们可以运用它推导出线、方程式和公式来恰当地解释数集。这是一种特别强有力的技能,可以迅速在给定的数集中总结出规律。然而,如果人们胡乱使用它,所得结果就可能毫无意义,就像疯子嘟囔时的胡言乱语。上文中提到了两个宣称女运动员会超过男运动员的预测,它们就是“胡乱回归分析”的典型案例,因为科学家们从数集中找出来的规律根本就是荒谬的,这些“规律”直接可以推导出“运动员最终的奔跑速度会超过光速以至于时光倒流”的可笑结论,我们凭此就能一眼看穿这些“规律”的虚假性。不过,“胡乱回归分析”所导致的问题通常是更加隐晦且难以看穿的。
在20世纪80年代,经济学家们一窝蜂地努力研究着来自耶鲁大学的一个科研话题。一位名叫雷·费尔的年轻经济学家根据1912~1976年的经济数据作了一项回归分析,然后得出了一个如果成立就将轰动一时的方程式,该方程式可以提前预测谁会在接下来的总统竞选中获胜。你仅仅需要在方程式中输入几个经济要素——通货膨胀率、国内生产总值增长率等。瞧!下一位总统就计算出来啦。那么,战争、国债、外交政策呢?这些几乎都是无关紧要的,经济形势完全决定了每次总统竞选的胜利者。经济学家们肯定会喜欢上这个方程式。
1980年,费尔的方程式预测,里根会在二选一的角逐中以55.4%的得票率战胜卡特。后来,里根的确拿到了55.3%的选票。全世界经济学家都为这个方程式的精准程度而激动万分。1984年,费尔预测里根会大胜蒙代尔而连任。他说对了。1988年,这个方程式显示老布什会轻松战胜杜卡基斯。老布什做到了。经济学家们向神机妙算的费尔致敬,费尔则得意洋洋地吹嘘着他的预测的准确性。他的方程式被视为令人惊叹的、准确的经济预测的标准范式,并在经济学专业大一新生的课堂上向学生传授。然而,费尔在1992年宣称,老布什会以57.2%的得票率击败新晋候选人克林顿,凭借公众那势不可当的支持回到白宫进入他的第二个总统任期。
嗤嗤……你或许可以想象一下,在最终选举结果揭晓后,经济学家们那膨胀的自负是如何被击得粉碎的。费尔被迫低调地修改了他的方程式,以便“纠正”他之前犯下的错误。在1996年美国大选前,他又勇敢地在一份报纸上公布了下一个预测:“按照方程式推导出的基本结论是,美国共和党人会在1996年大选中略占优势。”噢,他又错了。美国民主党人克林顿完胜美国共和党人多尔,他的领先优势跟1980年里根战胜卡特时一样明显。
真正的问题是,费尔的方程式就是典型的“胡乱回归分析”的产物。它是一个精心制作的数学模型,并用以表达费尔从数据中找到的“规律”,但这个“规律”本身就是毫无意义的。(费尔的成功可归结为一个常识性的结论,那就是在任总统会因良好的经济状况而受益。)方程式可以完美地解释过去的竞选结果,但用它来预测未来的竞选结果显然是不可能的,这便是虚假规律的典型特征。几乎所有的竞选预测都有着同样的问题。经济学家和其他领域的专家们年复一年地修正着他们那不靠谱的数学模型,并据此作出多数情况下都错得离谱的预测。他们甚至在一个缺乏新闻素材的日子里把预测结果发表到了一份赫赫有名的报纸的第二版上,题为“一切都还没有结束”。一位经济学家在2000年某一期的《华盛顿邮报》的第一版上发表文章,预测戈尔会在二选一的角逐中赢得56.2%的选票。当然,他又贻笑大方了。我受够了这些预测家的喧嚣,在《华盛顿邮报》上发表了一篇文章,使用令人费解的4组Knödel数列来预测美国总统竞选的结果,其结论能够与1952年以来的历次竞选结果相符合。认为某组数列可以决定在总统竞选中的获胜者,这种想法着实很荒谬可笑,不过并不比经济学家们采用“胡乱回归分析”所得到的预测结论更荒谬可笑和离谱。
形形色色的数字谎言
利用数据制造数学谎言,办法有很多种;利用有效的计量行为来耍弄“数字的骗术”手段,办法同样有很多。“因果诡辩”可以歪曲两个数集之间的关系。“关联诡辩”可以在不存在规律的情况下捏造出规律。“胡乱回归分析”使用线、方程式或公式等数学语言给歪理邪说提供伪装,让最愚蠢的想法显得可信。
第三章 人为的风险炒作
登月任务的风险
难以估量的风险
风险是难以捉摸的。我们很不善于预测它。我们花费时间去担心脑子里预演了无数遍但不常见的事故(被流星砸中、儿童被绑架和被鲨鱼吞噬),却往往忽略了那些我们真正应该担心和想办法避免的、更平常却更可能让我们减少寿命的风险(中风、心脏病和糖尿病)。我们花费金钱去追求子虚乌有的彩票中奖、挖到富矿之类的一夜暴富的美梦,却不注意及时偿还信用卡账单、严肃对待我们即将破产的可能性。我们极度害怕死于空难,却觉得在高速路上边开快车边打电话是无关紧要的。哪些行为确实危险,哪些行为不太危险,对此我们的确心中无数。
在20世纪80年代,经济学家丹尼尔·卡尼曼(诺贝尔经济学奖得主)和阿莫斯·特沃斯基展示了人类面临风险会失去理性到怎样的程度。他们向实验对象介绍了测试场景,要求实验对象在该场景中作出艰难的选择。
想象一下,美国政府准备应对一场源于亚洲的罕见病毒引发的爆发性流行病,这次流行病预计会导致600人死亡。两种与这场瘟疫作斗争的可选方案已被提出。
这两种方案有非常大的差别。其一是保守的,选择它意味着有相当大的可能性拯救少量病人;其二是冒险的,选择它意味着有相当小的可能性拯救大量病人。
实验对象正是在这两种方案中作出选择。不过,这里出现了转折。卡尼曼和特沃斯基向两组互不接触的实验对象介绍了同样的两种方案,但使用了略微不同的措辞。对第一组实验对象,措辞强调了从瘟疫中挽救病人。对第二组实验对象,措辞详细描述了瘟疫中的死亡者而不是幸存者。
两类措辞之间的区别不过是表面上的。从数字语言来分析,两组实验对象感受到的实验场景是同样的。如果人类是完全理性的生物,第一组实验对象和第二组实验对象作出的选择应该是一样的。然而卡尼曼和特沃斯基发现,不同的措辞导致结果出现了极大的差异。措辞,而不是数字,决定了人们的表现。当措辞强调幸存者时,实验对象们压倒性地——72%支持和28%反对——忽略了冒险的方案,选择支持保守的做法,让少量病人得以相当大的可能性获救,而让其他人去死。当措辞强调死亡者时,实验对象对冒险的方案突然不反感了,他们压倒性地——72%支持和28%反对——支持孤注一掷的做法来试图拯救大量病人。在两种方案中,风险实际上是一样的,但受限于糟糕的风险辨别力的人们并不能弄明白这一点。实验对象并不是基于理性判断来作出决定的,而是基于权威人士怎样向他们描述风险来作出决定的。
对风险的商业化炒作
措辞上的小小变化可以轻易让巨大的风险变得似乎可以承受,也可以轻易让微不足道的风险变得似乎可怕无比。因此,我们很容易被操控。当有人在掩饰或夸大风险时,我们很不容易发觉。我们都是“风险炒作”的牺牲品。
风险炒作或许比其他各种类型“数字的骗术”都更加严重,因为它意味着要做一笔大生意。在美国国家航空航天局的案例中,它意味着亿万美元的投资。蓄意说低发射航天飞机的风险的做法,使得美国国家航空航天局从国会获得了拨款来实施这项灾难性的计划,一项为了明显微不足道的进步而葬送了14位航天员的计划。而且其他企业正跃跃欲试,想效仿美国国家航空航天局。可是,航天飞行不过是全景中微不足道的一个片段。我们的经济始终以风险为重点,因为风险与金钱总是伴随着的。有专门的行业致力于管控和预测风险,企业已经测算出如何通过衡量、包装、分割和转嫁风险来获得暴利。而且,哪里能赚钱,哪里就存在着风险炒作。如果你关注当前的金融危机的核心层面的问题,你就会看到风险炒作无处不在。风险炒作正在损害我们的经济健康,并且通过这种方式让一小撮儿犯罪分子大发横财。
想让人们了解风险炒作的本质,美国国家航空航天局的案例是不二选择。航空业巨头理查德·布兰森致力于忽悠私人投资者,正如美国国家航空航天局忽悠美国国会那样。布兰森管控着一家民营航天企业“维珍银河”,该企业据称在创办的头5年就计划将大约3000名旅客安全送到太空。该企业的官方网站吹嘘说:“本公司相当了解如何管理和运作复杂的运输组织……例如,维珍太平洋航空公司和维珍列车公司都拥有每年运送数以百万计旅客的经验,而且保持着优秀的安全纪录。”如果你相信他们,那么太空旅行的风险就跟乘坐私人飞机去兜风一样了。
真是胡说八道。把太空旅行和乘飞机、乘火车旅行相提并论,“维珍银河”事实上蓄意说低了你钻进火箭后需要承担的巨大风险。把足够的能源塞进气缸以便将你送到太空,这是非常危险的事情。从太空坠落下来也同样危险,你会获得巨大的重力势能,而且必须将它以热量的形式驱散掉。在整段航天历史中,大约100次载人火箭就会有1次导致乘客罹难,而且这种风险似乎在短期内不会降低。
1%的可能性或许看起来很小,尤其因为目前只有极少数幸运儿有机会成为航天员。但是,就风险本身而言,它高得可怕。不妨比较一下,如果当前美国民航客机的失事概率达到1%,那么每天大约会有275架美国民航客机失事并导致约2万人遇难。一旦每次你乘坐飞机都要面临1%的死亡可能性,整个航空产业就会遭受灭顶之灾;同样,1%的死亡可能性会让任何类型的交通工具显得风险过高而不值得开展商业运营。如果事故发生的可能性达到1%,按照“维珍银河”公司预计的每周一班的发射计划,那么他们连续运营两年并且不出现“挑战者号”那样机毁人亡的悲剧的可能性仅有1/3。大体而言,他们描绘的将3 000人平安送入太空并返回的(假想)场景成真的可能性仅有0.5%。他们的旅客几乎死定了,这事迟早会发生。即使这家公司在无法避免的调查、难堪中继续营业,它也只能挺上几个月,然后就会遭遇下一次空难。
依我看来,布兰森在蓄意说低风险,这帮助他忽悠到了超过250位旅客预交的3000万美元太空旅行费用。他还用自己的幻想说服了政客和公众。2005年,新墨西哥州的政客们开始花费数以千万计的美元,而且州长还承诺最终拨付2.25亿美元,来建设一个太空船发射降落场。新墨西哥州的两个县甚至制订了一项新的营业税政策来资助这项工程。布兰森这类精明的商人很可能知道,蓄意说低风险将会带来丰厚的收益。事实上,主要有两种方法可用来耍弄风险炒作手腕以获得资金和收益。跟美国国家航空航天局和布兰森一样,你也可以蓄意说低风险,让某些事物看上去更安全一些。反之,你可以把某些平凡的事物的风险夸大,让它在公众心目中显得很严重。
耸人听闻的媒体报道
夸大风险以及由此导致的恐惧是威力十足的,这种做法不仅仅对新闻记者们有用。政客们早就知道了公众会在恐慌时期更倾向于支持他们的领袖,这足以刺激他们把威胁描绘得更加令人害怕。按照某些批评家的说法,美国国土安全部警报系统——在“9·11”恐怖袭击事件后极短时间内创立的使用颜色编号来区分的五级恐怖预警系统——只不过是行政部门用来操控人们对恐怖袭击的害怕程度的一种制度化方式。尽管难以预测小布什政府这样做的真实动机,还是有一些迹象表明这个系统正被操控以实现某些政治意图。首先,自“9·11”恐怖袭击事件以来,美国的警报等级从未降低到第三等级“黄色”以下,而“黄色”代表的恐怖袭击等级为“显著”。“显著”意味着“高于日常”,那么,这相当于宣告美国人每天都处于“高于日常”的恐怖袭击风险中,这种宣告完全是荒谬的。“高于日常”的风险不可能一直持续下去,就像一个班级里的学生不可能都考到了班级平均水平以上的分数。其次,有迹象表明,政治意图有时会在警报级别升降中起到一定的作用。例如,2003年,在入侵伊拉克之前,美国安全部门容许将警报级别从第二级“橙”降到第三极“黄”,这并不是因为风险程度本身发生了什么变化,而是因为他们可以在临开战前再次将警报级别调升起来。最终,有证据表明这的确起到了令人不安的效果,即便人们本应该对此无动于衷。2004年的一项研究表明,每当政府发布恐怖警报,总统的支持率就会突然上升,恐吓公众的好处显而易见。并不只是美国在利用恐怖袭击风险耍弄风险炒作手腕,2009年英国也将本国五级恐怖预警系统的警报级别从第二级“严重”降到第三级“基本”。该系统从2006年公布以来,这还是第一次将警报级别降得那么低。
金融世界中的投机风险
尽管如此,如果你想大发横财,就应该蓄意说低风险,而不应夸大风险,这样才能赚钱。理查德·布兰森数以百万计的美元财富和美国国家航空航天局亿万美元财富不过是沧海一粟。有悟性的商人早就弄明白了如何利用风险炒作的手段来让自己致富,而且他们的罪恶已经深重到把世界经济拖向灾难深渊的地步。一场前所未有的全球金融危机正是2007年的风险炒作引发的。
在金融界,风险和收益是一枚硬币的两面。安全的投资——几乎没有风险的投资——只能为投资者挣回极少的财富。为了获得丰厚的收益,你必须乐于承担重大的风险,你必须接受收益可能永远无法兑现或血本无归的事实。成功的投资者并不是每一次下注都会得到回报的人,巴菲特经常会在预估的风险无法排除时亏本。成功的投资者是那些有本事从自己愿意承担的风险中挤出最大收益的人。他们是能够将投资回报扩大到最大的同时将承担的风险缩到最小的人。相反,如果你想要人们给你钱或投资给你,就必须给他们最大的回报和最小的风险。你展示出的风险越小,人们愿意给你的钱就越多。这就是风险炒作手段能够用来做大生意的原因。如果你可以蓄意降低你生意中的风险,如果你能够隐瞒、逃避风险或者转嫁风险,你就可以挣大钱。
在20世纪90年代末,能源公司安然拥有滚滚而来的财源。安然的多位中高层职员都是百万富翁,其创始人肯·莱拥有4亿美元的身家。安然为投资者赚取巨额利润,很快就成为华尔街金融界人士的宠儿。1995年,《财富》杂志将安然评选为“美国最具创新精神的公司”。而且安然在1996~2000年一直蝉联着这项荣誉。但这一切浮华只不过是风险炒作的结果。在某种程度上,莱和他的同伙们依靠将风险四处转移、试图遮挡外部观察的方式来挣钱。他们创办了许多家空壳公司(其中许多公司的名字来自《星球大战》中的外星人角色的名字)来隐瞒其投资项目的真实风险。这些公司承担了安然的大部分债务,并帮助安然逃避法规监管。结果,当安然事实上已经欠下亿万美元债务且已经步了很多信誉不好、濒临破产的公司的后尘时,它表面上看起来运行状况依然良好。当风险炒作最终曝光时,投资者纷纷撤资,同时安然公司的股票一再暴跌,让很多根本不知道投资安然要冒巨大风险的投资者血本无归。本来应该有多种审查措施来避免这种不正当行为出现的。安然一直接受着安达信会计事务所这家外部企业的审计,安然原本期望这家事务所能够确保安然的基本财务状况看起来没有任何问题,但这家会计事务所作出了严重违背公众利益的行为,毕竟它是从它的审计对象那里领取报酬的。因此,这家会计事务所必须对安然公司风险炒作的行为熟视无睹,否则它就要面对失去一家重要客户的可能。早在安然丑闻爆发之前,类似的情况就在一次银行业丑闻中出现过,而且让纳税人蒙受了数十亿美元的损失。这个典型案例便是发生在得克萨斯州的西尔弗拉多银行案。根据一篇报道的描述,“1985年,安永会计师事务所在审计西尔弗拉多银行时要求该企业公布因贷款呆账导致的2000万美元亏损。西尔弗拉多银行的管理人员对这个结果相当不满,于是他们解除了与安永会计师事务所的合作,另外寻觅了一家愿意帮助银行把账做得很好看的会计师事务所——永道会计师事务所。1986年,西尔弗拉多银行对外宣称赢利1500万美元,其管理人员分到了270万美元的红利。一年半以后,这家银行破产了,政府花费了大约1亿美元来给它善后。”
如果你以足够聪明的方式运作资本,就能规避风险挣到大额收益。伯纳德·麦道夫在巅峰时期拥有8亿美元的身家,他采取借新款偿还旧债的传销方法成功地隐瞒了其投资计划的真实风险(而且他依靠这种窃取委托人财富的方式致富了)。通过这种方法,麦道夫成功蒙骗委托人达10年之久,直到股市暴跌导致他空无一物的金库被曝光。为了让自己发财,麦道夫让委托人损失了500亿美元,最终换来了150年有期徒刑。
世上还有很多类似莱和麦道夫的人,他们通过隐藏和转移风险的办法蒙骗投资者而获利。当他们的犯罪行为突然败露时,这些罪犯肯定会被媒体广泛报道,因为他们已经被示众、审判了。然而,就算这些欺诈罪行看起来如此严重,它们也根本无法与真正蚕食着我们的核心经济体系的风险炒作相比。在“数字的骗术”竞赛中,莱和麦道夫不过是业余级别的选手而已。
如出一辙的火灾保险和次级抵押贷款
假如你想利用风险赚钱,那么有很多巧妙的办法可以办到。风险不仅可以隐藏、转移,还能分摊、转让。保险公司就是一个风险的“回收站”;只需支付适当的费用,你就可以让保险公司帮你分摊风险。担心自家住宅失火?担心开车时不慎撞到人?担心被起诉?只要有了足够的钱,你就可以相信保险公司会给予你足够的呵护。这是一个赚钱的行业,只要你对自己要面临的风险已经有了足够的理解。
例如,假设你现在需要销售火灾保险单。你需要对住宅火灾的风险作出合理的评估(比方说每年会有1/250的美国家庭遭受1次火灾),还需要对火灾平均导致的财产损失作出合理评估(比方说2万美元)。这两点信息会告诉你需要为客户报损预备多少补偿金,以及你需要为提供这种保险业务收取多少费用。的确,凭借所掌握的这两点信息,你就可以通过向客户每年收取100美元保险费的方式过上优越的生活。
因为火灾的风险是1/250,所以你不妨预测在每1万位客户中会有40位在这一年内遭受火灾。在这40次火灾中,每次会大约耗费你2万美元,这意味着你的公司必须承担起80万美元的保险赔偿金。与此同时,你的客户总共向你支付了100万美元的保险金,留给你大约20万美元的丰厚利润。你所需要干的事情不过是坐在那里静等金钱流进你的账户,然后为偶尔发生的意外埋单。另外,如果想要通过这种方式挣钱,你还必须了解自己面临的风险。如果你将风险估计得太低,比如事实上一年中会发生60次火灾而不是40次,你就需要支付120万美元的保险赔偿金,这比你收到的保险费足足多了20万美元,这意味着你会破产。所以,你必须竭尽全力去确保你的客户群体——你的“风险池”——里的火灾风险尽可能地低。你不妨鼓励他们安装自动喷水灭火系统,或者你不妨只为不吸烟的客户服务,因为他们引起火灾的可能性比吸烟的客户更小一些。你是否能长期从事保险代理人职业,这取决于你是否了解以及如何降低你的客户的风险水平。
以上不过是纸上谈兵而已。当然,实践会更加复杂。比如说,你不愿意面对复杂的文书工作,不愿意动手处理报损定损的麻烦事,也不愿意为客户支付保险赔偿金。假如这样的话,你就可以把风险转嫁给更大规模的保险公司,就像客户把风险转嫁给你一样。比如说,你可以把这1万个保险单捆绑销售给另一家保险公司并换回10万美元。这样一来,你能挣到的利润就比你自己经营时少了,但是你再也不用担心自己因支付过多的保险赔偿金而破产了。这10万美元就是你获得的纯利润,而且大公司也会为这笔交易感到开心,因为这也给它带来了10万美元的收益。换句话说,如果你对风险的估计是正确的,就能带来滚滚财源;如果你对风险的估计是错误的,比如说最后有60个客户的房子发生了火灾,那么大公司就会因这笔交易损失大笔财富(恰好是30万美元)。而对你来说,这些预料之外的火灾并不会给你带来任何麻烦,你不再需要为那些从你手上购买保险单的客户们负责了。无论他们的住宅遭遇了怎样的灾难,你都会赚到10万美元利润。如果住宅火灾突然频繁发生,你甚至可以在去银行的路上笑个不停——你将风险转嫁给了大公司并换回了不错的小利润。
你或许已经明白了个中道理。一旦你将手头的保险单卖给了其他公司,你就不用再为这些保险单可能隐藏着的较大风险而担忧了。你的收入只与你自己招揽的客户人数有关,与他们中有多少人的房子会发生火灾然后索赔没有任何关系,维护一个安全的“风险池”对你没有吸引力了。相反,如果你只把保险单卖给不吸烟的客户,可供你选择的客户群体就会变小,你能卖给大公司的保险单数也会减少。因此,你当然也应该将保险单卖给吸烟的客户,以便让自己的客户人数增加。你这样做才会赚更多的钱。嘿嘿,就算你把火灾保险单卖给喜欢玩吞火的人、每个感恩节都会尝试油炸火鸡的人和连续纵火犯也无所谓,因为你可以挣到钱。只要你在客户点燃自己的住宅之前把这些火灾保险单卖给对此毫无提防的大公司,你就能挣到钱。不过,为了顺利完成你的计划,你绝对不能让大公司知道你正在损害“风险池”,你必须把这些合同粉饰得似乎都是低风险的,但实际上它们当中隐藏了巨大的火灾风险。如果你干得漂亮,那么大公司的钱就会流进你的腰包,这些都多亏了你聪明的风险炒作行为。
将上述文字中的“火灾保险单”换成“住房抵押贷款”,你是否觉得自己恍然大悟了呢?这便是对于2007年爆发的次贷危机的一种(略微浅显的)解释。风险炒作激励着经纪人将钱贷给那些凭收入根本无法还贷的人们。有报道表明,经纪人鼓励贷款申请人在申请贷款时撒谎(这是一种金融犯罪行为),以便申请到一笔丰厚的贷款。在某些案例中,人们甚至根本不用证明自己拥有收入。这些贷款申请人在财务方面如履薄冰,而且很可能拖欠贷款,这让次贷风险越来越高。但是如果你能把这巨大的风险转嫁到别人的资产负债表上,你就能赚得一大笔钱。
当整体经济状况良好、房价节节攀升时,经营贷款以及其他基于贷款的金融工具(比如“信用违约互换”,提供无限制的担保合同)的人们赚到了大钱。经纪人、银行和保险公司把坏账风险这一棘手问题抛来抛去,制造出复杂的风险、债务网络。每当次贷风险周转一圈,首席执行官、银行高管、经理、交易人、经纪人们都可以赚到数以百万计的美元红利。他们利用把高风险合同伪装成低风险合同的方式,实现一夜暴富。但当整体经济状况衰退、房价开始暴跌时,好日子戛然而止。大批借贷人开始拖欠贷款,这就好比买火灾保险的客户烧掉了自己的住宅。坏账风险开始大口吞噬着这些参与其中的企业和其他持有巨大“有毒资产”的投资者的财富。它们是花旗集团、美林证券、贝尔斯登、雷曼兄弟、房地美、房利美、美国国际集团……很难估计到底有多少财富蒸发了,很难估计这些公司的资产净值到底有多少建立在蓄意说低贷款风险的基础上,不过,损失应该达到了千亿甚至万亿美元数量级。这是一个令人难以置信的数目,跟美国各级政府的年度预算总和相差无几。结果,便发生了空前的全球性经济灾难。
公共悲剧与道德风险
在整体经济状况良好时,美国国际集团、花旗集团等企业的员工利用风险炒作手段大发横财。他们故意低估甚至无视贷款投资中隐藏着的巨大风险,或将风险转来转去,从别的公司赚取财富。当次贷危机爆发时,他们的私人财富毫发无损。然而,他们工作的企业被迫承担巨大的债务,濒临破产。美国政府不得不介入,拯救这些企业,并花掉了来自纳税人的数以万亿计的美元。
然而,这笔巨额紧急援助中的一大部分都会落入那些最初引发这场危机的罪魁祸首们的腰包。这几乎不可避免,人们处理风险的方式必然会导致这样的结果。
有这样一种规则,它支配着那些就职于美国国际集团、花旗集团等陷入全球性经济危机的高管,也导致我们砍伐热带雨林、向大气层排放过量二氧化碳、在海洋中大肆捕捞。该现象被称为“公共悲剧”,这样命名是因为该现象的最初范例与英国的一项传统风俗相关,该风俗便是英国社区会预备一块“公共”的草场以便人们放养牲畜。据说,为了利用这样的免费草场赚取更多的财富,人们放牧的牲畜数量越来越多,最终因过度放牧而吃光牧草,使得整个草场废掉了。公共悲剧无处不在,甚至存在于每个氛围友好的宴会中。
想象一下,如果你正和许多熟人在一家高档餐馆里聚餐,而且你们已经决定大家平摊本次聚餐费用。虽然这家餐馆会销售昂贵的菜品,但菜单上的促销套餐并不是很昂贵。享受一顿便餐,比如说要份鸡胸肉配土豆沙拉,这对你很有吸引力。虽然显得有点俭朴,但这顿饭还是很不错的。菜单上的其他东西,比如说龙虾,更加诱人,但它们的价格太贵了。如果每个人都选择点菜单上的促销套餐,整顿饭的开销相对来说会小一些。当你们平摊开销时,你和这帮熟人都会吃到一顿不错的饭,饭菜令人满意而且价格低廉。遗憾的是,这样的情况很可能不会发生。更常见的情况是,聚会中的某些人会令人扫兴地点了龙虾。点龙虾的人认为自己赚到了,因为每个人在饭后会平摊开销,他的龙虾的高昂价格会由所有人分担。他个人享受到了品尝昂贵主菜的快感,但他在品尝过程中已经让每个人为这顿饭担负的开销变大了。不幸的是,一旦有人点龙虾,所有平衡就都被打破了。每个人都开始想点昂贵的龙虾,甚至之前已经点过便宜的促销套餐的人也想修改菜单。或许会有一部分人有克制力,坚持点便宜的促销套餐,但这没多大实质用处。已点的这些龙虾轻易就将整个聚会的开销增加到惊人的程度。等到结账时,人们平均计算开销,然后被费用吓得目瞪口呆。这就是公共悲剧的典型范例。
当某个人的行为只为满足自身利益而不顾这种行为的消极后果会累及他人时,比如会让多人承担或需要很长时间才会成为现实,公共悲剧就发生了。在这样的情况下,人们会表现得很自私,都希望尽可能地为自身牟利,但最终结果是让大家的利益都受到损害。在聚餐的案例中,点龙虾的人通过品尝到昂贵的主菜而获益,但开销由所有参加聚餐的人分摊了,这使得原本不太昂贵、气氛愉快的聚餐变成了令人不快、开销昂贵的活动。绝大多数环境问题都是公共悲剧导致的结果。比如说,燃烧碳基燃料的人获得了廉价能量,然而每个发电厂都会让地球变得更“暖”一点,而且最终全球变暖的恶果要由世界上每个人来分担。
对城市规划者来说,另一个公共悲剧的范例可能再熟悉不过了。自20世纪60年代以来,世界上很多城市为了鼓励骑车都提供了免费自行车服务,让任何想骑车的人都能随意借车。这是一个出发点很好的主意:即使你自己不去借这些自行车,更多人骑车也会使得机动车出行次数减少而让你受益。遗憾的是,这种服务很快就消失了,因为人们毁坏了这些自行车。在20世纪60年代的阿姆斯特丹,绝大多数免费自行车在几周内就被偷光了。现在,情况也并没有变得更好。2009年,巴黎的免费自行车服务垂死挣扎,因为自行车损毁得很快。你可以在网上找到视频,看年轻人是如何粗鲁地骑着这些免费自行车下楼和在溜冰场里玩飞车的。破坏狂们毁掉了大量免费自行车,他们撞坏它们、烧毁它们甚至把它们扔进塞纳河,也有很多免费自行车被偷走了。在巴黎的免费自行车方案开始执行一年半以后,官方提供的15000辆免费自行车已有半数以上消失或无法使用了。个别人的破坏行为毁掉了这一公共资源。公共悲剧是人类社会根深蒂固的恶习。只要我们的行为在某种程度上不会受到其所带来的消极后果的影响,我们就会实施这些行为,哪怕它们会为大众带来不幸。公共悲剧是人性会导致的必然结果,而且一旦我们忽略了人性就会让自己面临巨大风险。
在金融市场上,公共悲剧的等价概念就是“道德风险”,它是当你利用风险炒作手段来处理公共悲剧时所面临的情况。当经济利益不会受到获取它需担负的风险的影响时,非常邪恶的事情就发生了。次贷危机就是道德风险大行其道的典型范例。那些投机次级抵押贷款证券的人获得了大量财富,但他们却不用承担这些贷款背后的巨大风险。结果,他们行为不端,故意将风险描述到相当低的程度来赚钱。即使他们的行为正在一点点侵蚀他们所在公司的财务健康以及世界经济的稳定,这帮人也不会停下来,直到整个经济体系全面崩塌。
风险最终在次级抵押贷款上变现,整场风险炒作大戏骤然闭幕。这些硕鼠们尽力保住自己的财富,他们当中的一些人甚至设法在崩盘后挣到了大笔钱财,这是另一种典型的道德风险。
美国国际集团,这家规模庞大的保险公司,是次贷危机爆发的核心地带,面临着数以百亿计的美元的可怕贷款风险。在经济危机爆发时,美国国际集团已经泡沫化到极其惊人的地步。它拥有万亿美元数量级的资产,而且能为全美各大金融机构带来业绩。如果它破产了,那么美国所有的商业银行、投行都会为之战栗,它甚至会使部分银行、投行和它一样破产。美国人会恐慌,美国的整个经济基础结构可能会在几天内动摇、崩溃。经济学家把这种可能性称为“全局性危机”。这正是美国国际集团手中的救命稻草,利用这种风险,美国国际集团可以确保美国政府会提供大量资金来填补它的财务漏洞。
美国政府担心经济彻底崩溃,所以不能让美国国际集团破产,这使得美国国际集团的高管认为,他们可以发狂似的把公司事务全权委托给别人,并且承担他们的任何风险。美国国际集团的高管基本和他们的行为所导致的后果分离开了,因为他们觉得无论公司承担了多大风险,政府都不会让它们倒闭。这相当于给美国国际集团的高管们开了绿灯,让他们肆意进行风险炒作。他们会故意在投资者面前掩饰风险,滥用投资者的资产,利用分红来榨取财富,并且为大发横财而去参与高风险的投资。如果情况糟糕了,美国政府就会介入以帮助他们摆脱困境。美国国会别无选择,只能为美国国际集团的高风险投资埋单。
当然,情况确实因为美国国际集团的高风险投资变糟了,而且美国政府也准时介入了。2008年9月16日,挽救美国国际集团的计划需要美联储借出850亿美元。“没有任何事情比起这个更让我泄气和恼怒的了,我们不得不干预。尤其令人生气的是,我们再次遇到了不顾风险肆意投资而让公司陷入破产困境的情况。”美联储主席本·伯南克2009年愤愤不平地表示,但由于担心触发更严重的经济灾难,“我不得不抑制自己的冲动,然后尽力挽救这些企业。”
不幸的是,紧急援助并没有结束硕鼠们的不端行为。毕竟,美国国际集团仍然庞大到了难以破产的地步。只要美国政府害怕全局性危机,美国国际集团的高管们就没有任何理由让自己变得厚道一点,更没有任何理由去尝试为公司建立可靠的财务基础。就在紧急援助到位后的几天内,美国国际集团的高管们就花费了其中大约50万美元去加利福尼亚州的豪华度假场所游玩,他们在那里纵情享受矿泉疗养、高档宴会,还心安理得地享受着高尔夫球运动。在草地赛场上每人每场需花费7000美元。美国国会议员们得知后勃然大怒,但这种恼怒并不足以阻止他们在当年10月为这家公司额外提供380亿美元的资助,并且在当年11月再次拨款400亿美元。美国国际集团的首席执行官爱德华·利迪承诺要循规蹈矩,“我们要束紧腰带度日”。他在2008年10月告诉记者:“正如全美国的消费者、纳税人们正在束紧腰带度日一样,我们也要这样做。但我们不会只节约一点,我们会越来越节约。”美国国际集团的腰带很显然与众不同,因为仅仅几个月后,利迪就来到国会,为他从紧急援助资金中拿出1.6亿美元来为美国国际集团的员工提供“保留分红”的必要性作出解释。最高分红金额达到了巨大的640万美元,73个人得到了超过100万美元的分红,而且其中有11个人早就离开了那家公司,所以所谓的“保留分红”很可能与他所宣称的目的不相符。这是令人难以置信的不端行为,让国会和总统奥巴马尴尬不已。
所有庞大到了难以破产的地步的公司——花旗集团、通用汽车、房利美、美林证券——都存在道德风险的问题。一旦这些公司的高管意识到美国政府不会允许公司破产,他们就会装满自己的腰包,并且将他们的高风险行为的后果转嫁到全体纳税人身上,这绝对会发生。我完成本书后,美国的经济大衰退状况还没有好转的迹象。报纸正在报道花旗集团发布的给予25位高管巨额分红的公告,其中某人会拿到如同梦幻般的9800万美元,这让美国国际集团的分红行为显得“小巫见大巫”了。
每隔几年,大量的风险炒作案例就会把普通美国公民的财富掠夺到少数富人手中。无论在银行业丑闻、安然骗局还是次贷危机中,结局都是一样的。那些用谎言遮盖风险的人暴富了,而纳税人承担了惨重的后果。即使个别犯罪分子被捕入狱,绝大多数参与者也安然无恙。他们通过让别人花钱的方式敛财,而且从未承担任何不良后果。
在所有类型的“数字的骗术”中,风险炒作最直接地损害到我们的利益。尽管如此,其他类型的“数字的骗术”也可能带来更为惨重的后果。它们可以暗中削弱舆论监督的力量,操纵或架空选举制度,陷害人们入狱,以及削弱民主制度的力量。与“数字的骗术”相比,单纯的窃贼行为反倒相形见绌。
第四章 你相信民意调研的结果吗?
民意调研是新闻由头的制造工厂
民意调研或许是现代社会中“数字的骗术”的首要来源,它们是新闻记者们不可或缺的有力武器。我们在阅读报纸、收听新闻广播或者上网浏览新闻时,往往会在几分钟内得知各种民意调研结果,而这些民意调研通常是很荒谬的。比如我在写这段话时就听说了这样一个案例,在一项关于“你最希望偶遇的已故人士是谁”的民意调研中,耶稣基督和戴安娜王妃暂列前两位。对政客们来说,民意调研是可以用来包装自己主张的工具,也是可以用来攻击政敌的武器。就正面意义而言,一项被人精心设计和执行的民意调研可以向我们提供当前社会中公众观点的缩影。然而,绝大多数情况下,民意调研只不过是专门制造那些貌似可靠却毫无实际意义的“数字的骗术”的工厂。
……
对于脑海中充满了写作灵感的新闻记者来说,这实在令人沮丧。许多有趣的、重要的新鲜事物都是一点点逐渐发生的,而不是通过一连串毫不相干、值得报道的新闻事件显现出来的。然而,新闻记者们通常无法着重表达宏观趋势或抽象概念,除非他们找到了所谓的“新闻由头”那种足以让新闻记者们绞尽脑汁牵强附会地把自己想要表达的主题与之联系起来的实时新闻事件。例如,一位记者暗中怀疑民航飞行的安全状况变糟了,他隐隐约约地渴望着把这种看法表达出来,他就会留心观察某些类型的新闻由头——任何足以为他发表整套观点提供充足理由的新闻事件。一次引人注目的坠机事故或许是理想的新闻由头,其他不够严重的新闻事件或许本身并不具备足够报道价值的事件也足以充当新闻由头。事故隐患就挺合适,飞行员因为在上班时喝得酩酊大醉而被开除的类似小插曲也挺合适。报告也算得上是好的新闻由头,这位记者只需稍事等待就会看到美国联邦航空局或其他政府机构发布的官方报告或制作的运输业统计报告,这些就足以在适当的时刻激发他报道的灵感。就算这些事情都没有发生过,也总会有某些著名灾难的周年纪念活动发生。如果他极其想要写报道的话,甚至可以在恰当的时机把尘封已久的环球航空800号班机空难、安第斯山空难甚至70多年以前的“R101号”飞艇事故当做一篇报道的新闻由头。其实,新闻由头甚至不必是真实的新闻事件,它可以由假新闻充当。
真实的新闻事件往往是自然而然发生的,而不是被计划好的,新闻事件按照自身的时间表发生着。即使这个新闻事件完全不令人感到惊奇(例如,每个人都知道美国大选的时间),它的结果也至少应该在某种程度上是不可预测的。真实的新闻事件是复杂的,它需要人们花费好几个月甚至好几年的时间梳理出它的实际意义,而且很可能永远不会被人们充分理解。而虚假的新闻事件——它被丹尼尔·布尔斯廷戏称为“伪事件”——往往与之相反。真实的新闻事件是自然而然发生的,伪事件是人造的。伪事件是被计划好的,而不是自然而然发生的。伪事件会在适当的时候、恰当的地点发生,所有不可预知的因素都被控制到最低限度。出色的伪事件是简单易懂的,有着明确的意图。政治演讲活动所使用的讲稿、政府备忘录中精心安排的“漏洞”一类的伪事件都是有意义的,至少从某种程度上,这类伪事件特别符合新闻媒体的需求,而且一旦被新闻媒体公开发表以后,它就顺理成章地吸引公众去关注,被广泛谈论,而且影响到公众的看法。虽然伪事件中或许包含着有用的信息,但那些信息往往已经被有意扭曲、重塑过,以便服务于某种目的。不幸的空难不具备隐秘动机,但空中客车公司总裁发表的演讲无疑具备相应的隐秘动机。
新闻记者们使得伪事件跟真实的新闻事件相比区别不大,我们甚至可以说两者看起来几乎不存在任何区别,它们都是有用的。伪事件可以在人们所需要却不易实现的情况下完美地扮演成值得利用的新闻由头。空中客车公司总裁发表的演讲可以给记者“松绑”,使得他们有机会写文章质疑民航飞行的安全状况。新闻记者非常感谢伪事件给他们带来的创作自由,甚至愿意为这种自由付出代价,愿意被伪事件制造者操纵。结果,许多企业和政府机构越来越顺手地捏造伪事件,让它们迅速转化为伪新闻。
从新闻记者的视角出发,民意调研就是最严重的伪事件,因为它完全可以被控制住。无论何时,只要新闻机构愿意,它就可以主导或委托发起一项民意调研,然后对民意调研的结果适当地进行报道。民意调研让新闻记者们得以解脱,为他们制造伪事件,让他们无须再等待真实的新闻事件发生,也让他们无须等待别人为他们制造新闻由头。民意调研允许新闻机构捏造独家新闻,这种做法令人难以置信。民意调研并不是新闻机构捏造新闻时可使用的唯一方式。《时代》的年度人物评选就被年复一年地用来制造博取人们眼球的伪新闻,十佳和百佳排行榜也能够给人带来深刻印象,其影响力似乎也迅速扩散开来。
此外,民意调研允许新闻记者们刻意歪曲事实去迎合预设的时间表,完全让他们无须理会原本绝不理想化的真实新闻事件的时间表。在公众情绪萎靡不振的美国大选季,离投票还有很长一段时间,时间慢慢过去,此时此刻你或许会觉得新闻机构没办法对大选情况进行报道了,毕竟目前实在没有新闻事件值得报道。绝对不是那样的。新闻机构只需委托发起一项民意调研,就能为自家雇用的新闻记者们和受众们提供一些煞有介事的话题。新闻记者们在整个美国大选季中连续不断地唠叨,好像他们是在跑马比赛中召唤赛马的骑手。专家们耗费无数时间来稳住每一项他们能够插手操控的全国性或地区性的民意调研的核心状况,使得一个个琐碎、无价值的结果转变为未来新闻的重要由头。这些民意调研使得新闻媒体可以让受众们一直忐忑不安或者快乐无比,甚至让受众们从离揭晓最终结果的日子还很遥远的候选人初步提名日起就开始关注(这么早就开始关注美国大选通常会令人感到无趣),直到11月份的美国大选投票日为止。而且当投票日临近时,民意调研会变得越发令人紧张。很早以前,新闻记者们必须等待打探确切消息的人在获选人名单公布前带回情报。现在早就不是这样了!最终民意调研结果使得人们在入睡前就可以从互联网上看到宣布获胜者的报道。民意调研是令人难以置信的有力工具,而且它已经成为现代新闻媒体业的基石,而且这不仅仅体现在美国大选季上。
民意调研3%的误差范围
误差范围是一种在一定程度上颇让人难以捉摸的概念,它代指一类给民意调研带来恶劣影响的问题。就核心意义而言,民意调研是用来估计公众意愿的计量工具,它跟其他计量工具一样是不完美的。民意调研蕴涵着固有的内在误差。然而,有种独特的误差来自民意调研的处理机制,它是由随机性导致的。
为了通过民意调研的方式进行计量,民意调研者会向某些人——“样本人群”——提出好多问题。借助所得到的回答,民意调研者至少从理论上了解到样本人群在特定的争论议题上所持的立场。然后民意调研者利用这些数据材料得出理论性的观点。他们假设为数不多的样本人群的偏好准确地表现了大众的嗜好。更确切地说,如果民意调研者对1000位英国人提问,而且得知64%的样本人群喜欢茶胜过咖啡,那么他们就断定这种情况在所有英国人中都成立。他们会向兴趣盎然的公众发布报道,宣称64%的英国人喜欢茶胜过咖啡。遗憾的是,这种观点会导致不可避免的误差。即便在调研条件最佳的情况下,即便在民意调研者极其小心地选择了接受调研的样本人群的情况下,客观的随机性也会阻止他得出准确答案。
你不妨仔细考虑一下,这种误差是合情合理的,某种与民意调研所采用的样本数量相关的误差必然存在。样本数量越小,误差就越大,结果也就越不可靠。只选择一个样本也行,但这是毫无意义的。向单个随机的陌生人询问他喜欢喝哪种饮料,这无法让你取得足够多的样本来证明全英国人喜欢喝什么。你很可能随随便便地偶遇了一个喜欢喝羊血胜过喝咖啡或茶的疯子。如果是那样,你的样本就会表明英国最流行的饮料是羊血,这种怪异的结果会让你的民意调研的结论显得很尴尬。
你选取的样本人数越多,就越容易避免自己收集的材料数据因偶然遇到的怪人而导致结果无效的情况发生。如果你调研10个人而不是1个人,那么那个怪人对羊血的狂热就不会戏剧性地影响到你的最终结论。如果你调研100个人,情况会更好,单个怪异的结果对于整个民意调研结果的影响完全可以忽略不计。所以样本人数越多,由小概率随机事件导致的误差可能性就越小。
事实上,小概率随机事件体现了某种自然法则:无论你多么小心地收集样本,你都会遇到随机事件。由于这种小概率随机事件会给你的民意调研的准确度带来负面影响,它便成了论证不严密的结论产生的根源,这种不严密现象被称为统计误差。幸运的是,人们可以利用数学和统计学方程来排除这种小概率随机事件,这些数学手段可以将小概率随机事件(以及统计误差)的范围控制在你预期的范围以内,以便于你处理特定规模的样本。换句话说,样本规模和统计误差之间存在着密切关系。样本规模越大,统计误差就越小。更加精确的说法是,统计误差与样本规模的平方根成反比。而且,统计误差是一种非常真实的、重要的现象,被认为是构成概率论的基本数学法则之一,尽管这样说显得有些艰涩。统计误差是所有民意调研中出现的差错的可靠来源之一,而且是自然产生的偶然的随机性所导致的结果,是与样本规模密切相关的函数的因变量。如果你对数学感兴趣,那么请阅读附录A以便更深入地了解统计误差和误差范围。
误差范围的概念是随机性所导致的不严密现象(小概率随机事件)的合理表述。在通常情况下,它比小概率随机事件在所有样本中实际发生的概率大的可能性达到了95%。突然这么说似乎有点让人难以理解,所以我们不妨使用实例来阐述。
例如,一项民意调研发现64%的英国人喜欢茶胜过咖啡。民意调研者知道偶然的随机性——统计误差——可能使这项调研结果不准确,真实答案或许不会恰好是64%,而是62%或66%。如果小概率随机事件恰好在调研时普遍发生,真实答案甚至可能是93%。当民意调研者宣布最终统计误差是3%时,他实际上断定,偶然的随机性只能将真实答案提高或降低3%,也就是说真实答案为61%~67%。然而,这种断定不是无限制的。随机完全是任意的,古怪、不太可能出现的一组事件有时会对民意调研结果带来大于3%的显著影响。不过,这类如此古怪的事情往往很少发生。在约20次同类民意调研中,只有1次民意调研会因为这种古怪的事情出现大于3%的结果偏差。绝大多数情况下,在20次民意调研里的其他19次,偶然的随机性只会导致不到3%的结果偏差。
还愿意跟随我的思路听下去吗?如果你还没有完全理解这一点,不要担心。误差范围确实是一个难懂的概念,需要你开动脑筋思考。甚至许多整天在报道民意调研时念叨着误差范围的新闻记者也不懂。你只需要记住与误差范围有关的两个要点:第一,误差范围反映了由统计误差导致并存在于民意调研中的不严密现象,这是自然而然产生的偶然的随机性引发的不可避免的结果;第二,误差范围是与样本规模密切相关的函数的因变量,样本规模越大,误差范围就越小。事实上,我们完全可以把误差范围理解为样本规模大小的表现形式。设某次民意调研选取了n个调研样本,则误差范围可以简单地估计出来。这正是当前许多民意调研结果的误差范围都在3.1个百分点左右的原因——3.1个百分点所对应的样本规模正好是1000。
误差范围是与概率和随机性相关的数学法则的直接结果。它描述出民意调研的精确程度,它描述出当民意调研者们试图利用样本人群的立场推测公众整体立场时所需面对的不可避免的统计误差。人们根本没办法绕开它,一旦民意调研人员作出调研结论,并且假设样本人群的偏好准确地反映了大众的嗜好,他们就制造了统计误差。
误差范围是个难以捉摸的概念,而且人们,尤其是新闻记者们,总是滥用、误用它。当新闻媒体把某次民意调研的误差范围当成万能的计量手段,并且据此宣称这次民意调研能够真实反映客观事实时,这些媒体就已经在追求真理的道路上误入歧途了。而且,当人们把一次只有很小的误差范围的民意调研结果当成具备充足证据、绝对真理时,他们已经铸成大错。
误差范围不过反映出统计误差而已,这种误差是使用样本人群来代表公众整体的统计方法所固有的。尽管这种误差特别重要,以至于人们无法忽略,民意调研的手段还是暗含很多其他种类的差错,而且那些差错无法用误差范围反映出来。如果民意调研结果错得离谱,那么这问题一定不是统计误差导致的。这几乎都应该归咎于另一种差错——系统差错。然而,民意调研的误差范围绝对不会包含系统差错。当新闻记者们自以为可以用误差范围衡量某次民意调研的可信度时,他们完全没弄明白,到底哪种类型的差错更可能导致民意调研的结果变得毫无意义。新闻记者引用误差范围作为某次民意调研可靠性的依据,这就好像他在穿过双向车道马路时只看见了单向车道,这样他迟早会被车撞倒。
造成致命错误的系统差错
足够理性的人相对而言比较安静,但是他们生气时往往会做出惊人之举。当我们对一家餐馆的服务感到很满意时,我们通常不会把这种满意的想法填入顾客意见调查卡,但如果服务员态度恶劣、食物变冷或过期,我们立刻就会寻找铅笔以便填写顾客意见调查卡。当调查和民意调研建立在无偿、自愿回复的前提下时,有强烈意见的人往往比没有强烈意见的人更愿意响应,事实总是如此。这就产生了一种偏差:民意调研往往更易于反映出极端的观点,而忽略了中肯的观点。
在1936年美国大选时,美国共和党是在野党。美国共和党的支持者对罗斯福的政策非常不满,因自身无法改变这种政策而沮丧,而且对罗斯福政府相当不满,投票给兰登就等于支持改革,表达异议。另一方面,美国民主党的支持者大多对政府感到满意,投票给罗斯福就等于支持现状与既定政策。当《文学文摘》杂志的模拟投票随信邮寄到人们家中时,那些支持兰登的、对现状愤怒不满的人更愿意对这次民意调研作出响应,而那些支持罗斯福的安于现状的人则感到无所谓。结果,寄回的信件多数来自美国共和党的支持者。
以上介绍的两种出现在《文学文摘》杂志此次民意调研中的系统差错产生了同样的影响。把信件主要邮寄给富人,导致样本出现了倾向于支持兰登的偏差,过分依靠人们填模拟投票表格并且寄回的自愿心态又带来了“志愿者偏差”,最终同样导致样本出现了倾向于支持兰登的偏差。在这次民意调研中,双重偏差叠加表现得相当明显,纵然误差范围已经极小,但整个调研结果所显示的得票率与真实情况之间还是出现了10个百分点以上的偏差。《文学文摘》杂志的民意调研失败的命运是由系统差错引发的,而不是由统计误差引发的。
系统差错比统计误差危险得多。它们更加难以捉摸,它们通常能够在给你沉重一击之前是让人完全察觉不到的。它们难以避免(需花费沉重代价来避免),而且它们会以多种形式呈现,每一种形式都能带来毁灭性的后果。
在某种程度上,乔治·盖洛普凭借着自己对《文学文摘》杂志的失败作出的正确预言而成名。他设计的民意调研方案更加老练:通过“合乎科学”地小心选择样本来保证他们足以代表整体公众意愿的办法,盖洛普创造出许多准确性在当时数一数二的民意调研,即使他所使用的样本规模往往比拥有更雄厚资本的竞争者使用的样本规模小很多。他赢得了值得信赖的声誉,而且他在《文学文摘》杂志失败的预测事件还余波未尽的时候就帮助新闻记者们改变了对民意调研的盲信。然而,就连盖洛普的“科学方法”也未能摆脱系统差错的影响。
宣称“杜威击败了杜鲁门”的头条新闻就是盖洛普的“科学方法”的最有名的一次失败。在1948年美国大选最终投票前几周,盖洛普的民意调研始终表明杜威占据领先优势,这种领先优势已经明显到盖洛普的雇员们都不愿意继续执行这次民意调研了(毕竟继续下去需要花更多钱)。但是,主流民意随时间流逝发生了变化,杜鲁门的支持率在投票前猛然攀升,因为原本第三方候选人的支持者放弃了原先的立场转而支持有机会获胜的候选人,而且他们往往更青睐现任总统。过早取样导致民意调研结果显示出了杜鲁门支持率低的偏差。另一种令人难以捉摸的差错就这样从对犹豫不决的选民的投票意向的错误假设中产生了。盖洛普认为那些暂时还没有决定支持杜鲁门或杜威的选民的投票意向会跟那些早就作出决定的铁杆选民一样,也就是说,既然早就作出决定的铁杆选民们更喜欢杜威,那么暂时还没有决定的选民们也应该有相似的心态。这完全错了,因为犹豫不决的选民们的投票意向跟坚定的铁杆选民们不一样,所以最终犹豫不决的选民们大多数出人意料地把选票投给了杜鲁门。“犹豫不决的选民们跟坚定的铁杆选民们的投票意向相似”的假设,让民意调研结果隐隐约约地夸大了支持率领先者的优势,让双方之间的支持率差距显得更加明显。系统差错又一次破坏了民意调研的结果,导致它得到了错误的结果。盖洛普也(一无所知地)掉进了“反统计”的陷阱之中。他原以为他的计量标准更加精准,这导致他低估了调研中的不确定性因素。
出人意料的是,1948年的美国大选结果并没有使公众对民意调研的信任产生永久的负面影响。错误的民意调研结果并没有让盖洛普大为震惊,他相信自己能够找出问题所在并将它们排除,逐步让民意调研的技巧更加完善。他对自己的方法充满信心。例如,他以前忽略了接受调研的人们的宗教信仰,这或许是他的民意调研再次错误预言肯尼迪会以总票数的4个百分点的领先优势获胜的原因。(事实上,肯尼迪只以多获得0.25个百分点的总票数的微弱优势获胜。)
口是心非的调查样本
系统差错具备种类繁多、错综复杂、难以捉摸的特点,着实令人费解。某些系统差错或许永远无法解释清楚。英国的民意调研者们曾经长期无法弄明白民意调研中得出的英国保守党支持率一贯偏低的原因,这种情况一直持续到20世纪90年代初期。他们无法作出确切的解释,只能把这种偏差称为“害羞的保守党”现象。这种现象在出现若干年后突然消失,神秘而来,神秘而去。某些系统差错更加令人不安。例如,一项针对特定类型的民意调研的研究表明,因为心里存在着怀疑的阴影,人们常常对民意调研者撒谎,虽把调研表格填满了却毫无实际意义。当这种情况发生时,民意调研的结果就根本无法反映出人们的真实想法,而变成了“波将金数字”。每隔一两年就有人试图利用民意调研或小调查的办法来了解当前人们的性习惯。某些小调查设计得相当老练和“专业”,它们借助专家和专业统计人员的力量,而且以官方为财政后盾,但每一次得出的结论都完全是废话。因为人们撒谎了,大家不由自主地这么做了。
2007年,负责美国公众健康统计的杰出机构——美国疾病控制中心,大张旗鼓地发布了一份以美国人的性生活为主题的报告。自然,这份报告中最受人关注的元素就是最“色情”的话题——美国人平均交往过的性伙伴数量。“平均每个美国男人跟7个女人睡过。”这份报告宣布。这就是说,美国男人在一生中大约与7个异性发生过性关系。这样的统计结果本身并不令人吃惊,但是,如果你把同一份报告所提供的另外一个统计结果与它比较,你就会感到震惊:平均每个美国女人跟4个男人发生过性关系。这绝无可能。如果我们在这里谈论的“平均”是指性伴侣人数的平均数,那么这当然是不可能的。其实,这份报告中的确使用了“平均”一词,然而,这两处的“平均”是指性伴侣人数的中位数而不是平均数。就技术层面而言,美国女人交往过的男性性伴侣人数的中位数和美国男人交往过的女性性伴侣人数的中位数之间确实可能存在着明显的差距。但那种情况非常罕见,而且根据报告中提到的信息,这次民意调研中得到的美国男人交往过的女性性伴侣人数的平均数也远远高于美国女人交往过的男性性伴侣人数的平均数。
无论何时,一旦任何一个男人与一个异性发生了性关系,就意味着会有一个女人与一个异性发生了性关系。每次与异性性交会让男人交往过的异性性伴侣的平均数增加,同时它也会让女人交往过的异性性伴侣的平均数增加。这建立在美国男人和美国女人人数相当的前提下,目前来说正是如此。男人交往过的异性性伴侣的平均人数理应等于女人交往过的异性性伴侣的平均数。很显然,两性分别交往过的异性性伴侣的平均数不可能存在着较大差距。这次小调查确实出错了。由此得出两大结论,“平均每个美国男人跟7个女人发生过性关系”和“平均每个美国女人跟4个男人发生过性关系”,明显是错的,这是不合乎事实的“波将金数字”。
到底是什么地方出错了?答案很简单:有人撒谎了。要么美国男人普遍夸大了自己的“业绩”,要么美国女人瞒报了自己的性经历,又或者双方都在撒谎。不用怀疑。即便身处私密环境,即便民意调研者保证绝不泄露调研对象的隐私,即便撒谎不会带来任何好处,人们总会在回答自己实际的性伴侣人数时撒谎。这样的情况再三发生,在法国,在英国……那里的人们同样会在谈论自己的性经历时撒谎。存在着确凿的证据可以证明这种撒谎问题。2003年,一项研究表明,如果你给被调研对象的手腕扣上皮套,告诉他们已经连接到测谎仪器上(实际上放在那里的仪器只是摆摆样子),男人们和女人们的答案之间的差距就会戏剧性地缩小。无论民意测验如何进行,你总会发现数据是错的,因为人们习惯于撒谎。
至少在某种程度上,人们撒谎是因为想讨他人喜欢或者受到尊敬。他人当然也包括民意调研者,即使他们永远不会再见到这些人了。人们往往喜欢给出(他们自认为)讨人喜欢的正面答案,这种情况并不仅仅出现在人们回答性问题时。人们总是试图向民意调研者展现自己人性中最高贵、最有道德的一面,无论自己是否真的是这样。
例如,在卡特里娜飓风侵袭新奥尔良之后不到一周,美联社与民意调研机构益普索合作,希望了解美国公众对这场大灾难的一些看法。此次民意调研中出现了一个有趣的小插曲,有超过2/3的美国人表示自己已经为卡特里娜飓风的赈灾工作捐款了。按照保守估计,这意味着大约6000万户家庭仅在灾难发生一周后就已经捐款了。这自然意味着大量的慈善款项应该已经送到灾民手中了。
到底有多少捐助款?这很难弄清楚。救世军(Salvation Army)当时宣布该组织成员平均每人为卡特里娜飓风的赈灾工作捐助了大约2000美元。这个数字或许可以代表公众的平均捐款金额,但为了保险起见,我们不妨假设其他公益组织做得不如救世军好,而且最终公众的平均捐款金额比救世军成员的捐款金额少很多,大概仅为50美元。所以,如果已有6000万户家庭捐款,而且每家捐助了50美元,那么这意味着捐款总数大约为30亿美元。
美国人在灾难面前确实表现得慷慨大方,然而他们并不像此次民意调研结果所呈现的那样大方无私。当此次民意调研结果新鲜出炉时,卡特里娜飓风的赈灾工作所收到的捐款总数仅有6亿美元,大约是民意调研结果的1/5。如果你注意到这6亿美元捐款大多来自企业而非个人的事实,这种失衡现象就会显得更糟了。结论很明显,绝对不可能在灾难发生后一周内就有大约2/3的美国人已经捐过款了。捐款人数是个“波将金数字”,真实的捐款人数必然还不到民意调研结果的一半。当然,这就意味着那些说自己已经捐款的人多半在撒谎。样本人群的撒谎行为是系统差错,不是统计误差,因此3个百分点的误差范围(这个数字被新闻媒体忠实遵循着)基本与此次民意调研的精确度无关。
有时候人们撒谎仅仅出于夸大的心态,有时候人们撒谎源于居心叵测,人们偶尔也会出于自身利益而试图影响公众调研结果。在1996年美国大选前共和党内部进行初选时,“投票后民意调研”(选民离开投票站时对他们进行的民意调研)显示,公认希望不大的极右翼候选人帕特·布坎南在亚利桑那州战胜了持主流观点的鲍勃·道尔。网上的所谓专家们立刻开始讨论布坎南是道尔面临的多么难以逾越的障碍。然而,当结果揭晓——真正的计票数据公布——时,人们才发现道尔战胜了布坎南,他的得票领先优势超过了总票数的2个百分点。为什么?按照美国有线电视新闻网的政治节目总监的说法,这是因为布坎南的支持者们“主动寻找民意调研者”以便让布坎南的得票率显得更高。当美国有线电视新闻网发现出错原因后,他们的高管表示这个问题可能会导致他们在使用民意调研手段来预测胜方时更加谨慎小心。就像时钟循环一样,每隔几年,一次投票后民意调研都会以令人尴尬的方式出错,相关媒体随即表示下一次会更谨慎小心。然而,从未有过任何改变。操控一次投票后民意调研的结果并不难做到。如果你在投票点附近逗留或者巧遇一个民意调研者(看他携带的布告板就能认出他来),你就极可能成为样本人群中的一员,除非这个民意调研者真正在专心挑选样本。这种“过度代表”行为可以让你所支持的候选人显得更受欢迎,或许真能给他带来更多支持者。
并非只有美国人喜欢在投票后民意调研中撒谎。2006年,巴勒斯坦大选的大逆转结局让政治观察员们大吃一惊。所有民意调研,包括投票后民意调研,都预言法塔赫会以高出6个百分点的得票率优势战胜对手哈马斯。结果相反,哈马斯略胜对手。这样的差错再一次让民意调研中存在的误差范围相形见绌。事实上,出现这样的差错的原因是哈马斯的支持者们与布坎南的支持者们的想法相反。他们希望让哈马斯显得更不受欢迎一些,因此向民意调研者撒谎或者拒绝参与民意调研。为什么?这些民意调研的组织者之一向《华尔街日报》爆料说:“哈马斯企图对投票后民意调研的结果施加影响,其目的是让投票后民意调研的结果不会让法塔赫提高警惕或者害怕失败,从而避免法塔赫试图破坏选举进程(例如,在当地以前的大选中曾出现过选票箱被焚毁的事情)的情况发生。”如果执政党控制的政府会因反对党的支持率太高而烧掉选票箱,那么反对党的支持者在民意调研中撒谎就是很明智的行为。不幸的是,操控民意调研的行为太普遍了。有许多心怀鬼胎的人希望操控民意调研的结果。最糟糕的情况就是,民意调研者自己也这么干。
不同的问法,结果截然相反
早在民意调研刚出现时,研究人员就已经知道,调研表上的问题的表述方式可能会戏剧性地影响到民意调研的最终结果。就算调研表上的词语都选取了看起来显得特别中立的类型,这样做有时也会微妙地驱使样本人员按照特定的方式作出回答。比如说,在20世纪90年代早期,盖洛普民意调研机构(与美国有线电视新闻网和《今日美国》合作)曾发起一项民意调研,调查美国人是否支持轰炸波黑塞族武装。回答相当消极,55%的人反对,35%的人支持。同一天,美国广播公司新闻频道在另一次民意调研中问了相似的问题,而回答却相当积极,65%的人支持,32%的人反对。这两次民意调研怎么会得出如此大不同的结果呢?这种失衡现象是因为两次民意调研的问题的措辞存在着细微差别。在盖洛普民意调研中,轰炸行动是“美国”单独发起的,在美国广播公司新闻频道的民意调研中,轰炸行动是由“美国和欧洲盟国”一起发起的。这种用词上的细微差别让问题的基调出现了差别。而且美国公众相当在意美国是否在单方面行动,这会让他们的反应完全不同。语法正是系统差错的又一重要来源,遣词造句上的细微变化会完全改变人们回答公众调研的问题的方式。即使某些细节似乎对问题的条理性不造成任何影响,但它们也能导致巨大的差异。
当民意调研中存在可能会带来麻烦的复杂问题时,部分预算充足的民意调研会将样本人群分为多组,然后将同一个问题以多种方式提出,以保证措辞不会干扰最终结果。2006年1月,《纽约时报》向人们提出了两个关于颇受争议、显得不太正当且即将为大家所知的窃听计划的问题。其中一个问题引用了小布什提出的“窃听计划有助于反恐”的声明的原话。公众表现出赞同的倾向,53%的人支持,46%的人反对。另一个问题去掉了小布什的原话,公众则表现出反对的倾向,50%的人反对,46%的人支持。很少有其他新闻媒体表现得这样小心过,例如,另一家主流民意调研机构拉斯穆森也向公众提出了类似的问题,但完全没有向大家提到窃听行为是需要议会许可或司法裁决的。结果早在意料之中,它发现美国公众坚决支持窃听计划。不幸的是,这会让民意调研耗费更高成本,而且扩大了误差范围,因为将一个问题分为两种不同形式的问法,就意味着每种形式大约会得到一半的样本人员的回答。就民意调研机构而言,最糟糕的情况莫过于两种表达形式导致了完全不同的回答,这可能使得本次民意调研毫无意义。于是,绝大多数民意调研不会去考虑控制措辞导致的系统差错,即使这样做很有必要。
有必要控制由措辞导致的系统差错的情况很多。无论何时,只要提到政治敏感度较高或棘手的话题,民意调研者对于语言的选择就会影响到结果。“尊重生命”和“反对堕胎”的措辞就会引起完全不同的反应。人们不会关注战争中的“附带损害”,但对“平民遇难”很敏感。极力反对“酷刑”的人们不太反对“高级审讯技术”。这些词、短语蕴涵着强烈的暗示(人们很难公然表示自己支持酷刑),以至于很难拨开它们所带来的迷雾来看清人们的真实态度。甚至貌似无伤大雅的用词都能有所影响,“奥巴马总统”显得比“巴拉克·奥巴马”更加恭敬,前一种形式的用词所获得的支持率往往比后一种高。任何措辞选择都会以某种方式带来倾向性,从而成了系统差错的重要来源。一个有趣的例子是,你不妨在进行民意调研时向其中一半样本人员提问:“你认为祷告时应该吸烟吗?”然后问另一半样本人员:“你认为吸烟时应该祷告吗?”即使这两个问题本质上是在询问你对同一种行为的看法,但它们在本次民意调研中也会得到相当不同的答案。
从数学上来看,这种对问题措辞的依赖会导致妨碍民意调研结果反映真相的系统差错出现。然而,对某些民意调研者来说,真相不过是一种负担。如果能够把客户想要的结果带给客户,他们就能挣更多的钱,当然就算客户想要的是“波将金数字”,他们也愿意提供。
2005年4月,一场引起公众舆论巨大分歧的戏剧性事件在美国落下帷幕。特丽·夏沃是个成为植物人10多年的女人。她的丈夫迈克尔想要医生拔掉她的进食管,但她的父母想要继续维持特丽的生命。经过一连串法庭诉讼和媒体争论,迈克尔获胜,特丽的进食管最终被拔掉了。这是一件恐怖的事情,由于自己无法进食,特丽慢慢因饥饿而死。虽然两种解决方法的支持者都很多,但当年3月的多次民意调研似乎都显示出美国公众更倾向于支持拔掉特丽的进食管。比如说,在美国广播公司发起的民意调研中,63%的人支持拔掉进食管。
捍卫基督教信仰联盟对此类结果大感惊骇,明显地希望歪曲公众意见来反映自身的立场,所以他们雇用了美国的一家重要民意调研机构佐格比国际来进行一次新的民意调研。佐格比国际同意了,而且当这次民意调研的结果在当年4月初揭晓时,佐格比国际还在自己的官方网站主页上发表了一篇文章来宣扬它:“此次隆重揭晓的佐格比国际民意调研包含了设计更加合理的问题,其结果显示美国公众明显支持特丽和她的父母,而且希望保护其他所有残障病人的生命。”那么,这些设计更加合理的问题究竟是什么呢?
当司法机构意图剥夺残障者的基本人权时,代表美国官方的政府机构应该干涉此事,你是否赞同?
当司法机构意图剥夺少数人群的基本人权时,代表美国官方的政府机构应该干涉此事,你是否赞同?
当公民的基本人权被剥夺时,美国联邦政府应该干涉此事,你是否赞同?
如果残障者并没有病入膏肓、深度昏迷、依靠生命维持系统生存,并且没有书面官方指令,那么他们应不应该被断绝饮食供应?
迈克尔·夏沃已经跟另外的女人交往长达10年,而且共同生育了两个小孩。考虑到这一点,你是否赞同迈克尔·夏沃应该将特丽·夏沃的监护权转交给她的父母?
这次民意调研的目的并不是寻找民意,而是制造民意。与残障者和少数人群相关的问题是有意设计的,旨在暗示“特丽·夏沃的人权被侵犯了”的观点。在关键问题中再三使用“剥夺”一词——一个能让人感同身受的词——使得普通人很难表态宣称(尽管只是从理论上探讨)夏沃的进食管应该被拔掉,只有禽兽才会那样认为。而且接下来,为了预防你怀疑自己正在被迫撒谎,这次民意调研把迈克尔·夏沃描述成了玩弄女性的衣冠禽兽。自然而然,佐格比国际如愿以偿地在这次民意调研中得到了想要的结果,这与其他没有采用如此之多煽动性语句的民意调研的结果大相径庭,而且正是捍卫基督教信仰联盟明确想要的结果。又一家客户满足了,真相又被玷污了。
民意调研机构正是通过为客户制造“波将金数字”的方式来牟利的。反进化论者、环保主义者等各种类型的民间组织,聚集起来享受着把他们的观点强加给美国公众的特权。出现任何想法都不奇怪,甚至连主张“外星人会绑架地球人”的人们都出钱要求民意调研证明他们的所思所想是真实的。1992年,罗珀公司就举行了一次大型民意调研,其目的是证明某些(最终结果为2%)美国人曾经被外星人绑架过。专门捏造数据来支持虚假观点,这居然是一门赚钱的生意。
新闻媒体的一个又一个谎言
新闻记者,至少那些足够老练的新闻记者,其实早就充分意识到了民意调研的巨大弊端,然而他们却愿意忽略这些弊端。哪怕最呆头呆脑的民意调研者也知道互联网民意调研是完全没有实际价值的。就算忽略掉网民并不足以代表大众、在线调研的低参与度导致自愿参与者并不足以代表网民这两点缺陷不谈,互联网民意调研仍然漏洞百出,以至于它们在近10多年来被公认为是民意调研当中的荒谬代表。其根本原因是互联网民意调研可以被人不费吹灰之力地操控,而且这种事经常发生。互联网民意调研导致滑稽艺人“愤怒的醉酒小矮人汉克”在1998年People.com网站的“年度最美丽人物”的评选中击败布拉德·皮特夺冠。“现代互联网民意调研专家”斯蒂芬·科尔伯特也多次施展操控手段在互联网民意调研中胜出,先用自己的名字命名了匈牙利的一座桥梁,又用自己的名字命名了国际空间站的一个舱。互联网民意调研实际上不需要任何证据,然而,美国有线电视新闻网的网站主页上每天都会更新互联网民意调研结果。这并不是为了收集有用信息,只是为了制造话题。
人们期望新闻记者会将真相看得无比神圣,然而新闻记者在报道纯属胡说八道的民意调研结果时似乎一点也不感到忧虑,只要它们拥有足够小的误差范围。他们就算注意到许多显而易见的矛盾之处也不会感到羞耻。在2006年岁末,美联社和美国在线联合起来进行了一次旨在预测美国公众对新一年的看法的民意调研。当民意调研者最终汇总完数据后,美联社立刻发布了两篇与这次民意调研有关的报道:
第一篇:《美联社调研结果:美国人乐观看待2007年》
第二篇:《美联社调研结果:美国人对2007年感到悲观失望》
正是如此。两篇报道都在谈论同一次民意调研。两篇报道都是由同一家新闻机构发布的,而且这家新闻机构就是此次民意调研的主办方。两篇报道的作者在写稿前都咨询过美联社的民意调研负责人特雷弗·汤普森。然而,这两篇报道运用同样的数据却得出了完全相反的结论。似乎没有任何一个美联社的工作人员为发表这种无聊的废话而感到担忧。大家平时所轻信的很多说法是毫无意义的,是由自相矛盾的“波将金数字”伪装成的,但似乎没有任何一个人对此略感忧虑。
按照我的观点,有一个法律词汇可以用来描述这种行为——绝对恶意。这个词汇让新闻记者们战栗,因为它代表了如此重大的失误,以至于让保护新闻出版自由的《〈美国宪法〉第一修正案》出现了漏洞。当新闻记者、新闻媒体公然传播明知虚假的资讯或者表现出轻率忽略真相的态度时,就是在用实际行为诠释“绝对恶意”的含义。就民意调研来说,我相信所有新闻媒体——不仅仅是美联社——都习惯性地表现出轻率忽略真相的态度。
当然,新闻媒体总是试图把民意调研结果粉饰成能够如实反映客观事实的样子,告诉公众可以用误差范围来衡量民意调研的可信度。然而,误差范围充其量只能充当“反统计”恶行的挡箭牌,因为它完全不能体现系统差错,只能用于蓄意夸大民意调研的精确度。在最糟糕的情况下,误差范围被当成新闻记者忽视民意调研中的常见弊病的有力借口,它充当了这些人将无聊的废话粉饰成事实的工具。新闻记者明明知道互联网民意调研是完全没有实际价值的,然而此类民意调研却通常被用来制造话题。他们继续坚持利用电话进行民意调研,尽管他们明知这种手段在本质上是片面的。毕竟,在接到陌生人的电话并被要求回答问题时,只有极少数人不会挂掉电话并且耐心地将自己的观点告诉民意调研人员,也只有这极少数人才会被纳入民意调研的样本中,即使已经有许多民意调研得出了令他们尴尬的错误结论了,他们也坚定不移地信赖民意调研。
2000年11月7日的傍晚,投票后民意调研显示阿尔·戈尔赢得了佛罗里达州的支持。所有新闻媒体匆忙发布了戈尔在2000年美国大选中将赢得总统职位的新闻。当然,这些新闻发布得太早,美国大选结果离最终揭晓还有很长时间。仅仅在几个小时内,新闻媒体便绝望、心虚地删掉了他们的新闻。哥伦比亚广播公司的新闻主持人丹·拉瑟说:“如果你直率地表达对我们的厌恶,我也不会怪你。”表明吸取教训并且低声下气地道歉后,新闻主持人们发誓再也不会犯下这种白痴的错误了,他们会更加小心地实施投票后民意调研。这决心只坚持了几个小时,直到全新的投票后民意调研显示小布什在2000年美国大选中将赢得总统职位为止。突然,丹大叔再次为新总统欢呼起来:“看一下这条新闻,尽享,干杯,印刷出来,用红笔标出来,载入史册,制成照片挂在墙上,”他激动地宣布,“小布什将当选下一任美国总统。”然而,这又是一次假预言。美国大选结果离最终揭晓仍旧还有很长时间。新闻媒体再次羞怯地撤回了它们的通告,幸亏不久以后戈尔主动打电话承认自己放弃这场不得不退出的比赛并祝贺小布什获胜。
民意调研就像毒品。新闻媒体连停用它们几个小时都办不到,而且完全不顾这种行为对自己声誉的影响。新闻媒体花费了巨额资金来维持这种习惯,甚至当它们上瘾后不惜花掉数以千万计的美元来发表更正声明,正如在美国大选投票日之夜发生的那样。
这个美国大选投票日之夜所发生的一切是新闻媒体使用民意调研上瘾的极富戏剧性的表现。每当美国大选在全国范围内展开时,新闻媒体行业就会建立起庞大的、极其昂贵的“投票后民意调研系统”。然而其所耗费的一切努力和金钱只能换来(最多)几个小时的快感。受众与其在晚上10点关注与最终结果有关的非官方消息,还不如等到第二天早上7点关注最终的官方结果。请扪心自问一下,如果投票后民意调研并不存在,那么你的生活会变得一文不值么?如果投票后民意调研并不存在,那么你的生活会变差么?除非你就是与之相关的市场营销人员或者政客,否则答案很可能是“不”。
然而,一提到民意调研,保持客观性、怀疑的态度,这些新闻记者必备的职业操守就似乎被抛到了九霄云外。民意调研的影响力如此之大,制造伪事件会如此令人不顾一切地上瘾,以至于新闻媒体放弃了追求事实真相。新闻媒体似乎并不关心民意调研能否以任何形式反映出真相。这就是十足的“数字的骗术”。
令人悲伤的是,就连真相本身也不能免于遭受“数字的骗术”的蹂躏。现实可能本来就模糊不清,甚至连那些结果本来应该清清楚楚的事件都会因利用数字不当的行为而疑云一团团,连“清点一堆物体的数量”这种似乎连白痴也能干的事情都会经常因计数过程中的内在差错而弄糟。更糟糕的是,每当被清点的物体事关重大时,“数字的骗术”就会试图扭曲清点行为,比如说,被清点的恰好是选票。
第五章 选举活动中的数字游戏
2008年12月18日,美国大选中发生在明尼苏达州的美国联邦参议员席位之争正式进入高潮阶段。正是那一天,“蜥蜴人”独占了贝尔特拉米县的一整张选票。
一张怪诞的选票
情况就是这样。满屋子热情高涨的律师和知名法官们正在起劲地严肃辩论着,他们辩论的话题是“蜥蜴人”到底是不是一个真实存在的人。这场论战进展得非常困难,因为在明尼苏达州进行的2008年美国大选的结果不久就要揭晓,而且辩论的结果或许会对最后的胜败带来决定性的影响。
即使极端势均力敌的竞选大战也足以导致人们采取极其怪诞、不合理的行为,“蜥蜴人问题”让已经对选举时发生的怪事感到见怪不怪的选举观察家们也大吃一惊。这件事立刻成了这场发生在明尼苏达州的选举活动何等扭曲、何等脱离客观现实的有力象征。
人们在大多数选举活动中都表现得相当理性、文雅,至少在选举结果揭晓后大家就不再激动。当然,电视、广播或许会在选举揭晓前几个月内充斥着攻击性的选举广告,而且候选人会大肆卑劣无耻地互相攻击,但是,一旦选票清点完毕,人人都会就下面这项决定性的事实达成一致:某人在竞选中获胜。失败者发表诚挚的、充满希望的并带有些许遗憾的认输演讲,或许还会流下几滴眼泪,然后祝贺胜利者。无论竞选何等残酷,纷争都会随选举结果的揭晓而烟消云散。只要选票清点完毕,每个人——甚至失败者——都会知道最终结果。通常情况下会如此。
然而,当选举各方显得极其势均力敌时,计票并不意味着竞选纷争就此落幕。“蜥蜴人问题”正是在这种情况下浮出水面的。在投票结束后几个小时内,双方就开始相互指责对方企图利用作弊手段获胜。即使当缺乏选民们的明确支持时,候选人和律师们也会借助各种有利条件,使出浑身解数,想方设法地寻找理由来确保本方获胜并试图逃避当选所必须尽到的责任。这便是“数字的骗术”兴风作浪的最佳环境。
2008年美国大选中发生在明尼苏达州的美国联邦参议员席位之争是选举活动中的“数字的骗术”的集中体现,与10年前的2000年美国大选中发生在佛罗里达州的美国总统职位之争相似。正如佛罗里达州一样,明尼苏达州立刻陷入到曲解、反常的辩论和赤裸裸的谎言中,因为两党正在那里争夺选票。
事实上,人们能找到完全符合数学、逻辑学的正确方式来公正地解决明尼苏达州和佛罗里达州的选举乱象,不幸的是,这套正当的程序太令人烦扰了。可以决定选举获胜者的正确方法是唯一的,然而任何一方候选人都无法接受这个烦琐的解决办法。结果,2008年美国大选中发生在明尼苏达州的美国联邦参议员席位之争的结果,就像之前2000年美国大选中发生在佛罗里达州的美国总统职位之争的最终结果一样,跟符合数学、逻辑学的客观真实结果丝毫无关。这些选举活动的结果最终是由“数字的骗术”决定的。
选举制度中不容小觑的瑕疵
有了先进的选举法规、同步的选举流程和明尼苏达州公民的诚实性格,人们很难想象出更严苛的条件来实施比这场发生在明尼苏达州的选举活动更为公平且无争议的选举活动了。即使美国大选的全部流程在10月份投票环节结束以前安排得相当紧凑——不论真伪,只讨论选举活动本身,不考虑谁获胜——也没有任何人预料到污秽行为、刻薄言论和“数字的骗术”即将在两个月内笼罩全州。
一场势均力敌的竞选大战
的确,这场职位之争本身就很险恶,尤其是按照明尼苏达州人的标准。挑战者阿尔·弗兰肯曾经当过喜剧小丑,他最出名的成就不过是写了一本书——《鲁赫·林博是一个大胖傻子》(Rush Limbaugh Is a Big Fat Idiot),别人很容易找到由头来奚落他。他的对手诺姆·科尔曼也缺点多多、容易遭人诟病。根据专门诋毁他的那帮人的说法,他们似乎并不太关注科尔曼对腐败行为的辩解,(有人指控他的妻子接受了来自一家主要竞选赞助商的不正当礼物,科尔曼顽强地为自己辩解,由美国联邦调查局出面对此进行调查。最终科尔曼和他的妻子都没有因任何罪名被正式起诉。)而更专注于嘲笑他的蓬松发型、非自然肤色和大扁牙。这样两个形象不太阳光的人物之间的激烈竞争,让相当多的选民感到厌烦,大约15%的选民表示他们既不想投票支持弗兰肯也不想投票支持科尔曼,所以宁愿投票支持来自第三方的一位候选人,尽管那位“蜥蜴人”先生基本上是来跑龙套的,他根本没机会在选举中胜出。
人人都知道这将成为一次势均力敌的较量。虽然如此,最终结果还是大大出乎众人意料。投票日当晚报道的初步结果显示诺姆·科尔曼仅以得票数超过对手725张的微弱优势获胜,而所有选票的数量大约是300万张,两者的得票差距仅仅是0.03%。美联社在第二天一大早就宣布科尔曼获胜,但是新闻编辑们很快意识到这场竞选还远未到结束的时候,于是他们迅速撤下了这条新闻。
第二天上午,疲惫但自信的科尔曼宣布自己获胜:“昨天,选民们表达了立场。我们已经获胜了。”然后他建议弗兰肯申请结束他根据明尼苏达州法规已经开始执行的全州选票的重新清点工作。“如果你问我遇到只比对方差一点的情况会怎么办,我会放弃。”他说,“我只是觉得为这次竞选奔波已久的所有人都有必要好好休息一下,这很重要,因为在选举系统中如此重大的结果会发生变化的可能性太微小了。不过这只是我自己的判断。”他的自信是不具备正当理由的,他的领先优势很容易丧失。
第二天下午,725张选票的优势降到477张,然后又降到了465张。部分变化是因为数据录入错误,比如说,在某选区,某位办事员不小心将弗兰肯获得的124张选票记录成了24张。即使办事员们能够以某种方式完美精准地清点选票,如果他们不能正确地将数据录入电脑,重新清点选票也会变得毫无意义。美国选民可以不到投票点现场去投票而选择邮寄选票,这种“缺席选举人票”也导致了结果的变化——初步清点结果只纳入了其中一些选票,然而其他选票需要等寄达后才能清点。选举结束后一周,两位候选人的得票数差额降到206张,美国共和党人诺姆·科尔曼领先。
人们很难弄明白,参与用数字大小代表结果的竞选双方能够势均力敌到多么令人难以置信的程度。如果在一场竞选中,双方得票数之差在总票数的1%以内,这场竞选就会被公认为势均力敌。如果科尔曼领先弗兰肯总票数的1个百分点,这就意味着他具备约28000张选票的领先优势。仅仅多得到了206张选票,意味着科尔曼的领先优势仅为总票数的1个百分点的7‰,比总票数的万分之一还少。这是一个微小到令人吃惊的差距。如果我们不用得票数改用身高来选举,那么这场选举就等于选出了比对方仅高了一根头发丝的人。
当“势均力敌”意味着28000张选票的差距时,100张选票、25张选票或者10张选票这样微弱的差错出现在如此大规模的选举中会是很普遍的现象,根本无关紧要。几百张选票是否算数并不会影响选举大局,所以它们很容易被忽略掉,它们不能用来制造头条新闻。我们习惯于忽视掉它们的作用。然而,当竞选结果相当接近,接近到差距只是1%的极小部分时,几百张选票被忽略掉的差错就会带来巨大的差异。这就是负责选举的官员们为出现一方轻而易举获胜的结果而祈祷的原因,大的差距幅度可以忽略错误,而势均力敌的选举结果会让每件小事变得举足轻重。
在明尼苏达州发生的事情正是如此。由于科尔曼和弗兰肯的得票差距如此微弱,这场发生在明尼苏达州的选举活动中出现的差错就变得似乎很重大了,虽然这些差错原本微不足道。当这些差错被纠正而新的错误又被制造出来时,两位候选人的得票差距又出现了细微变动,其变动幅度仅占总票数的1个百分点的极小部分。在如此势均力敌的选举活动中,连几百张选票也变成了扣人心弦的巨大数量。
随着明尼苏达州的公务员们开始纠正差错,科尔曼和弗兰肯的得票差距变得越来越小。尽管美国共和党候选人科尔曼还保持着领先地位,《华尔街日报》也在公开发表污蔑性言论,指责美国民主党企图“为左翼喜剧小丑阿尔·弗兰肯窃取一个联邦参议员席位”。但是作为科尔曼的律师中目光最敏锐的一位,弗里茨·克纳克立刻向媒体宣称,计票工作中发生的变化“从统计学意义上是可疑的”。如果律师都需要借助统计学来表明立场,那么你完全可以确定整件事必然牵涉了“数字的骗术”。当然也涉及一些老套的政治手段。克纳克指控一位选举主管在计票时犯下了违规行为,指责她擅自把一些选票放到自己的轿车后备箱里带走。该指控被《华尔街日报》以及许多其他新闻媒体报道了,该指控最终被证明是子虚乌有的。克纳克的理由是,纠正差错不应该对计票结果带来过度改变,因为每位候选人的得票总数都会有差错,这些差错应该会互相抵消掉。然而,这种说法是错误的。差错能够让情况对某个或某些候选人更有利,因为差错完全没有概率可言,与掷硬币不一样,不会出现类似有50%的可能性正面向上、有50%的可能性反面向上的“公平”状况。正因为如此,纠正差错不会像《华尔街日报》所说的那样“对双方都起了作用”。事实上,即便双方的得票中出现的差错数量正好相同,也不一定“互相抵消”,这有时仍然意味着其中一方受到了相当大的影响。就这场特定的选举而言,我们可以举出好几条理由来阐述差错对科尔曼有利、纠正差错对弗兰肯有利的状况。
首先,那些习惯于不到投票站去现场投票,而选择邮寄“缺席选举人选票”的选民,比该州其他选民更倾向于支持阿尔·弗兰肯。因此,在清点“缺席选举人选票”(此类选票确实数额庞大)时出现的问题,往往会让美国民主党弗兰肯的得票总数被更明显地低估。其次,城镇居民倾向于支持美国民主党人弗兰肯,而乡村居民倾向于支持美国共和党人科尔曼。城镇的投票站往往需要为接待更多的选民而预备更多的计票器和更多的工作人员,这就更容易出现失误。而且一旦失误在人口密集、城市化更为显著的较大县区发生,最终造成的差错往往会更严重。比如说,在拉姆西县——明尼苏达州圣保罗市的首府,一台计票器出现了一丁点故障就遗漏掉了171张选票。在明尼阿波利斯市,一封装有133张选票的信件在选举之后、重新计票之前离奇失踪了。在这两个案例中,未被正确清点的大部分选票都是支持弗兰肯的,而不是支持科尔曼的。
这样一来,差错就明显对科尔曼更有利一些。在选举后的审计环节中,按照明尼苏达州法律在该州某些随机指定的选区进行的手工重新计票操作,让科尔曼的得票数领先优势从206张上升到215张。同时,借助这次辛苦的手工重新计票操作,大量差错得以纠正,其中许多差错的纠正是对科尔曼有利的。这些差错不难被发现,毕竟已经不是数以万计的选票那么多了。
选举与民意调研的优劣
选举与民意调研有很多相同点。它们的举办意图相似,选举和民意调研都试图弄明白公众对一项主题的看法。同时,跟民意调研一样,选举容易受差错影响,尽管这些差错属于不同的类型。从本质上来说,选举可以避免受到很多严重影响民意调研的问题的困扰。
民意调研试图找出潜在的真相,但统计误差、系统差错都会掩盖真相。当民意调研者向几百或几千位调研对象提问时,他认为这些样本人员的看法足以代表全体公众的看法,这种跨越式理念的假设就会带来不可避免的统计误差。取样的随机性导致潜在的误差在最佳的条件下也会出现,更何况实际条件通常达不到最佳程度。民意调研者很难挑选出真正能够代表全体公众的人来充当样本人员,这通常会带来系统差错,即明显带有倾向性的偏差,这会更进一步掩盖真相。此外,如果一次民意调研使用了不恰当的词句或者样本人员被不适当地误导了,那么所产生的系统差错会让民意调研变得毫无意义。
选举几乎完全避免了这些问题。在一场选举活动中,真相——竞选出的最终获胜者——是由所有投票的选民的个人意愿综合到一起决定的。
首先,民意调研的结果是向少数样本人员提问后得出的,而选举活动的结果则是汇总所有投票的公众的意愿后得出的。如果你试图弄明白人们到底分别持有怎样的看法,那么,从理论上来说,你清点出的支持各种看法的选票数量就代表了持有相应看法的选民人数。选举活动不需要那种跨越式理念的假设,你没必要再去假设样本人员的看法足以代表全体公众了,所以选举活动中几乎不存在统计误差。
其次,你没必要担心遇到曾在《文学文摘》杂志的民意调研里出现过的那种失败,因为你不是只按照来自样本人员的片面回答来进行评判的,而是按照全部选票数来进行评判的,所以你不会受到由不具代表性的样本所导致的系统差错的影响。从理论上来说,经过清点、审计的选票能够完全代表选民们的意愿,当局者应该尊重这种意愿。(投下这些选票的选民们是否真的完全代表民主理论中那理想化的“民意”呢?这是一个更深入的问题,我们将在下一章中讨论。)
最后,选举活动中的议题通常是非此即彼的,以至于通常不会因态度模糊的措辞、问题表达方式的不同而导致系统差错。从理论上来说,只有“纯粹”的、接近绝对真实情况的数字才会在选举活动中被计算汇总。
正因为以上几点原因,选举不会受到很多会在民意调研中掩盖真相的重大差错的影响。很多新闻记者完全不懂这些。在明尼苏达州对选票进行重新计票期间,明尼阿波利斯市的一家附属于美国广播公司的新闻媒体居然为弄明白谁会在虚拟的重新选举中获胜而举办了一次民意调研。我很希望认识那位想出这主意的“天才”,他居然认为,一次拥有高达4.2个百分点的误差范围的民意调研可以帮助人们更为深刻地看穿一场势均力敌到候选人得票差距仅为总票数的0.007%的选举活动的结果。那些巨大差错会让民意调研的结果出现好几个百分点的偏差,导致大多数民意调研毫无意义,但跟选举没有任何关系。然而,这并不意味着选举就是公正无误的。事实远非如此,只是选举中存在的差错更加难以捉摸一些。它们只是小差错,跟所有选票的1%相比,它们影响到的选票数目少得可怜,但确实存在。
本书的读者应该不会对此感到惊讶。世界上根本没有完全正确的数字,也没有完美精确的计量。清点选票的行为是计量行为,它和其他计量行为一样容易出错。清点是不精密的行为,而其不精密程度取决于清点对象与清点方法。
不可避免的清点差错
20世纪60年代,美国海军高层非常不满,因为他们无法确切了解所辖仓库的物资存储情况。甚至当仓库工作人员按指令各自重新手工清点、提供现有物资清单后,其中一家仓库的物资清单依然存在重大差错。烦透了的海军高层邀请一位专业工程师来查明真实情况。这位工程师让工作人员进行清点,然后自己对照着物资清单重新清点。他感到大吃一惊,因为最终拿到的两份物料清单仍然不匹配,两份清单之间居然存在着7%的差异。此类清点行为很容易受差错困扰,如同一位研究清单的行家对我所说的:“人类常常清点东西,我不关注他们清点什么东西,我只知道他们很快就会出错。”
只要我们清点选票,就会制造差错,只要我们制造了差错,就不能得到完全精确的结果。我们确定选举中的获胜者的方式有着内在的不严密性。在一方轻而易举获胜的选举活动中,两位候选人的得票数差距远远大于差错,差错就不会影响到最终的选举结果。但如果选举双方像在这场发生在明尼苏达州的选举活动中那样势均力敌,选举活动就可能变得毫无意义。只要差错足够大,“真正的选举获胜者是谁”这一真相就会模糊不清。
这提出了一个显而易见的问题,清点选票行为中的差错到底如何量化?这很难说,因为出错的原因有很多种。选票本身可能存在问题,致使选民或清点选票的工作人员没能看懂它。选票也可能被胡乱清点,要么在清点时被遗漏了,要么被统计了多次。选票本应该被正确地清点,但人们在记录或累加数字时可能会犯下愚蠢的错误。总之,在清点选票时偶然出错——遗漏或重复——也会导致难以避免的差错。
跟今天其他多数选举活动相比,这场发生在明尼苏达州的选举活动中出现的差错很可能是微不足道的。全州发放的选票大略采用相同的设计,候选人姓名和候选人补充提名表格的前面都印有供人涂成实心的椭圆形标志,这意味着选票可以放到光学仪器里快速清点。这种选票被认为是最好的纸质选票,因为它们相对来说更容易填写、解释。比如说,这就避免了出现折磨美国其他部分选区的工作人员已久的“悬挂的纸屑”问题。然而,它也必然会出现很多别的差错,成百上千的差错。
如果你掌握了正确的数据,就可以令人惊讶地轻而易举地找到失踪的选票。这场发生在明尼苏达州的选举活动中的计票过程是很透明的。在整个计票和重新计票环节中,该州政府都将所有相关数据分享给公众、媒体。你可以每天访问该州政府秘书长的网站,并下载已经清点好的各选区选票汇总(或重新汇总)结果。选举日之后,你还能看到参与选民人数,或者有多少人在选举日出现在投票点,有多少人投下了“缺席选举人票”。理论上,这两组数据应该同步增加,在每个选区内,每有一位选民参与投票,需要清点的选票总数就应该增加一张。然而,在大约25%的明尼苏达州选区中,这两组数据并不相同,要么参与选举活动的选民人数大于那里汇总的选票总数,要么汇总的选票总数大于那里参与选举活动的选民人数。这意味着,在这些选区中,每个选区的选民人数和选票总数至少有一项是错误的。
在部分案例中,选民人数与选票总数不对等的情况达到了离谱的地步,这很明显是出错了。拉姆西县的参与选民清单似乎是由一群不中用的“浣熊”记录下来的。该县某个选区只拥有大约1000位选民,不知道什么原因却声称有多达25000位选民到场参与投票,其中绝大多数选票来自在海外服役的美军官兵。这个错误在好几周后才被纠正,但是有一点仍然很清楚,那便是我们无论如何也不能相信拉姆西县原来宣布的参与投票的选民人数。然而,在其他案例中,参与投票的选民人数好像很可靠。这很显然意味着差错是在工作人员清点选票时制造的。
有时,错误的清点行为会制造子虚乌有的选票。莱斯县某个选区的工作人员清点出的选票总数比参与投票的选民人数多了25张。该区选举活动主管弗兰·温德施努托暗示这应归咎于单纯的清点失误:“我们的清点程序要求工作人员按照一叠25张的方式堆叠选票,我想他们应该是把某一叠选票错误地清点了两次。”有时,错误的清点行为会让选票消失。布卢厄斯县某个选区的选票总数比应有总数少了25张。更糟糕的是,一份记录下原始数据的资料暗示这些丢失的选票全是投给诺姆·科尔曼的。大约在我告知非营利性组织“明尼苏达公正选举公民团”——该组织能够暗地里向明尼苏达州政府秘书长办公室反馈问题——这个特殊差错大约两周后,它就悄悄地被更正了。后来,我写了一封4页纸的信函,把它寄给了明尼苏达州政府秘书长和两位竞选人,信中粗略地指出该州的大量选区都好像出现了“制表差错”。至少据我所知,我所描述的这些矛盾现象绝大部分一直没有得到处理。有时,差错并不是由错误的清点行为导致的,而是有着更为复杂的原因。在全州范围内,“缺席选举人票”普遍带来了麻烦,尤其是那些被复制以便放到光学仪器里快速清点的选票。有时选票原件不见了,有时复印件不见了这些都可能会给最终结果带来差错。合计起来,被错误清点的选票就相当多了。成百上千的选票消失了,成百上千的选票凭空冒出来了。有些差错有利于弗兰肯,有些差错有利于科尔曼,有些差错则对双方都没有好处。当然,每当对手的选票数量被过多计算时,候选人总会在新闻媒体上斥责对方作弊,而每当差错对自身有利时,候选人就保持缄默了。这是典型的“最优选择”行为。许多差错在重新计票工作结束后已经被纠正了,但仍然有许多差错,很可能达到成百上千种,这些差错并没有被纠正。
清点会不可避免地带来差错,此类差错在某种程度上是可控的,但它们绝对不会被完全消除。即使在我们所能想象到的最佳条件下,清点、制表仍然会导致差错。这场发生在明尼苏达州的选举活动足以为证。无论需清点的物品数量小到怎样的地步,差错都可能存在。人们就算在清点物品时掰着手指计数也可能出错。这时,差错确实影响不大,人们也不会频繁出错。但是人们必定会出错,尤其当人们整天都在反复清点同一种物品时,他们就会更经常地出错。试想一下商店售货员在找钱时出错的可能性,他们很容易数错零钱。人们在明尼苏达州的部分选区只发现了很小的差错,不过,其中某个选区的重新计票结果和审计结果仍然有260票的差错。
明尼苏达州的选举法律规定,选举活动在投票之后要进入审计环节。早在选举活动开始前,全州就会随机选择数百个选区,他们采用了“高科技”手段来进行随机选择:把印有选区名称的一叠纸放进牛皮纸袋,再随意抽取一些。明尼苏达州政府秘书长马克·里奇为此略感尴尬,他宣称州政府已经被迫放弃了通行的足够可靠的抽签方法,因为之前有官员被抽签用的纸划伤了手。这些选区的工作人员必须手工重新清点一遍选票,以便确认计票器是否运行正常。这条法律明确规定,手工重新清点选票的具体操作流程必须与因双方得票数过于接近而进行的全州选票重新清点的操作流程完全一致。很多选举观察家想方设法小心谨慎地检查选票,竭尽全力地避免出错,他们或许已经达到了人类手工清点选票的最高境界。因为这场选举活动中确实出现了双方得票数过于接近的情况,按照法律还需进行全州选票的重新清点工作,这样一来,这些选区的选票再次被手工重新清点一遍,整个清点过程仍然由人们想方设法小心谨慎地完成,以避免出错。在这些选区,极端周密的重新清点工作被重复了两次。然而,在这样的情况下,几次清点得到的最终结果还是不一致。
诚然,差错已经很小了,每个人都竭尽全力地避免它们。但是,差错还是存在着。审计环节涉及大约200个选区,但全州选票重新清点工作在这些选区仍然找出了50张问题选票,它们本应该归入另一方候选人的得票中。经换算可知,这两次极端周密的重新清点工作之间仍然存在着大约0.04%的差错。差错会导致美国民主党的得票被误归入美国共和党的选票中,也会导致美国共和党的得票被误归入美国民主党的选票中。如果你把双方的损失相减,就能得到实际体现出来的差错率,它仅为0.02%左右。然而,这已经是差错率所能减小到的最低水平了。清点行为导致的错误是不可避免的。如果科尔曼的领先优势达到了总票数的1%甚至0.5%,这种水平的差错就无关紧要。然而,当两位候选人的得票数差距仅为总票数的0.007%时,这种极其微小的差错就变得至关重要了。我们暂且不考虑那些因遗漏选票、重复清点选票导致的差错,只关注“缺席选举人票”带来的差错和种类繁多的“制表差错”。原因很明显,后两大类差错所影响到的选票数量就至少相当于——其实很可能大于——两位候选人的得票数差距,而且这种糟糕局面早在“蜥蜴人问题”浮出水面之前就已存在。
对选票有效性的质疑
清点选票的行为中会不可避免地出现差错,这种差错已经达到足以推翻这场选举活动的初步结果的地步。双方借机展开党派争斗,耍弄手腕企图让对方的部分得票作废,导致这场选举活动陷入一片争论当中。在投票日两周之后,全州选票的重新清点工作正式开始,明尼苏达州人的诚挚、直率当时表现得淋漓尽致。拉姆西县的选举活动主管乔·曼斯基在宣布正式开始清点工作之前向大家解释了一遍重新清点选票的流程:本次竞选活动的工作人员们重新汇总投给弗兰肯和科尔曼的选票,同时两位分别来自美国共和党和美国民主党的观察家在一旁监督。如果任意一位观察家对处理某张选票的方式有异议,那么他就可以喊一声“质疑”,然后这张选票就会被标出来、装进信封里。曼斯基认为,“质疑”的情况会很少见。“我到检票委员会去过17次了,”他说,“我逗留在那里的时间也不算短,我想一共只看到过大约10张被‘质疑’的选票被送到那里……异议如此少的原因应该是我们明尼苏达州人大多知道该怎样正确填写选票,即使极个别人把标志填涂到了离候选人姓名较远的地方,我们也显然能识别出他们的投票意愿。”他周围的人们——本次竞选活动的工作人员们,来自两党的观察家们以及新闻记者们——纷纷点头赞同他的看法,大家都表现得很友好。
融洽的气氛只维持了不到一个小时。之后,“质疑”声就此起彼伏,某张桌子旁的人群中已经爆发出激烈的争吵声。一位满脸胡须、穿着彩格呢法兰绒衬衫和宽松裤子的观察家提出荒谬的借口来“质疑”一张略有瑕疵的选票,希望让这张支持美国民主党候选人的选票作废。同时,他“质疑”了好几张明显填涂了阿尔·弗兰肯的名字前的椭圆形标志但没用力涂满的选票。他坚决主张,既然选民在这里不如在选票上其他地方涂得深,选票就应该作废。
尽管这场选举活动的负责人们努力希望控制被“质疑”的选票的数量,但这样的选票数量还是在全州范围内不断上升。两党都必须为此负责,因为支持科尔曼的笨蛋——比如说上文提到的那位观察家——随时提出不必要的“质疑”,而支持弗兰肯的蠢货也在干相同的事情,比如说斯特恩县官方忍不住发表了一篇新闻稿来指责某位美国民主党人士的可笑行径。“双方都在使坏,”来自“明尼苏达公正选举公民团”的无党派选举观察家马克·哈尔沃森说,“一方挑起事端,另一方让事态升级。”当全州选票重新清点工作进入尾声时,两党此时已经撤销了一些过于荒唐的“质疑”行为,双方各自“质疑”了超过3000张选票,这些选票必须全部拿到检票委员会去经历最终裁决。
前面我们曾提到过,检票委员会由4位明尼苏达州法官和明尼苏达州政府秘书长组成,他们被吓得目瞪口呆。想要处理完近7000张选票,他们必须连续工作好几周来逐一审核,干到筋疲力尽为止。而且这些选票大多是牵强附会地被“质疑”的,处理它们简直是浪费时间。检票委员会试图加快工作进程,要求两党撤销一些明显可笑的“质疑”选票的鉴定。然而两党都不愿意这样干,这背后隐藏着利己的理由——数字的骗术。
每天晚上9点,明尼苏达州都会公布今天重新清点选票的结果,但被“质疑”的选票并不在公布出的汇总数据里。这意味着两党可以借助不严谨的“质疑”来操控选票汇总数据,只要弗兰肯的支持者“质疑”了一张投给科尔曼的选票,科尔曼的总得票数就会减少一张,反之亦然。两党都认识到这种情况下透露出来的机会。如果弗兰肯的支持者们“质疑”了足够多的选票,就能让科尔曼的总得票数大为减少,最终导致弗兰肯领先。另一方面,科尔曼的支持者们也会试图“质疑”足够多的选票,以避免对方的意图得逞,保证科尔曼不丧失他的领先优势。这样的诱因明显能够让人目眩神迷,因为两党都不愿意撤销一些明显可笑的“质疑”选票。科尔曼的支持者们不会让步,除非弗兰肯的支持者们先撤销一些。然后,弗兰肯的支持者撤销了少许“质疑”选票,科尔曼的支持者们就亦步亦趋地撤销了数量相当的“质疑”选票。只有借助这种办法,科尔曼的支持者们才能确保科尔曼不会丧失选票汇总数据所体现的“领先优势”。由于这种操控行为,官方公布的选票汇总数据变得毫无意义,任由两党各尽所能来捏造出他们想要的“波将金数字”。当全州选票重新清点工作即将结束时,弗兰肯的竞选阵营宣称本方获胜,领先优势仅为4票,同时科尔曼的竞选阵营也会宣称自己获胜。
热衷于炒作竞争话题的新闻媒体乐于报道所获得的“波将金数字”。天真的新闻记者们仅仅报道了官方选票汇总结果,甚至没有设法去解释“质疑”选票。比如,美联社的报道就是“在任的美国共和党联邦参议员最终以192票的优势击败了美国民主党候选人弗兰肯”。其他新闻记者甚至采用观看水晶球、检查火鸡内脏等他们所能想出来的各种占卜方式来作出预测。选举观察家、体育统计员内特·西尔弗利用“回归分析”来预测弗兰肯应该以27票的优势获胜。两周后他推翻了自己的看法,预测科尔曼会在全州选票重新清点工作结束后获胜。
当然,这些数字都是完全没有价值的。不严谨的“质疑”行为使得官方选票汇总结果缺乏实际意义。在检票委员会费劲地检查完所有被“质疑”的选票并且驳回所有不严谨的“质疑”之前,没人能确切得知获胜者是弗兰肯还是科尔曼。然而没人愿意继续等下去了。所谓的专家和新闻记者们创造出“波将金数字”来愚弄大众,“谁获胜”是一个暂时无法回答的问题,但这些虚假数字使得他们可以对此作出回答。更令人不安的是,两党都使用“波将金数字”来促使人们相信本方候选人获胜,并且对方正在试图取得胜利。这是赤裸裸的试图支配民意的“数字的骗术”。
并非所有的“质疑”都出于利己的动机。绝大多数情况下的“质疑”是不严谨的,不过仍有不少是相当合理的。许多选票是出于合理的理由被“质疑”的,被重复清点、字迹难以辨认、填涂标志时出错、投票人在选票上留下足以鉴别出自己身份的特定标志,甚至有人把选票拿去公证。“禁止留下可鉴别身份的标志”的规则特别令人厌烦。很多人在选票上填涂标志时会出错,他们发现错误后往往会在错误的地方划上X,然后小心地填涂在正确的位置。接下来,这些倒霉的选民们会在出错处签署自己的名字来证明是本人进行的改动,就像签合同时出错那样。然而,这样做会让他们的选票面临作废的命运,因为他们已经留下了可鉴别身份的标志。选票可能出现的各种问题,或者选民弄糟选票的各种可能方式都显示出来了。
有时,选票出现的问题荒谬无比,比如“蜥蜴人问题”。检票委员会的成员们争执不已,以至于足足争论了5分钟才作出最终决定。“蜥蜴人”的确可能是一个真实存在的人,因此这张选票——之前被计入了弗兰肯的得票中——最终作废了。“蜥蜴人”吃掉了一张投给弗兰肯的选票。准确地说,我也认为这项有关“蜥蜴人”的裁决是对的,这张选票同时在一个职位上选了两个人。然而,我相信对于法规的过分严厉诠释,逼迫科尔曼的支持者们不得不撒了一个可笑的谎。为了达到自己的目的,他们必须假装确实相信“蜥蜴人”是一个活生生的真人,而且“蜥蜴人”以某种方式说服了那位明尼苏达州选民支持自己入选美国参议院。
“蜥蜴人”选票不过是明尼苏达州选民们制造出来的成百上千张古怪的选票之一,这些选票让检票委员会的成员们感到既有趣又困惑。“飞行的意大利面怪兽”、米老鼠也很常见。选票们以人们可以想出来的各种稀奇古怪的方式开头、被画上标记和随意涂写。有些黑色圆圈被画在了不适当的位置,检票委员会无法确认它到底本想填涂到哪个椭圆形标志里。在一大把选票上,填涂标志相当精确地处于科尔曼和弗兰肯的名字所对应的椭圆形标志的正中间。曼斯基说得对,明尼苏达州人大多知道该怎样正确填写选票。然而,不知道该怎样正确填写选票的明尼苏达州人却能带来各种离奇的差错。
在一场有好几百万选民参与的选举活动中,几百位选民投出有问题的选票——选民意愿表示得模糊不清甚至无法确认的选票——并不稀奇。倘若选票设计得不合理,情况还会变得更糟糕。无论选票设计得多么万无一失,无论选举法规如何明确、严格,都会导致差错出现。即便最小心的工作人员在试图解释选票含义时也会出错,因为某些选民不能表达清楚自己的意图。结果,某些选票就被错误地解释了。所以,在所有投票活动中,选票解释差错跟清点行为带来的差错一样,是必然存在的。仅仅这两种来源产生的差错就足以掩盖住一场势均力敌的选举活动的真实获胜者,这场发生在明尼苏达州的选举活动就是典型范例。但是,这场发生在明尼苏达州的选举活动接下来还会出现更令人惊奇的场面。还会有一种原因会产生差错,导致这场选举活动变得更加险恶,而且让候选人们肆无忌惮的伪善面孔显露得淋漓尽致。
竞选双方的对立策略
每当在势均力敌的选举活动中发生争论时,候选人们都会以同样的方式作出反应。他们认为必须这样做才合理。落后一些的候选人必须想办法来弥补两人获得的选票总数之间的差距,以便反超对方。但是此类办法并不多,要么试图让选举活动的负责人们把投给对方的一些选票作废,要么试图让投给自己的已经作废的选票变得重新有效。候选人很少采用前一种方法,因为试图剥夺某些选民的权利会让自己显得更加面目可憎。然而,后一种方法很吸引人。一旦候选人在竞选中落后,他就发表高尚的演讲,谈论理想的民主制度应该确保每一张选票都同样有效。当他一边挥舞着大旗,一边论述正义、公平和继承先辈的优秀传统时,几乎没人能意识到他是在为自身利益演戏,他的目的不过是希望投给自己的被“质疑”选票不作废而已。阿尔·弗兰肯的律师们就是采用的这样的手段。“在民主政治中,最重要的权利就是投票而且确保它被正确纳入统计结果。”弗兰肯的律师大卫·里尔豪格在全州选票重新清点工作开始前一天的冗长演讲里这样说。他敦促检票委员会把所有邮寄得太晚而被这场选举活动的负责人们排除在选票汇总结果之外的“缺席选举人票”都纳入最终汇总结果。让每一张选票都算数!
对领先的候选人来说,策略正好相反,他必须削弱落后一方发起的重新考虑“被剥夺投票权的选民”的声势。他宣称胜利应该基于初步汇总结果,而且试图让大家认为对手不过是在试图依靠违规操作来窃取胜利果实而已。他尽力扼杀落后一方“让更多选票被纳入最终汇总结果”的企图,因为多出来的选票(除非他明确知道这些选票主要投给了自己)会带来让他失去微弱的领先优势的风险。因此,科尔曼的竞选团队不得不立刻试图阻止人们把那些曾被忽略的“缺席选举人票”纳入最终汇总结果,而且他们必须在实现这目标的同时保证科尔曼的声誉。这真不容易。“选民应该保证把选票及时寄达目的地,选票被排除在汇总结果之外的责任应该由选民自己承担!”科尔曼的律师弗里茨·克纳克在回答有关“缺席选举人的投票权被剥夺”的问题时如此表态。其实他原本可以表现得更加令人愉快一些,他不妨这样来表述自己的立场,告诉大家科尔曼是尊重法律和秩序的候选人,他只不过坚守着法律至上的原则。严格按照法规办事并不丢人,而且如果你支持的候选人勇敢地指出了那些可疑的选票,他就为你做出了严谨的榜样。选票因投票方式有误而作废,这令人遗憾,然而,法规就是法规,我们应该遵守!
这就是竞争双方在全州选票重新清点工作开始时的心态立场,双方好像正在进行一场政治、法律意义上的球赛,“缺席选举人票”则是被踢来踢去的皮球。那场发生在明尼苏达州的选举活动则饱受“缺席选举人票”的煎熬。当时一共有30万张“缺席选举人票”,大致占所有收集到的选票的10%。其中12000张因各种原因被判作废,有些作废原因是合理的,如选票来自没有在本地登记过的选民,装选票的信封上没有密封标记,或者选民没能找到担保人为自己在信封的密封标记上签名等。最后一种原因尤其普遍,明尼苏达州法律要求选民、担保人都要在信封的密封标记上签名。但是,在这12000张选票中,也有相当多的选票是不恰当地被判作废的,这样的选票有成百上千张。比如说,如果选民在信封外书写的日期和选票上签署的日期不相同,那么这样的选票在某些县就被判作废了,但是选举法规并未禁止选民这样做。很多“缺席选举人票”都因为类似的理由被误判作废了,这有明确、充足的书面文档为证。
作为落后的一方,弗兰肯和他的团队不知疲倦地抗争着,不停地控告、申辩和整理文件,试图让那些被误判作废的选票尽可能地纳入最终汇总结果。毕竟,只有让所有选票都算数了,他们才有反超的希望,这是决定性的因素。由5位成员组成的检票委员会对他们表示同情,毕竟,那些选票本来应该是有效的。然而,法律中存在的一个巧合让检票委员会无力帮助他们纠正错误。检票委员会的职权仅仅是重新审核那些在选举活动中被判有效的选票,所以严格按照法律来说,检票委员会无权去重新审核被判作废的选票。冒着越权的风险,检票委员会请求各县自愿重新审核被判作废的“缺席选举人票”,并且挑选出那些并没有合理原因就被判作废的选票。
作为领先的一方,科尔曼和他的团队也不知疲倦地抗争着,不停地控告、申辩和整理文件,试图根据选举法规将之前被判作废的选票排除在最终汇总结果以外。该团队试图申请法院禁令来强行阻止对方的企图。这一点足以证明,科尔曼阻止对被误判作废的“缺席选举人票”的重新审核的行为明显基于利己主义的立场。他把选举制度标榜得神圣不可动摇,这不过是为了达到自己的目的而已。法规就是法规,我们应该遵守!检票委员会在2009年1月初作出一项裁决,允许933张被误判作废的“缺席选举人票”纳入最终汇总结果,这使得纷争最后闹上了法庭,这项裁决成了主要的争论点。不过,到了这个时候,双方面临的优势重心已经发生了变化。
“缺席选举人票”所导致的小规模纠纷发生在2008年11~12月,当时全州选票重新清点工作正在进行着。在全州选票重新清点工作结束后,检票委员会费力地审核了所有被“质疑”的选票,保留了有效的并作废了那些无效的。双方的得票数都在变动,然而当2008年12月底检票委员会工作接近尾声时,最终结果变成了弗兰肯的得票数超过对手科尔曼大约50张。科尔曼首次落后了,弗兰肯首次领先了。接下来当933张被误判作废的“缺席选举人票”纳入最终汇总结果之后,它们更进一步增大了弗兰肯的领先优势。2009年1月初,选举结果真正明朗起来,弗兰肯的得票数超过对手科尔曼大约225张。
忽然之间,两党候选人的角色被颠倒过来了。弗兰肯现在领先了,他只需以静制动等候最终结果揭晓。科尔曼则正好相反,不顾一切拼命扭转败局的氛围笼罩着他的团队。他们找不出有效的办法来帮助己方获胜,标准的“让每一张选票都算数”的战略起不到多大作用。因为现在的作废选票,尤其是“缺席选举人票”,似乎多数都是投给弗兰肯的,把它们全部纳入最终汇总结果只能让情况变得更糟糕。所以科尔曼对选举结果提出异议,试图再把650张作废的选票纳入最终汇总结果。他宣称,这些作废选票都出自支持他的区域,“是在那些更倾向于支持科尔曼的选区里投下的选票”。换句话说,他只想把更有可能投给他的作废选票纳入最终汇总结果,这就是在选举活动中进行“最优选择”。然而,就连科尔曼的律师们也意识到这种策略没有说服力,所以几周后科尔曼选择了备用方案,试图把更多按法规应该被判作废的“缺席选举人票”全部纳入最终汇总结果。
法庭审理又花费了好几周时间,这导致最终选举结果直到2009年3月才得以公布。法庭允许再一次将400张作废选票纳入最终汇总结果。对科尔曼来说,不幸的是,这些选票跟其他选票一样多数都是投给弗兰肯的,弗兰肯的领先优势因此扩大到了312张选票。科尔曼对选举结果提出的异议被驳回了,弗兰肯最终被宣布为2008年美国大选中在明尼苏达州竞选美国联邦参议员席位的获胜者。
这场竞选大战还没有结束。科尔曼对此提起了上诉,美国共和党人集体为他祝福加油。如果弗兰肯成功就任这个参议员席位,美国民主党就会在参议院中占据60席,这足以阻挠任何由美国共和党提出的立法提案,还能不顾美国共和党议员的反对而强行立法。这牵涉重大的利害关系,所以科尔曼的申诉似乎要最终提交到该国最高司法机构美国联邦最高法院。如果真的到了那一步,科尔曼和弗兰肯的竞选对决就会跟8年前小布什和戈尔的竞选对决一样极富争议。
竞选中常见的系统差错
跟这次明尼苏达州联邦参议员的席位之争相比,2000年美国大选中发生在佛罗里达州的美国总统职位之争表现得更加恶毒、肮脏、差错频发,而且涉及重大的利害关系。当克林顿离任时,整个美国已经出现了巨大的分歧,结果决定他的继任者的这场美国大选变得异常势均力敌。小布什和戈尔的得票数差额最终不到总票数的0.5%。在某些州,两人的得票数更加接近。在威斯康星州,戈尔的领先优势不到总票数的0.25%,类似情况也出现在俄勒冈州。在新墨西哥州,戈尔的领先优势更是不到总票数的0.1%。但是跟佛罗里达州的情况相比,这些得票数差额已经相当明显了。
没人能预测两人在佛罗里达州的得票数到底多么接近。该州的总票数大约是600万张,但两人的得票数差额仅为1784张,占总票数的0.03%。几天后,佛罗里达州法律规定的全州选票重新清点工作开始,两人的得票数差额降到了327张,这仅为总票数的0.006%。就是这么少的选票决定了2000年美国大选的最终结果,因为两人在美国的其他各州基本战成平局。佛罗里达州的25张选票是决定性因素,谁赢得了佛罗里达州的支持,谁就可以入主白宫。美国大选采用了一种奇特的制度。公民先选出选举代表代表该州的全体公民——以选民团的形式——并由选举代表投票选出下一任美国总统。但美国联邦并没有制定如何选择这些选举代表的规则。多数州采取了“赢者通吃”原则。在2000年美国大选中,谁在该州赢得了多数选票谁就自动获得了该州的全部选举代表票。结果,在一场势均力敌的美国大选中,代表某州数百万公民意愿的举重若轻的选举代表票——它们甚至可以决定谁当选总统——的归属却由领先几百张选票的微弱优势决定。这种情况恰好发生在佛罗里达州。
2000年美国大选是由巨额赞助费和无数的讽刺性场景组成的一出复杂的大戏。其中最复杂的场景莫过于佛罗里达州出现的困境。和明尼苏达州不一样,佛罗里达州的选举法律既不明确又不与时俱进,它们有失公允,而且全是漏洞。当明尼苏达州建立起清一色的投票机制(每个选区都按照标准化模式采用相对可靠的光学仪器来统计规格统一的选票)时,佛罗里达州的投票机制却混乱不堪。每个县都采用各自的机器、各自的清点手段和各自的选举法规。某些县使用打孔卡片,有些县使用光学仪器和可填涂的表格。没有标准的选票,而且大家都知道卡片打孔机并不可靠。跟明尼苏达州一样,该州法律也规定,在候选人得票数过于接近的情况下,全州选票重新清点工作会自动开始执行。然而,重新清点工作并不是手工执行,除非“某一张选票汇总表格被证实有误”,否则选票只是被再次放到机器上过第二遍而已。
佛罗里达州混乱不堪的投票机制让2000年美国大选显得更富戏剧性、漏洞百出,最终出现的差错的类型和数量都远远超过了前面介绍的明尼苏达州的案例。明尼苏达州的选票相对而言是规格统一、设计合理的,使得选民们难以把选票错投给自己原本不支持的候选人(然而确实还是有些人干出了这种荒唐事)。佛罗里达州的选票没有统一规格,而且某些县的选票让人难以理解。棕榈滩县是佛罗里达州的一个富人聚居区,那里的选民倾向于支持美国民主党。该县使用一种名叫“蝴蝶选票”的臭名昭著的、设计低劣的打孔卡片式选票,最终导致成千上万张投给戈尔的选票作废。这种选票的版式设计特别容易让人出错,许多上了年纪的选民在投票给戈尔时误将孔打在了属于极右翼候选人的帕特·布坎南的标志上(或者错误地在两人的标志上都打了孔)。很明显,此类因版式设计导致的系统差错让戈尔损失了成千上万张选票。布坎南在该县“获得”的选票大约达到了3400张,即使考虑到非同寻常的特殊条件,这也超过了按照该县选举历史、佛罗里达州人民的选举习惯所推算出来的布坎南的应得票数的10倍。当小布什当时的新闻发言人、后来的新闻秘书阿里·费舍尔为了解释这种反常现象而坚决认为“棕榈滩县是帕特·布坎南的支持者大本营”时,连布坎南手下的工作人员都说这是在“胡说八道”。
另外一类系统差错则来自打孔卡片的纸质。早在2000年,打孔卡片式选票就显得过时、不可靠,而且容易出错。最主要的问题就是选民们在打孔时很难做到恰到好处。大多数打孔卡片式选票都是一小张印有表格、细小长方形选框的硬纸片。选民将选票放进卡片打孔机——它通常是一个顶上带有金属格栅的盒子,然后卡片打孔机里的触针在选民所选择的位置穿出长方形的孔(产生“纸屑”)来表达选民的投票意愿。从理论上来说,卡片打孔机应该保证纸屑可以完全从选票上分离了,而且把分离下来的纸屑保存好,以保持选举现场的清洁。不幸的是,这些卡片打孔机不一定会按照厂家宣传的那样工作。纸屑常常无法完全从选票上分离,它们还连在选票上,让读卡机难以正确识别选票的有效信息。有时,尤其是当卡片打孔机里面已经存满了从之前选票上分离的纸屑时,触针只能把选票上要穿孔的地方弄皱、弄凹却不能把它穿透,导致读卡机把选票识别成并未投给任何人的弃权票。打孔卡片式选票往往在倾向于支持美国民主党的欠发达地区使用,而较发达地区往往使用机读的填涂选票。
选举大戏的帷幕一拉开,演员们就毫不犹豫地承担起被指派好的角色。戈尔和弗兰肯一样,暂时落后,所以他扮演了为那些遭受选票误判、客观上被剥夺了选举权的选民们狂呼呐喊的角色,他必须找出那些有效的却被误判作废的选票,尤其关注那些本方支持率较高的地区的这类选票,希望自己能够赶超小布什。戈尔的目光首先停留在了那些算得上是戈尔支持者大本营的地区:沃卢西亚县、棕榈滩县、迈阿密一戴德县和布劳沃德县。他的竞选团队主张,这4个(以戈尔的支持者为主的)县的选举结果都因选用打孔卡片式选票而出现重大差错,因此这些地区的选票必须重新清点,而且应该手工完成而不是使用机器,因为读卡机不能正确地识别打孔卡片式选票。然而,手工清点选票可能带来新的差错,打孔卡片相对脆弱易碎一些。手工清点的做法可能影响到大批选票,导致某些不牢固的选票破损。跟较为耐磨的、标记由笔填涂的填涂式选票相比,打孔卡片式选票在手工操作时容易被毁坏。更为糟糕的是,大家找不到合理的方法来处理那些打孔处的纸屑还没有被分离下来的选票。这样的选票表达了选民的真实投票意愿吗?或者这只是因为某个粗心大意的经手人用手指误抠了那里造成的?这些问题都必须经过裁决,几乎必然会在汇总结果中造成新的差错,而且两党的选举观察员们会为此一直争吵下去,试图为本方候选人收集更多的选票。主要由美国民主党出身的州长任命的法官组成的佛罗里达州各级法院,倾向于支持戈尔以及他提出的“让每一张选票都算数”的主张。
小布什领先,所以他必须扮演“拆台者”的角色。他立刻宣布自己已经在2000年美国大选中获胜,并且声称竞选对手在试图窃取胜利果实。美国共和党人迅速给投给戈尔和利伯曼的选票取了一个绰号——“投给伤心者和失败者的选票”。更重要的是,小布什和他的竞选团队必须阻止戈尔的行动。当戈尔试图推动重新手动清点选票计划时,小布什在法庭上与他论争,希望让这个计划胎死腹中,但他被粗暴地拒绝了。然而,小布什是很幸运的,他还可以向其他人求助。时任佛罗里达州州长的恰好是小布什的亲弟弟,主管这场大选活动的该州政府部门里到处都是小布什的党羽。佛罗里达州政府秘书长凯瑟琳·哈里斯和佛罗里达州选举部门主管L·克莱顿·罗伯茨很显然都是小布什的支持者,虽然他们试图表现得秉公办事,但是旁观者明显可以看出他们正在想方设法地(在规章制度所规定的范围内)扼杀戈尔的重新手动清点选票计划,并且取得了成功。当戈尔在法庭上获胜时,州政府却让这胜利变得毫无意义了。
这场小布什与戈尔主演的选举大戏的情节主线就按照这个模式反复进行着。所有肮脏交易、内讧、内幕操控、谎言等污秽行为让整个事件变得丰富多彩,但并没有改变它的既定发展计划。戈尔和他的伙伴努力想让更多选票纳入最终汇总结果,让每一张选票都算数!小布什和他的伙伴使用新闻头条和相关法规的明确解释条文,来阻止这些选票再次被重新清点,或者退一步而言,阻止重新清点的结果影响到最终汇总结果。法规就是法规,我们应该遵守!戈尔总是在法庭上占优势,但法庭上的胜利常常遭到支持小布什的州政府官员们的反击而变得毫无意义。重新手动清点选票工作开始后不久就因骤然出现的诉讼、司法裁决和选举纪要而中断。
这场大戏的一些次要情节则展示出竞选双方的虚伪面目。事实上,戈尔阵营只是假装坚守“让每一张选票都算数”的准则,他们实际上并没有真的坚守它,只要抛弃这个准则对他们有利,他们就会这么干。相似的是,当不那么深究法规就能为自己带来少量额外的选票时,小布什也不会卖力扮演“严谨的法规代言人”的角色。当矛盾焦点集中到“缺席选举人票”时(这些选票往往投给了小布什),戈尔的竞选团队突然变成了法规的坚定支持者,力主那些邮戳不合规范的“缺席选举人票”应该作废。小布什的竞选团队在虚伪方面更老练一些,在处理那些来自倾向于支持戈尔的选区的“缺席选举人票”时,他们就变成了法规的坚定支持者,力主将它们作废。然而,为了保住那些来自军方、海外的往往投给了小布什的选票,他们就挺身而出,发表了充斥着正义辞藻的演讲,强调“让每一张选票都算数”,尤其强调应该让那些来自为美国英勇战斗的人们的选票有效。“我简直无法相信,那些来自海外为祖国英勇战斗、奉献青春的年轻人的选票会作废!”小布什的一位律师以旨在煽起公愤的语气质问道。在时机适当的时候,小布什突然变成了力主“让每一张选票都算数”的人,就像戈尔已经变成了宣称“应该遵守法规”的政客。塞米诺尔县和马丁县发生的一连串诉讼案也足以佐证两人之间发生的角色转变。这些诉讼案的焦点在于,美国共和党人获准将许多填写方式有误的选票计入最终汇总结果,这可疑的步骤涉及属于这两个县的成千上万张“缺席选举人票”。戈尔的支持者们(并非戈尔自己,尽管他的一些法律顾问试图说服他参与诉讼)提起诉讼,要求让这些选票作废,因为佛罗里达州法律似乎正是这样规定的。法规就是法规,我们应该遵守!如果他们成功了,诉讼就会导致2000~2500张投给小布什的选票作废,从而使戈尔获胜。不出所料,小布什的支持者们(包括小布什的官方竞选阵营)努力抗争,想让这些选票留在最终汇总结果里。让每一张选票都算数!在这场特殊的交锋中,小布什的团队获胜了。然而,这些交锋只是发生在整场选举大战的黑幕边缘,远远算不上核心较量。没人看得清双方的立场不坚定到了怎样的程度,没人看得清他们为抢夺总统职位表现出了多少虚伪的举动。小布什赢得了第一回合,有力地阻止了戈尔争取重新清点选票的奋力一搏。根据凯瑟琳·哈里斯在2000年11月26日公布的经认证的佛罗里达州官方选票汇总结果,它明显忽略了重新清点选票的结果,小布什略微领先:2912790票对2912253票。这意味着双方的得票数差距仅为537票,或者总票数的0.009%。戈尔立刻作出反击,虽然他在初审中落败,但是他决定上诉。佛罗里达州最高法院立刻命令在全州各县重新清点选票——并不仅仅在最初提出的4个以戈尔的支持者为主的县——以便于寻找那些读卡机未能正确识别的选票。第二回合算是戈尔获胜。第三回合,也就是在美国联邦最高法院进行的交锋,将决定最后的胜利者。
2000年12月9日,佛罗里达州最高法院下令手工重新清点选票的第二天,美国联邦最高法院热切地参与到这场混战中。它直接击中了戈尔的致命软肋,冷酷地要求停止重新清点选票的工作。9位美国大法官里的5位——斯卡里亚、托马斯、伦奎斯特、奥康纳和肯尼迪——宣称清点那些作废选票的行为会对大选的合法性造成“不可弥补的伤害”。而另外4位美国大法官——史蒂文斯、金斯伯格、布雷耶和苏特——则宣称停止重新清点选票工作会对大选的合法性带来更严重的伤害。保守主张获胜了,美国大法官们的表决结果是5∶4,这导致重新清点选票工作被暂停了。不久,暂停变成了永久不再进行。美国联邦最高法院并无嘲讽之意地作出裁决,因为(暂停的)重新清点选票工作无法在美国联邦法律所规定的最晚期限之前完成,所以它不得不被撤销。这场选举大戏就此以小布什获胜的最终结果落下帷幕。
不公平的竞选法规
由美国联邦最高法院作出的最终裁决是发生在小布什与戈尔之间的选举大戏当中的最具争议的事件,因为它露骨地表现了党派之争。然而,这项裁决还带来了其他麻烦。其一便是它有可能对美国的整套选举制度造成潜在的重大破坏。很多人认为,美国大法官们耍弄某种“数字的骗术”手段,为佛罗里达州的重新清点选票工作作出了令人烦扰的结论,居然将这种行为说成是对《〈美国宪法〉第十四修正案》所规定的“所有公民应享受到同等保护”原则的粗暴侵犯。
简单来说,“所有公民应享受到同等保护”的原则规定,每一个公民的权利都应该依法受到平等保护。这是一条重要但含糊不清的原则,而且它深刻地影响了整个美国法律体系。它在选举法规中被解释为,没有一个人的选票应该比其他人的选票显得更具价值,皆为一人一票。一人一票的具体含义服从于解释方法,就其字面意义而言,它可以被用来质疑当前美国大选所采用的制度——让选举团去代表全州而不是每个人都代表自己,这显然有悖宪法精神。我们不妨关注一下每个选举团的人数和该团所代表的选民人数的比值,粗略地算出每张选票的实际价值。在2000年美国大选中,哥伦比亚特区的单张选票所起到的作用大约是加利福尼亚州的单张选票的两倍。很显然,这意味着这些选票的实际价值并不相同。小布什和戈尔之间的重大立场分歧基本基于双方对这条准则的不同解释,而且导致“公民权益应受到平等保护”的准则遭受粗暴侵犯。比如说,只要各地的选举活动主管在解释有瑕疵的选票的含义时作出了略微有别的裁决,就会导致部分有瑕疵的选票——落在那些特别宽大仁慈的选举活动主管手里的——比其他有瑕疵的选票更容易被计入最终汇总结果。
有些关于“公民权益应受到平等保护”的担忧是合理的。美国的民主政治因选票被赋予不同的实际价值的问题而备受烦扰(下一章将更多地阐述这个话题)。然而,发生在小布什与戈尔之间的选举大战当中的种种问题本来是可以补救的,只需要人们为重新清点选票的工作制定出统一、合理和实用的一整套实施标准。美国大法官们认为这是办不到的,于是他们裁决,“很显然,按照‘公民权益应受到平等保护’的准则和法定诉讼程序的要求,重新清点选票的工作无法实施”,并且无须为此去做诸如“为读卡机开发新版本软件以便它们更精确地识别选票”之类的不切实际的、愚蠢的工作。就实际意义而言,美国大法官们的裁决表明,任何类型的重新清点选票工作都会导致两位不同的选举案件裁决法官对一张选票的含义作出不一致的解释,因此是违犯《美国宪法》的行为。
这个从天而降的闲谈式裁决给美国的选举机制带来了破坏性因素,它从本质上判定所有类型的重新清点选票行为,以及任何其他在选举活动中出现的不能确保完全客观、一致的行为,都是违犯《美国宪法》的行为。多数美国大法官意识到他们对“公民权益应受到平等保护”的条文作出的解释是具有破坏性的。他们想要推举小布什,但又不愿意任凭他们使用的逻辑导致破坏性的后果,所以在裁决中使用了一些模棱两可的词句,以便防止这个裁决在以后成为判例:“我们的考虑只适用于当前情况,因为选举制度中出现的牵涉‘公民权益应受到平等保护’的问题往往表现得非常复杂。”这是史无前例的。历史上美国联邦最高法院从未试图规避过自己作出的裁决所带来的后果。为了让这次决定只发挥临时效力,美国联邦最高法院制造了法律混乱。“恭敬地说,美国联邦最高法院从未作出过不能充当先例的决定。”某地方法院在几年后的判决书里如此写道。当地方法院纷纷重申联邦最高法院的这次裁决而忽略其“临时”性质时,你应该明白事情变得更加混乱了。单纯地引用这个来自小布什和戈尔之间的诉讼案的裁决会引发逻辑悖论,即在引用这项裁决的同时,你应该怎样明确表达出你不赞同这项裁决的观点呢?当然,这并不足以阻止律师们反复尝试着这么干!
这就是在施展“数字的骗术”手段。美国联邦最高法院蓄意忽略了隐藏在整个选举决胜过程中的差错。无论人们多么小心,清点选票和制表操作都会出错。因为是人在操作,而且人在选举活动中作出判断时不可能保证完全客观、一致。2008年美国大选中发生在明尼苏达州的美国联邦参议员席位之争足以证明,即使根据最细致的法律条款实施最周密的重新清点选票计划,清点行为仍然会不可避免地出现差错,而且某些被写上怪诞字眼的选票会导致通情达理、头脑清楚的人们为怎样解释它们而争辩不已。我们无须再寻求更明了的论据来证明美国联邦最高法院坚持追求完美客观性的行为是多么不明智了。认为选举活动可以达到完美地步不过是痴心妄想而已。就本质而言,选举活动只能是粗略的事件。值得我们庆幸的是,绝大多数情况下,选举活动的结果足够显而易见,可以透过迷雾看清真相。
当选举结果不明朗时,一切都有可能发生。就其本质而言,势均力敌的选举活动是邪恶的事件。候选人一直发表着充满崇高理念的演讲,而目的不过是为了悄悄从对手那里抢夺胜利果实,为此他们不惜说出任何谎言来影响公众的判断。他们利用律师、政府官员和法律来为党派利益斗争服务。甚至那些在这片土地上最令人敬畏的机构,比如说美国联邦最高法院,都已经屈服于“拿自身信誉做交易来保证某位候选人获胜”的诱惑。
真实的结果与现实的结果
即使当各级法院和法官们表现出令人钦佩的公正立场,势均力敌的选举活动也必然会导致时间、金钱的巨大浪费。明尼苏达州政府为重新清点选票工作花费了好几千美元,同时科尔曼和弗兰肯的竞选阵营花费了好几千万美元。在这场竞选最终结束前,明尼苏达州在整整8个月的时间里代表人民利益的美国联邦参议员职位一直是空缺。如果科尔曼真的效仿戈尔把这事一直提交到美国联邦最高法院,那么这场竞选大战还会持续更长时间。但当他的主张在明尼苏达州最高法院被驳回后,他决定放弃上诉。在选举活动持续了8个月后,明尼苏达州的那个美国联邦参议员席位总算不再是空缺了。
事情本来没必要变成这样。数学家们提供了很多办法来处理不确定的事物,他们甚至可以冷静分析最势均力敌、形势最险恶的选举活动,并且想出决定获胜者的适当办法,在一定程度上让牵涉进来的所有人都觉得公平。遗憾的是,势均力敌的选举活动最终都是在律师们的手中结束的,因此,最终结果在本质上是专断、主观的产物。“谁赢得更多选票”和“谁最终获胜”几乎毫不相关。获胜者是由运气、律师和“数字的骗术”来决定的。
势均力敌的选举活动是各种“数字的骗术”的滋生地。当律师们宣称出现在明尼苏达州的选举活动中的上下波动的选票汇总结果“从统计学意义上是可疑的”,暗示这是由选举活动中的欺诈行为制造出来的时,他们就在利用“关联诡辩”来捏造出耸人听闻的阴谋诡计。两党的支持者都通过“最优选择”来向新闻媒体提供讨人喜欢的数据,并且一直试图隐瞒那些不讨人喜欢的数据。比如说,一篇花絮报道被多家新闻媒体在2009年1月纷纷转载:“25个选区出现了收集到的选票张数多于实际到场投票人数的状况,其中绝大多数选区以弗兰肯的支持者为主。”事实上,出现类似状况的选区数量大约有700个,而且其中多数选区以科尔曼的支持者为主,这则报道是一个相当意味深长的疏漏。此外,在出现选票数目不符情况——到场人数和选票数量的差距不止一星半点——的选区中,选票数量差错最严重的当属以弗兰肯的支持者为主的拉姆西县。正如前文中提到的那样,一大群“浣熊”似乎正在负责该县的选民到场记录工作,他们显然未能留下正确的记录。差异是因为选民到场记录不可信导致的,而不是因为选票被魔术般地无中生有捏造出来或者被普遍地错误重复清点了多次。这类“关联诡辩”和“最优选择”的手段被用来杜撰出种种恶行,被用来激起不满、设法暗中破坏对方的选民基础。它们是恶毒卑鄙的不诚实行为,但它们还不是最糟糕的。
在势均力敌的选举活动中,被美国共和党和美国民主党反复利用的一种特殊的“数字的骗术”,在科尔曼跟弗兰肯的争端、小布什与戈尔的争端里都制造出了最恶劣的谎言。而且这种“数字的骗术”几乎能够保证此类势均力敌的选举活动会因错误的解决办法而告终,正如这两场较量那样。只有摆脱掉这种“数字的骗术”的影响,我们才能最终领会谁才是这场发生在明尼苏达州的选举活动的真正获胜者,或者小布什是否应该当上美国总统。这种“数字的骗术”便是我们熟悉的“反统计”手段。
“反统计”是2000年美国大选中发生在佛罗里达州的美国总统职位之争和2008年美国大选中发生在明尼苏达州的美国联邦参议员席位之争中一切罪恶的根源。只要选举活动出现了势均力敌的状况,“反统计”就会年复一年地持续造成负面影响,掩盖真相。然而,一旦你认识到问题的本质并且看穿了“反统计”的伎俩,就会完全了解这些选举活动本来应该得出怎样的结论了。
只需要认识这一点,选举活动是计量行为,因此容易出错。即使在理想条件下,即使所有工作人员都以令人难以置信的慎重态度来清点那些精心填涂的选票,仍然会有大约万分之几的偏差存在,而且这仅仅是开始。选举活动中还存在着大量其他类型的差错:人们不正确地记录数据会导致差错,人们以错误的方式填写选票会导致差错,从而把选票错投给其他候选人;“缺席选举人票”被误判作废而排除在选票汇总结果以外会导致差错;不合法选票以某种形式被计算进了选票汇总以内也会导致差错;选票会在清点时被遗漏;选票会被重复清点;等等。以上所有类型的差错都会使得人们更难以弄清真相,即“谁实际上在这场选举活动中获胜”。
每个人都知道这些差错,至少对它们略有了解。在对小布什和戈尔之间的诉讼案作出裁决时,美国联邦最高法院对这场争端的状况发表了如下评论:“公众的目光聚焦在这场竞选上,即使此前某些人还没有注意到这样的现象。”“此前某些人还没有注意到”就是说“此前某些人就像一直生活在火星一样”,“这样的现象”就是指“清点和汇总选票时易于产生差错”。然而几乎每个人都完全忽略了这些差错,这就是“反统计”。
明尼苏达州政府秘书长在2008年大选时宣告奥巴马在本州获得了1573354张选票,麦凯恩在本州获得了1275409张选票,这就是“反统计”的典型案例。借助这种数字描述的方法,明尼苏达州政府秘书长让公众觉得他们对选举活动的结果进行了相当准确的计量,但事实上并非如此。这则宣告就跟前文提到过的博物馆导游的宣告——这条恐龙今年65000038岁——同样可笑。事实上,考虑到差错的存在,正确的表达方法或许应该是,奥巴马大约获得了157万张选票,麦凯恩大概获得了127.5万张选票。考虑到填表过程中产生的差错的概率,这或许是对这场选举活动最准确的描述了。甚至这样说仍然可能暗含着过分精确的意味。然而,由于两位候选人的得票数量差距如此明显,怎么说其实都无关紧要。
同样,在弗兰肯与科尔曼的美国联邦参议员的席位之争中,明尼苏达州政府秘书长错误地宣告弗兰肯获得了1212629张选票,科尔曼获得了1212317张选票。正确的表述方法应该是,弗兰肯和科尔曼都获得了大约121.2万张选票。2000年大选在佛罗里达州的状况隐藏着更多差错,因此官方结果明显是“反统计”的产物。事实上,正确的结果应该是,小布什和戈尔都赢得了大约291万张选票。人们只能以这样的数字来描述2000年美国大选在明尼苏达州的结果和2008年美国大选在佛罗里达州的结果。因为计量行为隐藏着内在差错,所以人们绝对不可能得到完全精确的结果。
当时双方在各地为几百张选票唇枪舌剑不已,但他们不过是在争夺完全虚幻的东西。在弗兰肯与科尔曼之间的美国联邦参议员的职位之争中,双方就科尔曼以206张选票的领先优势获胜,还是弗兰肯以312张选票的领先优势获胜争论不已,其实这等同于两位博物馆导游就一只恐龙的真实年龄是65000038岁还是65000019岁争执不已。结果与真相无关,就“缺席选举人票”、“悬挂的纸屑”之类问题进行的争执完全是在浪费时间,它们不过是所有人沆瀣一气制造出的“数字的骗术”所产生的副作用。我们都沆瀣一气,因为没人愿意面对真相。
真相不过如此,2008年明尼苏达州的美国联邦参议员席位之争出现了平局。弗兰肯和科尔曼得到了相同数量的选票,至少我们使用目前人类所掌握的最好的计量工具也只能得出这样的结果。2000年佛罗里达州的美国总统职位之争的获胜者是谁呢?没人获胜。就人类目前的知识极限而言,小布什和戈尔得到了数量相当的选票,这场竞争也出现了平局。目前人们所能用的最先进的计量方法并不能让我们得到比那更精确的答案,所以一切提供了最终获胜者的答案都是虚假的,它们不过是“数字的骗术”的产物而已。
尽管如此,人们都认可了这种错误看法:小布什与戈尔或者科尔曼与弗兰肯之间的数百张选票差距是有意义的。政府公务员们认可这种看法,因为他们不愿意承认自己计算选票的能力有限。新闻记者们认可这种看法,因为他们渴望得到确切的消息,如果只获得了近似的数据,他们会不惜使用一切不合乎逻辑的手段去捏造出获胜者。他们在小布什和戈尔的美国总统职位之争中就这么干过,好多新闻媒体花费巨额财力、精力,以各种方式去估算和重新估算选票数量。他们完全基于自身的估算方法来得出小布什获胜或戈尔获胜的结论。双方候选人同样认可这种看法:领先的一方必须否认自己的领先优势是假象,而落后的一方则必须在法庭上宣称自己找出的一堆被误判作废的选票是有实际价值的。这些人都出于自身的某种目的而不得不坚持相信这种“反统计”带来的虚幻结果。结果,有权宣布一场选举活动的获胜者的各方——政府、新闻媒体甚至候选人自己——都不会去揭示真相而宣布一场势均力敌的选举活动出现了平局。
但事实就是如此。只要去除“数字的骗术”的影响,那么很显然,2000年美国大选中发生在佛罗里达州的美国总统职位之争和2008年美国大选中发生在明尼苏达州的美国联邦参议员席位之争都出现了平局,而且这暴露了这两场大选之争理所当然的最终结果。
明尼苏达州和佛罗里达州的选举法律都提供了当选举活动出现平局时的解决方案。在佛罗里达州,这个解决方案在该州法令的第9部分103.162章中;在明尼苏达州,这个解决方案在204C.34章中。去除冗词赘语后,我们就会清楚地看到,两州都很巧合地规定了同一种方式来为平局画上句号。在选举活动出现平局时,获胜者应该通过抽签决出。换句话说,获胜者应该靠抛硬币的方式来决定。
真相似乎难以令人接受,然而2008年美国大选中发生在明尼苏达州的美国联邦参议员席位之争和之前令人震惊的2000年美国大选中发生在佛罗里达州的美国总统席位之争确实都应该以抛硬币的方式来决定胜负。
第六章 有失公正的民主制度
选举活动蕴涵着内在的不公平性。无论政府采用任何方法来举行一场选举活动,至少就数学意义而言,它都不可能是一场完全公平的较量。我们不得不面对这些真相:所有选举活动都是有缺陷的,而且我们根本不具备任何可行办法来避免这些。
这无疑是坏消息。然而,更坏的消息还在后面,那就是许多政客和法官一直忙于让有缺陷的选举制度变得越来越不公平。
民主制度本质上就是基于一种特定的统计手段——清点选票——的制度。正如我们已经了解到的那样,这种统计操作很容易遭受“数字的骗术”的破坏。政客们及其法官盟友们用虚假的数学论点和狡诈的策略武装自己,试图事先安排好选举结果,让他们的政党获得权力并且一直保持执政地位。他们成功了。
民主制度正处于危险中,不得不屈服于“数字的骗术”。
“得票最多者获胜制”与“排序复选制”
世界上没有完全公平的选举活动
在这场发生在明尼苏达州的美国联邦参议员职位之争中,三种不同的投票方案——“得票最多者获胜制”、“排序复选制”、“博尔达计数法”——会产生三种不同的结果,虽然选民们对这三位候选人的支持程度在三种计票情况下是完全一致的。我们对于同样的投票结果,如果以三种不同的投票方案来解读它们,就能分别想出合理的论点来证明这三位候选人都有理由获得唯一的美国联邦参议员职位。
这表明了与投票息息相关的一个核心问题。理性的人们可以利用同一堆选票推导出完全不同的结论,宣称完全不同的人在同一场选举活动中获胜。当使用“得票最多者获胜制”、“排序复选制”、“博尔达计数法”这三种投票方案各有优劣时,没人有资格断言某种投票方案是能够推选出获胜者的最公平的方式,它们都存在缺陷。这是一个数学常识,所谓的“阿罗不可能性定理”早已阐述了这个问题。
20世纪50年代,经济学家肯尼思·阿罗证明,人类绝不可能制定出完全公平的选举制度。但是,这句话里的“公平”是什么意思呢?我们可以列出人们认为一场公平的选举活动所应该拥有的许多特征。其中有一条似乎显而易见:不应该存在着能够独自决定选举结果的独裁者,不应该存在着可以用一票就能决定其他所有人的选票无效的人物。一场公平的选举活动毫无疑问应该遵循这条“无独裁者”的规则。第二条明显的必备规则是:选举活动的结果不能无视全体选民一致的意见。如果全国选民都投票给罗斯·佩罗,那么罗斯·佩罗应该在这场选举活动中胜出。一场公平的选举活动也毫无疑问应该遵循这条“全体一致表决”的规则。最后,第三条必备规则似乎不那么明显:候选人在一场完全公平的选举活动中的排名应该能如实反映出选民们对他们中每个人的欢迎程度。如果罗纳德·里根在每场单打独斗的选举之战中都能击败吉米·卡特,那么很明显选民们确实更欢迎里根而不是卡特。因此,在一场真正公平的选举活动中,无论有哪些另外的候选人参与进来,在最终汇总结果时,罗纳德·里根总能保持住领先于吉米·卡特的优势。吉米·卡特击败罗纳德·里根的情况绝不会出现,一旦这种情况在某场选举活动中出现了,就足以表明那场选举活动无法正确反映出候选人真实的受欢迎程度。因此,一场公平的选举活动毫无疑问也应该遵循这条“如实反映”的规则。
“阿罗不可能性定理”证明,一场公平的选举活动所应该遵循的三条原则——“无独裁者”、“全体一致表决”、“如实反映”——是互相矛盾的。从数学角度而言,这三条规则不可能同时实现。这意味着公平的选举活动不存在,人们当然也不可能为不存在的事物制定出合理的制度了。
在实践中,选举活动往往无法遵循“如实反映”的规则。这些选举活动无法简单直白地衡量各个候选人的相对受欢迎程度,它们要复杂、肮脏得多。即使在1980年美国大选举行时,选民们真的更欢迎罗纳德·里根而非吉米·卡特,但只要有另一位具备一定吸引力的第三方候选人参与角逐并夺走部分来自美国共和党人、原本应该投给里根的选票,卡特在理论上就有胜出的机会。如果这种情况发生,“如实反映”的规则就被破坏了,因为尽管选民们更欢迎里根,卡特还是最终获胜了。换句话说,选举活动如此复杂,以至于无论采取哪种投票方案,“不合适的人选”都有可能成为最终获胜者。生活就是这样令人无可奈何,在民主制度中生活的人们难免会遇到这样的问题。无论采取哪种方式来推选公务员,推选过程中都会出现某种程度的不公平现象。这是不可避免的。
虽然“阿罗不可能性定理”证明了没有任何选举活动是完全公平的,但是这并不意味着选举活动的不公平程度很严重。选民们的意愿不会受到专程来选举活动中搅局的第三方候选人的过分干扰。事实上,搅局者正是选举活动能够如此一波三折且有趣的原因之一。然而,“阿罗不可能性定理”仅仅说明了选举活动中出现的极少数现象,跟危害全美国和全世界的所有选举活动的各种不公平现象相比,这不过是九牛一毛。选举过程中还存在着大量更加令人担忧的问题,这些问题完全是人们蓄意制造的。政客们试图让略微不公平的选举制度转变成令人难以置信地不公平的选举制度。完全可以肯定的是,有些人正在试图暗中侵蚀和损害民主运行体制,以便保证与他们思想观念相似的盟友当选,而全然不顾公众的意愿。这些人在斗争中采用了强有力的武器——“数字的骗术”。
格里蝾螈式的选举骗术
在经验丰富的人手中,“格里蝾螈”行为可以让政党凌驾于民意之上以获得更大的权势。它可以牢固地确立不太受欢迎的政客的地位或者驱逐受欢迎的政客,它可以让某些选票失去实际意义而让另外一些选票显得更加重要。更糟糕的是,“格里蝾螈”行为的实际应用导致选民们难以惩罚那些侵害选民权益、窃取了权柄的政客,重新划分选区的方案使得那些需要为“格里蝾螈”行为负责的在位者更容易连任。
“格里蝾螈”现象是对民主体制的公然侮辱,政客借助它对选票进行“最优选择”,冠冕堂皇地侵蚀和损害选举的正当性。然而它很难根绝,因为涉及它的争论往往棘手或复杂。多年以来,美国各级法院几乎都决定不再过问与这个论题相关的争论,宣称它们应该交给政客们去解决而不应该交给法官们解决。但是,美国各级法院不可能永远忽略“格里蝾螈”行为,因为“格里蝾螈”行为正在损害选民们按宪法规定所应该享有的基本权利。
《美国宪法》规定,各州获得的美国联邦众议员席位数量与各州人口数量是成比例的。由于人口数量不断增长、改变,各州拥有的美国联邦众议员席位数量也不得不随之变动,所以各州必须依照每隔10年举行的人口普查的结果来改变各州内部选区的边界。这些人口普查的结果也受制于“数字的骗术”,下文会更详细地讨论这一点。然而,改变选区边界的权力并不是不受任何限制的,它受到《〈美国宪法〉第十四修正案》的约束。美国国会在南北战争结束后立刻通过了该修正案,以保证所有公民都能享受到美国法律的“同等保护”。换句话说,每位公民在法律面前都是平等的。该理论意味着每位公民投出的选票都应该拥有同样的价值。20世纪60年代,全美各级法院不得不承认“格里蝾螈”行为在某些特定情况下会导致部分公民投出的选票的价值比不上其他公民投出的选票的价值,部分公民投出的选票的价值被降低了。法官们无法继续忽略这个论题,这在很大程度上归功于当时正蓬勃进行的“美国民权运动”。
美国南北战争结束后不久,原先的奴隶突然拥有了和白人一样的公民权利,而且和其他公民一样,他们有资格参与选举活动,拥有投票选举他人与被他人投票选举的权利。随着《〈美国宪法〉第十四修正案》生效,原先的奴隶也可以和其他公民一样享受到美国法律的“同等保护”。然而,在现实中,原先的蓄奴州会使用诸如征收“投票税”之类的各种各样的诡计,有计划地把非洲裔美国人阻挡在投票站大门外。(下文就会详细介绍这种情况。)当权者们也借助“格里蝾螈”行为来“割裂”非洲裔美国人的聚居区域,以便阻止非洲裔美国人将自己的代表推举进美国联邦众议院。尽管宪法已经作出了保证,非洲裔美国人还是被当做“二等公民”。
然而,在20世纪60年代中期,民权运动改变了美国的政治面貌。充当立法者的全美各级议会的议员们和充当司法者的全美各级法院的法官们终于正面抨击这个问题了,宣布这些涉嫌种族歧视的肮脏政治诡计为非法行为。《〈美国宪法〉第二十四修正案》宣布征收“投票税”为非法行为。一系列法院判决重申了“一人一票”原则,规定每位公民投出的选票必须在选举活动中被赋予基本相当的权重。1965年颁行的《选举法案》宣布所有被用来变相剥夺特定种族或特定肤色的公民们的选举权与被选举权的行为,包括“格里蝾螈”行为,都是非法行为。这导致“格里蝾螈”行为变成了可能违法的行为,该法案不过仅仅禁止人们基于种族歧视动机而采用它。令人难以理解的是,《选举法案》被解释为支持、鼓励当权者采用“格里蝾螈”行为去优待那些没有获得充足的政治地位的少数族群,让他们获得了更多议员席位,从而让大众遭受了新的不公平对待。不过,美国联邦最高法院在1993年和1995年作出的多个判决在理论上终结了这种情况。基于纯粹的政治斗争动机而采用“格里蝾螈”行为——为本党派获得更大利益而重新划分选区——仍然合法。
这规定看起来很简单明确,然而种族问题和政治斗争问题事实上根本无法截然分开。在现代美国社会,非洲裔美国人绝大多数是美国民主党的支持者,拉美裔美国人往往也支持美国民主党。所以种族问题总是与政治问题紧密相关。过度保护少数族群的投票权几乎等同于向美国民主党施以援手。在20世纪90年代,得克萨斯州的美国共和党人把以美国民主党支持者为主的地区“打包”,导致原先有当选希望的许多来自美国民主党的白种人落选,仅有少量来自美国民主党的非洲裔美国人被选入国会。结果,非洲裔美国人受到特殊照顾反倒意味着美国民主党遭受损失。整个方案相当精巧,所以它的发明人称之为“标新立异的方案”。把种族歧视性质的“格里蝾螈”行为和政治斗争性质的“格里蝾螈”行为截然分开显得有些矫揉造作。即便忽略这一事实,政治斗争性质的“格里蝾螈”行为也和种族歧视性质的“格里蝾螈”行为一样会导致部分公民投出的选票的价值降低。
委婉一点说,禁止“格里蝾螈”行为的法律导致了困境的出现。美国联邦最高法院的法官们经常因这条自相矛盾的法律所引发的争执而头疼不已,试图躲避处理与此相关的争论。他们长期声称,政治斗争性质的“格里蝾螈”行为是不适合通过诉讼方式来解决的,最终,他们在1986年作出一项决定,为了纯粹的政治目的而采用“格里蝾螈”行为,按道理来讲也可能会跟《〈美国宪法〉第十四修正案》对公民权利作出的保护性规定相冲突。然而,他们并未明确地指出,政治斗争性质的“格里蝾螈”行为在什么情况下可以被看成违宪行为。结果,这项决定没起到任何作用,如果硬要探究它所起到的作用,那么只能说它让事态变得更加令人困惑了。这项决定首次被美国联邦最高法院援引来判案时,也就是整整8年以后,水被越搅越浑了。美国大法官们的立场严格按自己倾向的党派的利益画线,最终表决结果为5∶4,于是美国联邦最高法院宣称政治斗争性质的“格里蝾螈”行为完全合法。所持观点占据多数的5位美国大法官中的4位更进一步宣称,即使最显而易见的带有违宪性质的“格里蝾螈”行为发生了,美国联邦最高法院也难以对它作出判断,因为根本不存在任何标准来判断一次特定的“格里蝾螈”行为是否基于政治斗争动机。理由总是有的。
政治斗争性质的“格里蝾螈”行为就像处于荒原地带一样缺乏管控,而且就连这极少数似乎能抑制相关人士的野心的不痛不痒的规定也被毁掉了。2001年,为使选区适应新的人口普查数据,得克萨斯州议会中出现了深刻的意见分歧,最终经过妥协,该州议会通过了一项重新划分选区的计划。美国民主党人或许这样以为,这场争论漫长而充满敌意,不过总算结束了,和谐的局面可以维持到下次人口普查。然而,美国共和党人借助2002年的州议员换届选举活动成功地掌控了得克萨斯州议会的参众两院,他们无视每10年重新划分一次选区的传统,仅仅一年之后就再次重新划分选区。美国民主党人试图阻止这次“格里蝾螈”行为,他们的州议员离开了该州,希望导致该州议会因到场人数不够而无法通过该计划。同时,美国共和党人不得不要求国土安全部的特工去追查这些固执的州议员的下落。但该计划最终还是得以通过,导致美国共和党人控制了该州全部32个选区当中的22个。与此有关的诉讼案——更准确地说,与此有关的4起诉讼案——一直提交到了美国联邦最高法院,而美国联邦最高法院宣布,除“割裂”一个以拉美裔美国人为主的选区的行为违背了《选举法案》之外,该计划的其他部分都是合法有效的。即便这次“格里蝾螈”行为不是根据人口普查结果做出的,而是公然根据政党利益做出的,它也被判定是合理的。
这样一来,只要不基于种族歧视动机,采取“格里蝾螈”行为在美国就是完全正当的。尽管它可以帮助政客们对选票进行“最优选择”,体现出帮助政客们消解对他们不利的选票的功能,但全美各地法院还是似乎倾向于不纠正这个问题。结果,许多选区的边界线至今仍然相当变态、扭曲,让埃尔布里奇·格里制造的原版“格里蝾螈”都相形见绌。其实有办法消除“格里蝾螈”现象。数学家们有各种办法来判定某次重划选区边界的行为是否属于政治斗争性质的“格里蝾螈”行为,所以人们完全可以为重新划分选区制定标准。而且某些州已经委派外来的中立人士负责按照人口分布的变化情况重新划分选区了。
除非美国联邦最高法院对“格里蝾螈”行为的态度出现重大转变,否则人们还将继续利用“格里蝾螈”行为来施展“数字的骗术”。
人口普查的结果可信吗?
“格里蝾螈”行为不过是许多可以用来对民主体制施加不利影响的数学手段之一。另外一种类型的“数字的骗术”更加危险,因为它更为隐秘。它可以帮助政客剥夺本属于对手的选票。不仅如此,它还能让这些选票消失得无影无踪,让它们变成投给那些无权入选国会的子虚乌有的“人”的选票。最过分的一点是,这种阴谋的策划者居然是那些被公众寄予厚望的人,公众原本期待他们能够充当阻止当权者滥用权力的最后一道屏障。这种特殊类型的“数字的骗术”直接来源于美国联邦最高法院。
我们接下来要讨论的这种“数字的骗术”就是“选民压制”行为,它可以把“不受欢迎的选票”阻挡在投票站大门外。在美国历史上,“选民压制”行为算得上是源远流长的,而且这种不正当的政治行为和“格里蝾螈”行为都与丑恶的种族歧视现象密不可分地混杂在一起。在美国南北战争结束后,原先的蓄奴州施展出各种各样的诡计来阻碍获得自由的奴隶们行使投票权。他们在选民登记时制造出种种资格门槛,这些资格门槛让非洲裔美国人难以逾越,因为他们往往非常贫困,而且文化水平不高。比如说,在很多州,人们必须缴纳一定数量的税——“投票税”——才能参与选举,这对较为富裕的美国人来说不成问题,但贫困的非洲裔美国人则难以承担这笔费用。尤其不公的是,根据一项“祖父条款”的规定,许多白种美国人根本无须缴纳这种税。所谓的“祖父条款”规定,如果一个人想免于缴纳“投票税”,那么他必须首先证明他的祖父拥有投票权。白种美国人通常都能证明这一点,而非洲裔美国人则不能。在当今时代,“祖父条款”已经不再具备原先的种族歧视意义了,它实际成了不溯既往条款,也就是说新法律只对它生效后的事件有约束力,对它生效前的事件免除任何限制。结果,这种税让许多非洲裔美国人无法参与选举。有趣的是,“投票税”一词中的“投票”并不是指投票本身,尽管当年美国各州确实会在人们参与投票时征收这种税。“投票”(poll)这个词最初来源于中古英语的“polle”一词,其含义是“人头”。所以“投票税”实际上应该被翻译成“人头税”,也就是一种人人都需要缴纳、每个人缴纳额度一样的税。同理,从语言学意义上来说,投票地点的最初含义就是“按人头来清点人数的地方”。不过,“人头税”碰巧又被用来阻止人们投票,所以“人头税”就逐渐变成了“投票税”。各州佯称征收“投票税”是合情合理的,因为征税既可以增加财政收入,还会使纳税的人对社会福利更感兴趣。然而,事实上“投票税”的唯一作用就是把非洲裔美国人拦在选举大门之外。另外,选民不得不在投票前接受读写能力测验,据说这样做是为了保证选民都能够基于对候选人情况的充分理解来作出投票抉择;然而,读写能力测验实际上起到了把文化水平不高的非洲裔美国人拦在选举大门之外的作用。议员和法官们在20世纪60年代消除了这两种类型的“选民压制”行为,然而更加难以识别的其他的“选民压制”行为至今仍然存在,成了亟待解决的问题。比如说,要求选民持有身份证的法律,被吹捧成防止选民耍诈而在各地重复投票的好办法,与之类似的还有“选民登记”这种被用来定期清除异己的行为。然而,有很多理由足以证明制定这些措施的人用意不善,因为它们都会直接导致非洲裔美国人、拉美裔美国人以及其他少数族群选民的投票率降低。
尽管如此,以上叙述的4种类型的“选民压制”行为都不如接下来将要介绍的这种“选民压制”行为险恶。它相当有效,是暗中作恶,并且由美国联邦最高法院主导。通过一系列的裁决,美国联邦最高法院将一个数学意义上的谎言包装成真理,用钢笔轻轻一划就彻底抹去了数以百万计的居民的存在痕迹。由于这些裁决,超过1%的美国人被剥夺了公民权,如同“幽灵”一般地存在着,这些人理论上应享有投票权但被蓄意忽略掉了。这是“数字的骗术”导致的一个令人震惊的事实,直接关系到民主制度的核心问题——民主的真实含义和内容。
整个阴谋与操控美国人口普查的行为有关。这或许让阴谋看起来显得并不那么险恶了,然而从根本上而言,民主制度就是“让政府建立在清点基础上”,建立在清点选民和他们的选票的基础上。美国的国父们意识到了清点行为对于他们的新政府的重要性。确实,《美国宪法》最初只有几段内容,其中就专门有一节规定美国政府必须每10年“清点”一次全国居民。10年一次的美国人口普查对于该国的民主政体的运作至关重要,因为它决定了各州应该在美国联邦众议院中占有多少个席位,拥有多大的权力。
美国联邦众议院的435个席位(粗略估计)被平均分配到美国的公民当中,每个美国联邦众议员由大约包括70万人的选区投票选出。某个州的人口越多,该州在美国联邦众议院中分配到的席位就越多,在美国国会中的权力也越大。随着人口增多,该州拥有的政治权力(和能争取到的财政拨款数额)也增大了。由于美国东北部地区人口数量下降严重,纽约州和宾夕法尼亚州拥有的美国联邦众议院席位不断减少,而加利福尼亚州和得克萨斯州拥有的美国联邦众议院席位则不断增加。某地区的政治力量以及住在该地区的政客们的政治前景,都取决于10年一次的美国人口普查结果。
为了准确地清点居民数量,美国政府花费了许多时间和金钱。2000年的美国人口普查花费了大约65亿美元,平摊下来相当于每个美国人都为此花费了20多美元。人口普查是一项事关重大的任务,其结果应该达到尽可能精确的地步。不幸的是,跟其他计量行为一样,人口普查也很容易出错。而且自20世纪40年代以来,统计学家们被迫承认一个令人沮丧的事实:无论人口普查员多么敬业地工作,都会产生无法避免的系统差错。他们不可能毫无遗漏地清点所有人。
在某些方面,人口普查就像政府实施的大型民意调研活动,但它与民意调研存在着非常大的区别。人口普查并不是向居民当中的样本人群提问并且利用这个结论去推算全体公众意见的情况,而是试图向全国的每位居民分别提问。从理论上来说,人口普查员没必要利用所得结论去推算什么。所以,人口普查跟选举活动一样不存在统计误差。人们没必要担心统计学意义上的偶然的“极端”现象会导致人口普查变得面目全非,从而无法正确反映全体公民的真实情况,因为人口普查选取的样本就是全体公民。人口普查员只需要担心系统差错,而且实际上人口普查中存在着很多系统差错。
所有民意调研都依赖于被调研对象的合作程度,民意调研无法记录那些把意见回馈卡扔进垃圾箱或听到民意调研者的声音就立刻挂断电话的人的主张。结果,所有民意调研都受到“自愿偏见”的影响,“自愿偏见”可能在民意调研中导致大量差错。人口普查也一样。每位美国居民都会得到一份人口普查表,而且多数人会填写并提交,但也有人不会这样做。在2000年人口普查中,大约1/3的美国居民懒得提交他们的问卷。为了得到全国居民的确切人数,美国人口普查局必须清点那些拒绝作出回应的居民人数。这就是产生巨大花费的原因。美国人口普查局派遣数千名人口普查员花费好几个月挨家挨户逐个清点那些拒绝作出回应的居民。让某户居民作出回应的难度越大,花费在联系那户人上的金钱就越多,但是美国人口普查局会坚持下去,直到依法将结果提交到美国国会的最后期限来临。在这个过程最终结束时,美国人口普查局成功地清点了绝大部分拒绝作出回应的人数,但还有大约2%的居民信息未能获取。这次人口普查取得了非同寻常的成就,但它仍然会有许多差错。
这次人口普查不但未能取得2%的居民的信息,还无意中重复清点了大约1%的居民。这意味着,考虑到这些因素,人口普查得出的某州人数在1000万人左右的结果最理想。就政治意义而言,这“左右”相当重要,因为1000万人大约可以从美国联邦众议院分配到14个席位。极为令人沮丧的是,即使花费了这么多时间和金钱,人口普查中的差错还是如此巨大。这些差错无法利用平常的手段来纠正。从理论上来说,美国联邦政府能够找出每位拒绝作出回应的居民,但那又会花费天文数字般的金钱,而且即便这么干了也未必真能找到每位居民。就算把当前预算翻倍,美国人口普查局也会受到当前的计量方法的限制,而得不出更佳的结果。然而,情况并不令人绝望。利用一种被称为“抽样”的统计学手段,人们就有办法显著地减少差错。
人口普查中,应该引入抽样调查吗?
尽管该裁决回避了使用统计学方法是否真的违宪——“实际列举”条款是否规定只能逐个清点选民而不能采用其他任何方法——的问题,毫无疑问,占多数席位的保守派大法官对抽样方法充满敌意。按照立场最保守的美国大法官之一安东宁·斯卡利亚在表决后撰写的意见书,他言辞激烈地暗示在美国人口普查中使用任何统计学方法都会让已故的美国国父含恨九泉。
斯卡利亚借助17世纪的辞典来说明“实际列举”只能意味着逐个清点人数,比如说,他引用了1773年出版的一本由塞缪尔·约翰逊主编的辞典,这本辞典定义“列举”为“一个个地数,清楚地数完”。哈哈!一个个地算出总数!斯卡利亚抓住机会阐述,美国国父们使用“列举”一词来表示“一个个地算出总数”。因此美国人口普查“需要一个实际清点结果,而不需要数据的估计结果”。更进一步,使用统计学手段会“赋予政党按自身喜好来篡改各地人口数据从而操控美国国会的能力”。只有不够精密的逐个清点的方法才能免于人为操控。因此,使用抽样方法是违犯宪法的。
这种看待各种清点方法的论调是似是而非的。首先,就算约翰逊主编的辞典是了解美国国父们的意图的关键,“列举”也不仅仅指的是“一个个地算出总数”,它还有可能就是“清点”的意思。同时,“列举”一词仅仅是偶然出现的。它是在起草《美国宪法》时由行文风格审查委员会加进去的,行文风格审查委员会所负责的工作不过是对宪法文本进行少量、无实际意义的修改,以便纠正语法错误和让用词更加清楚无疑义。他们基于某种不为人知的理由把“普查”改成了“列举”。有种说法声称,他们害怕擅自进行普查会遭受上帝的惩罚。按照《圣经》上的记载,当大卫王未经上帝允许进行普查后,上帝对他进行了严厉惩罚,降下瘟疫导致7万以色列人在3天内病死。所以,根本没必要详细研究当年的辞典对“列举”的准确定义,这样做忽略了事情的真相:美国国父们的原意就是“普查”,而“列举”不过是基于行文风格的理由而使用的。
更重要的是,“实际清点”和“估计”之间并不存在严格界线。正如我们之前所说的,清点是一种计量行为,也跟其他计量行为一样易于出错。差错是不可避免的,这意味着最佳的清点行为也不过与估计相当,因为估计就是对真实情况的估算。而且如果可以采用另外的计量手段,比如说统计抽样,得到更接近真相的近似估算的结果,那么它们应该要比普通的清点行为更加“实际”。美国大法官们却假装不承认这一点,并选择相信通过逐个清点得出的易于出错的数字——这就是一种“反统计”的行为。
谁在左右人口普查的结果?
“逐个清点的方法可以免于被人为操控”的观点也是错误的。事实上,即便美国人口普查局尽其所能以最纯净、最原始的方式来逐个清点居民,其结果也需要使用统计学手段修补。这是毫无疑问的。美国人口普查局的员工们不得不使用统计学工具来解释甚至更改数据,否则这次人口普查就毫无意义了。
比如说,假设居住在阿拉斯加州锡特卡县的某位爱讲笑话的人在他的普查表格上乱写,宣称他家住了3亿人,并且美国人口普查局把这位先生的说法当真了,那么这就意味着阿拉斯加州突然变成了美国人口最多的州,而且其人口数量远远领先于其他州,甚至美国联邦众议院的一半成员都要从居住在他家的人中选出。幸运的是,没有任何一位人口普查员傻到相信他的地步,很显然这个人在撒谎,他在普查中提交了一份不真实的数据。但是美国人口普查局应该对此采取什么样的措施呢?唯一的选择是以某种方法清理掉这些数据,而且这样做意味着他们必须采用一种名为“派算”的统计学技巧。
在“派算”时,服务于美国人口普查局的统计学家先要找出那些看起来有问题的数据。比如说,自称拥有77个子女或年龄为175岁的人通常在撒谎。统计学家去除这些可疑的答案并使用来自情况相近的家庭的普查数据代替它们。换上的数字仅仅是估计值,但它们是基于一般情况得出的估计值,而且比那些错误数据更接近真实情况。事实上并不存在可供取舍的其他结果。去除这些错误数据或者更激进地丢弃整份普查表格都属于“派算”行为。去除错误数据意味着替换,人口普查员把某人提供的答案(77个子女)用另外的答案(没有子女)替换掉,没有子女也算是一种答案。同理,丢弃整份普查表格不过相当于“派算”为那处住所没有人居住而已。美国人口普查局不太愿意仅仅通过去除错误数据的方式来实施有缺陷的“派算”行为,他们更愿意使用“热卡插补法”(hot-deck imputation)基于一般情况来“派算”原始普查数据。这可以提升数据的精确度,所以不会损害人口普查结果的有效性,除此之外,唯一可以完全避免“派算”的办法便是照本宣科地逐个登记每份普查表格。人口普查员不得不如实录入每位自称175岁的老太太、每位自称拥有77个子女的男人,甚至那位家中居住了3亿人的先生的答案。倘若不“派算”,这次人口普查的结果就变得毫无意义了。
美国联邦最高法院对于抽样方法的裁决实际上意味着禁止在人口普查中使用统计学技巧,“派算”也是一种统计学技巧,但这项裁决并没有明显涉及它。因此,在未使用抽样方法的2000年美国人口普查结果公布后,被削减了一个美国联邦众议院席位的犹他州提起诉讼。该州声称,美国人口普查局在处理普查数据时进行“派算”是违法的,而且这起诉讼案最终在2002年提交到了美国联邦最高法院。
犹他州提起的诉讼案让美国联邦最高法院陷入了困境。如果美国大法官们裁决“派算”是违宪行为,那么这将导致美国人口普查局无法校正那些荒谬的、虚假的数据。那位自称家中居住了3亿人的先生就能导致这次普查变成毫无意义的儿戏。然而,如果美国大法官们裁决“派算”是合法的行为,那么他们必须想办法对情况进行琐碎的分析并向大家解释,他们凭什么认定一种统计学技巧——“派算”——是合理的,而另一种统计学技巧——“抽样”——是不合理的。
根据再一次5∶4的表决结果,一贯较保守的美国首席大法官威廉·伦奎斯特站到了思想较开放的4位美国大法官一边,美国联邦最高法院决定作出终审裁决。大法官们经过琐碎分析举出各种表明“派算”方法带来公平结果的例证,并且允许美国人口普查局至少暂时可以继续利用“派算”方法来处理数据。然而,所持观点处于少数的大法官们大肆抨击这项裁决,责怪美国人口普查局擅自使用违法甚至危险的统计学“魔法”。奥康纳发表文章指出,“派算”不过是一种抽样方法而已,所以应该被禁止。克拉伦斯·托马斯的文章原原本本地复述了斯卡利亚在上一次作出禁止抽样的裁决后撰写的意见书,甚至连出版于17世纪的老旧辞典对“列举”的定义都原文照录,只是添加了少许内容。他坚持认为美国国父们“很熟悉各种统计学技巧”,所以宪法当时就明确禁止美国人口普查局使用这些精密技巧。由于这些统计学技巧主要是在20世纪才逐步出现的,这种说法让美国国父们听起来好像都是“穿越者”。而且,尽管清点本身跟估计如出一辙,托马斯还是反复重申了“实际列举”与“估计”完全不同的错误看法。这些美国大法官再次使用各种“数字的骗术”手段来为糟糕的数据辩护,还忽视真实的数据,而且他们试图帮助那些别有用心的人利用不精确的人口普查结果剥夺本来应该属于别人的代表权。
当本书在美国出版时,美国人口普查局的2010年人口普查工作已经开始了。美国联邦最高法院的两个裁决让普查法规陷入了完全混乱的状态。就某种意义而言,部分统计学技巧是合法的,而其他统计学技巧是非法的,而且人们没有任何依据来判断到底某种统计学技巧算不算合法。美国共和党议员们已经准备好质疑这次新的人口普查的合法性。他们早在第一份人口普查表格寄回美国人口普查局之前就不断威胁要提起诉讼,而且有些言论已经被证明不过是嘘声恫吓而已。2009年10月,来自路易斯安那州的美国联邦参议员戴维·维特(他因为联系一位华盛顿市的“高端”老鸨寻求性服务而名噪一时),试图让美国人口普查局重新制作人口普查表并加入一项问题:你是否是美国公民。如果他的意图得逞,那么这不仅会花费巨额成本(4.25亿份人口普查表不得不全部作废重印),导致人口普查延期,还必然会惊吓到目前没有美国公民权的居民,尤其是那些非法移民,导致他们拒绝接受人口普查。《美国宪法》要求人口普查结果涵盖每个居住在美国的居民,而不仅仅是美国公民或合法移民。戴维的企图比故意遗漏某些居民的企图还要恶劣得多。果不其然,这个提议在一场严格按政党立场站队的投票表决中被否决,美国民主党议员们反对它而美国共和党议员们赞成它。
尽管如此,一旦这次人口普查结果揭晓,新一轮的争斗也将立刻开始。毫无疑问,接下来的10年内会有一连串有关普查方法的崭新法规出炉,而且考虑到美国联邦法院多年一直坚持的过时的保守立场,21世纪的首次美国人口普查很可能被禁止使用任何18世纪以来出现的数学技巧。
“数字的骗术”已经暗中侵蚀和损害了民主制度的基础,即那些用以清点公民人数、决定他们在国会中享有公平代表权的机制。政治斗争性质的“格里蝾螈”行为被认为是可以接受的,尽管它明显消解了部分公民的选票价值。而统计抽样被认为是无法接受的,尽管禁止使用它会迫使美国政府不得不接受明知不够精确的数据。无论有多少善于巧言令色的议员、法官竭尽全力为自身立场辩护,事实仍然不变:糟糕的数学手段正被用来剥夺美国公民主要是非美国裔公民的正当投票权。在一个民主国家中,这是最为严重的罪行。
第七章 被左右了的司法审判
政府不能改变客观事实,但从未放弃改变客观事实。政客们会质疑而且尝试更改他们不喜欢的任何事实,无论这事实多么无可辩驳,比如说,印第安纳州的政客们甚至一度尝试借助法律来改变圆周率的值。
没错,他们想要改变的就是大家在数学课上学过的圆周率——圆的周长和直径的比值。印第安纳州议会参议员泰勒·雷科德受到一位古怪的博士挑唆,认为圆周率的值(大约为3.14159)用起来是令人感到不便的。它让计算变得更加复杂,因此应该被修改一下。1897年1月18日,他提出了“246号议案”。如果印第安纳州议会的参众两院通过了这项议案,并且印第安纳州州长正式签署了它,那么它就会正式将圆周率的官方值改成3.2。而被他们认为是“完全不够格并误导大众”的圆周率的真实值就会被人们极为自豪地舍弃掉。
这项议案获得了一个好的开始。印第安纳州教育委员会给它开了绿灯,而且几周过后,印第安纳州议会的众议院一致通过了这项议案,67票赞成,无人反对。下一个关口便是印第安纳州议会的参议院。而且当这项议案之前被提交到印第安纳州禁酒委员会审阅时,印第安纳州禁酒委员会满腔热情地表达了对它的赞许。这项议案看上去一定能在印第安纳州议会的参议院通过,但是美国普渡大学数学系主任干预了此事,他向印第安纳州议会的参议员们解释,通过这项议案会让印第安纳州沦为笑柄。一场简短的辩论就此发生,一位印第安纳州议会参议员大声宣布,“通过这项议案就像试图立法规定‘水往山顶上流是有充足法律依据的数学真相’一样”,这项议案最终在辩论结束后被无限期地搁置了。这个案例是数学真相凭借其影响力所取得的一次罕有的立法上的胜利。
逃脱法律制裁的辛普森
让无辜者入狱的“专家型证人”
有这样一种说法:任何检察官都能够让一个罪人被判有罪,但只有伟大的检察官才能让一个无辜者被判有罪。“数字的骗术”正是能够打造出伟大的检察官的绝佳工具。检察官们可以找来一位专家做证人,让他当庭发誓然后滔滔不绝地讲些丝毫没有数学意义的废话,这样做甚至可以让人觉得一位无辜者有罪。
英国就曾经发生过这样一个臭名昭著的事件。一位名叫萨利·克拉克的英国女律师在1998年被判有罪,她的罪名是谋杀了她自己生育的两个婴儿。这个判决结果在某种程度上是依据著名的儿科医师罗伊·梅多爵士所提供的冠冕堂皇的证词作出的,他利用一个不正确的可能性来“证明”克拉克的两个小孩应该不是“突发性婴儿死亡综合征”患者。既然“突发性婴儿死亡综合征”的嫌疑被排除了,唯一的凶手就只能是婴儿的母亲克拉克律师了。
梅多爵士在20世纪70年代就以发现并命名了“代理性孟乔森综合征”而名噪一时。“代理性孟乔森综合征”是一种心理疾病,患有此心理疾病的父母(通常是母亲)希望通过伪装或者导致孩子生病的办法来获得他人关注。他不久就完全投身于保护婴儿免受患有心理疾病的父母的虐待的神圣工作中。许多夭折婴儿被拙劣地诊断为包罗万象的“突发性婴儿死亡综合征”患者,但他们实际上是被父母谋杀了,这令他烦恼不已。梅多爵士相当怀疑“突发性婴儿死亡综合征”是否真正存在,以至于他曾经一度建议完全废弃“突发性婴儿死亡综合征”这个术语。
1996年,克拉克刚出生不久的儿子夭折了,验尸官把这个婴儿的死亡原因归结为“突发性婴儿死亡综合征”。但是,两年后她的第二个儿子在出生后不久也夭折了,验尸官的看法改变了。在一个月内,克拉克就被指控犯下了严重的谋杀罪行,闷死了她的第一个儿子,摔死了她的第二个儿子。
梅多爵士是控方的关键证人之一,也是协助陪审团定案的关键人物。他提供了令人震惊的统计结论:同一个家庭中连续出现两例“突发性婴儿死亡综合征”的可能性大约为1/73000000。按照梅多爵士的描述,某个赌徒连续赌赢4场分别有80匹马参加的比赛的可能性,都比克拉克女士的家庭连续遭受两次来自“突发性婴儿死亡综合征”的打击的可能性大。他宣称,在整个英国范围内,同一个家庭连续出现两例“突发性婴儿死亡综合征”的情况大约每100年才会出现一次。于是陪审团认为克拉克有罪,法官判处她终身监禁。
问题在于,梅多爵士的证词是毫无价值的,这不过是典型的风险炒作行为而已。1/73000000的数字源自针对那些年长、不吸烟的富裕妇女的家庭进行的研究,在那些条件较好的家庭中出生的婴儿罹患“突发性婴儿死亡综合征”的可能性是1/8543。梅多将这个数字自乘,于是得到了他的结论:在那些家庭中连续出生的两个婴儿都罹患“突发性婴儿死亡综合征”的可能性大约是1/73000000。不幸的是,如果要用这个数字来解读普通家庭的情况,那么存在着许多理由足以表明这个数字是极为不准确的。“突发性婴儿死亡综合征”似乎会受到遗传因素的影响,也会受到家庭客观条件的影响,因此一个已经遭受“突发性婴儿死亡综合征”打击的家庭很容易再次遭受这种不幸的打击——其可能性远远高于1/8543,所以最终可能性应该远远大于1/73000000。更为严重的是,跟那个被用来为辛普森开脱罪行的解读家庭暴力行为的统计数字一样,这个数字达到了使陪审团产生误解的效果。孤立来看,同一个家庭连续出现两例“突发性婴儿死亡综合征”的可能性的确很小,但是把这种可能性与一位母亲变成连续杀手的可能性相比较,后一种可能性更小。如果长期被虐待的妇女最终被谋杀,那么凶手多半是长期虐待她的家人,同理,克拉克的第二个儿子多半还是跟他哥哥一样死于“突发性婴儿死亡综合征”。梅多爵士提供了这样一个引用了极其小的可能性的结论,这不过是夸大其词而已,因为它根本没有正确地解读那种可能性的实质。这种特定类型的风险炒作行为在法庭上相当常见,以至于被广泛地称为“检察官谬论”。
幸运的是,少数目光敏锐的统计学家在得知梅多爵士的证词后公开对此提出抗议。一篇发表在《英国医学杂志》上题为“按照数学错误定罪?”的尖锐的文章抨击了梅多爵士的证词所采用的计算方法。当克拉克的上诉被驳回后,英国皇家统计学会的会长直接写信给美国大法官,宣称1/73000000这个数字是“不具备可靠依据的”。
回顾往事,看来克拉克似乎完全是无辜的。检察官在她受审时从未向法庭陈述过这个事实,她的第二个儿子一直遭受着中枢神经系统被葡萄球菌感染的严重折磨,这很有可能才是他的真实死因。克拉克经过再次上诉在2003年被改判无罪,另外3个与她情况相似、因梅多爵士的证词而被判有罪的女人也被无罪释放了。
检察官们依赖于罗伊·梅多爵士这样的专家证人,让他们向陪审团提供真实的或捏造出的事实,以便协助办案。最权威的专家可以帮助检察官轻松清除相当多的法律障碍。在得克萨斯州,仅当陪审团认为一个犯罪嫌疑人以后还会犯下暴力罪行继续危害社会公共安全时,才会判处他死刑。这一点应该相当难以证明,除非检察官获得了精神病学专家詹姆斯·格里格森这样的专家证人的帮助。格里格森被人称为“死亡医生”,因为他轻而易举地走上法庭去宣布某个犯罪嫌疑人拥有反社会人格,而且极可能再次杀害他人,为判此人死刑清除障碍。他一直从事着这样的工作,包括在处理那些无辜者被误判有罪的案例时。埃罗尔·莫里斯拍摄的纪录片《细细的蓝线》就提供了与格里格森有关的这样一个足够吸引人们关注的误判案例。
托马斯·贝尔福特被指控谋杀一案就是格里格森耍弄“数字的骗术”、借助花言巧语来误导陪审团的典型案例。在贝尔福特案中,格里格森甚至在没有对贝尔福特进行任何精神病学检查的情况下就出庭作证,多次重申他百分之百地确信贝尔福特会再次杀人。贝尔福特应该被判有罪或者无罪似乎变得无关紧要,重要的是,格里格森未经查实便以斩钉截铁的口气宣称贝尔福特一定会再次杀人。这是令人震惊的风险炒作案例,因为格里格森根本不可能作出如此确定的断言。尽管如此,格里格森过于自信的证词似乎足以给陪审团留下深刻印象,而且在本案中它确实见效了。贝尔福特被判处死刑,这起案件最终提交到了美国联邦最高法院。
美国精神病学协会向美国联邦最高法院的大法官们提交了一份情况概要,揭露了格里格森的说法纯粹是胡说八道:
该领域内的大量研究成果表明,即使在最理想的条件下,对存在特定精神障碍的患者的潜在危险性作出的预测结论出错的可能性也大于2/3……
为了让此类预测结论尽可能合理,它们只能建立在已经被精算过的数据材料的基础上,而且任何精神病方面的专家或者具备精神病学专家资格的人士不能利用任何特殊的解释技巧来曲解这些数据材料。另一方面,在审理案件时使用精神病学证词的行为会导致被告遭受严重歧视。凭借将精算得出的数据材料伪装成所谓的“专家意见”的方式,精神病学专家的证词很可能产生不适当的、过分的影响力。另外,精神病学证词使得陪审团回避那些难懂的精算问题,而企图借助貌似确凿却暗含虚假观点的专家诊断来作出结论。
换句话说,格里格森的预言比莫名其妙的废话还要糟糕,因为它们本身是不可靠的,却粉饰成根据科学、数学原理推断出的必然发生的事情。格里格森至多不过是耍弄风险炒作手段的罪人,因为他对犯罪嫌疑人再次杀害他人的可能性作出了错误的推断。不过更确切地说,他的预测毫无意义且没有任何合理依据,他给出的可能性不过是“波将金数字”。
3位美国大法官对格里格森的“数字的骗术”表示惊骇不已:“任何获得许可使用相关统计数据的门外汉也都能得出有同样说服力的结论,而且很可能得出更有说服力的结论。精神科培训并不意味着参加培训的相关人士可以合理地使用这些数据来作出此类推测,而且精神病学专家经常犯下过度渲染潜在的暴力隐患的错误。尽管他们声称自己对贝尔福特在未来的行为作出的预测是‘根据合情合理的精神病学依据得到的必然结论’,而且‘这种情况绝对百分之百会发生’,但事实上,这种情况成真的可能性还没超过1/3。”
但是,对贝尔福特来说,不幸的是,其他美国大法官拒绝接纳美国精神病学协会的情况概要:“这份概要提出这样的意见,希望我们在谈论一位被告人的远期潜在危险性时不考虑任何精神病学专家提供的证词,这就像责怪人类不该发明汽车来代替步行一样。”支持大多数人意见的美国大法官们这样表达了他们的立场。对公诉过程来说,使用捏造出的数据材料是相当重要的手段,绝不可能被人们摒弃。而且,格里格森提供的材料最终被接纳了,美国大法官们写下的理由是:“精神病学家们不会在每次谈到远期潜在危险性时都出错,只是经常会出错。”
4个月后,1984年10月30日午夜刚至,托马斯·贝尔福特留下临终遗言:“莎伦,帮我和所有朋友说再见吧。你知道他们都是谁——查尔斯·巴斯、戴维·鲍威尔……”他咳嗽了一声随即无声了。他最终在上午12点24分被处以注射死刑。
在美国警方的刑事罪犯记录中,贝尔福特是一个令人憎恨的人。他在逃跑时枪击了一位警察,他被怀疑在新墨西哥州强奸了一位3岁幼女。他或许应该接受死刑惩处,然而如果真是这样,检察官们就不会被迫借助格里格森的“数字的骗术”将他处以死刑了。不过,检察官们还是这样做了,而且依靠这种手段处决了很多人。检察官们习惯于借助格里格森来办理死刑案件,利用他来创造出“替代事实”,把被指控犯有谋杀罪的被告人逐个描述成渴望再次谋杀他人的准连环杀手。格里格森作为这方面的专家在这方面服务了30多年,参与了数百起可以对被告人处以死刑的谋杀案件的审理工作。事实上,很难弄清这些案件的确切数量。格里格森本人在20世纪90年代宣称他曾经为近400件可以对被告人处以死刑的案件出庭作证,其他资料来源则表明这些案件的数量在150~200件。但所有资料都表明,格里格森在绝大多数案件中都表示自己认为被告人具有反社会人格,因此应该从重判决。大多数情况下,他都会断言被告人是应该被处死的具有反社会人格的人,尽管有时候他根本就没有审理这个患者的耐心。格里格森凭借他的成就获得了丰厚的报酬。早在20世纪80年代中期,就有报道声称他可以凭借“死刑证词”获得每小时100美元的收入。1995年,美国精神病学协会和得克萨斯州精神科医师协会以“违背职业道德规范”为由开除了格里格森,然而检察官们仍然把他当成必不可少的合作伙伴。他们继续在法庭上——不道德的行为在那里貌似一点儿也不让人感到羞耻——借助他把被告们送进死囚牢房。格里格森继续在法庭上作证,直到他2003年退休为止。
法庭上的数字谎言
世界上有很多跟梅多和格里格森相似的人,那些人也借助“数字的骗术”来使他人被判有罪或者被诬陷致死。当他们借助“检察官谬论”或专家证人或其他手段把毫无意义的废话粉饰成绝对真理时,他们正在暗中逐渐侵蚀、破坏各国司法体系的基础。当这些花招儿涉及数学时,法庭就会陷入混乱。任何事情都是这样的,如果法官不够警觉,那么无论多么似是而非的数学论证都有可能赢得最终胜利。一旦法官心情不适,他甚至有可能自己施展“数字的骗术”来作出判决。
华盛顿特区地方法院的某位法官在好几年前就一个无关紧要的案例作出的裁决就是一个典型的例子。该案件涉及一条经过密苏里州内两个小城市的废弃铁路。美国地面交通委员会(负责规划全美国铁路的机构)允许重新启用这条铁路,并且计划每天安排两趟列车运行。然而,这两个小城市的市民就此事提起了控告,因为铁路系统没有审查这两趟列车造成的环境影响。按照相关法规规定,当一条铁路的“交通流量上升幅度不低于100%”时,这种审查就是必须进行的。而法官煞费苦心地给出了这样的裁决:
市民们认为,这条铁路重新启用以后,其运载的货物总量从0吨上升到每年520趟火车(每周10趟)所装载的总吨数,这就相当于“交通流量上升幅度不低于100%”。市民们怎么会得出这样的结论呢?这着实令人费解。规则中包含着这样的疑问,铁路的交通流量上升幅度如何计算?假设以前这条铁路运载的货物总量为100吨,而现在这个数字提升到200吨,那么无须向理查德·费曼那样的经济学家咨询,我们人人都可以算出来200吨比100吨多100%。用a代表现在增加的货物总量,用b代表过去的货物总量,拿100%乘以a与b之比,我们就能得到准确的百分数。然而当b为0时,这里就陷入困境了,而且在本案中正是如此。因为过去这条铁路运载的货物总量为0,我们不得不用现在增加的货物总量除以0。然而所有学过数学的人都知道,0不能充当除数。得出的结果只能是无穷大,那没有任何意义。
法官坚决宣称市民们把0作为除数使用了,因而错误地提出了对环境造成的影响进行审查的要求。
由于法官对逻辑悖论的热情突然被激发出来了,便制造了“替代事实”,让一个数学题变得似乎无法解决,但事实上其答案非常简单。只需要自问自答三次就可以明了。首先,这条铁路的交通流量上升了吗?(上升了。每天通过的火车数量从0趟上升到2趟)。其次,如果交通流量上升幅度达到之前的100%,那么现在通过的火车数量应该是多少?(还是0趟,0的100%增幅还是0。)头两个问题将带来第三个问题,现在的交通流量上升幅度大于或等于100%吗?(是的,2大于0。)由于第三个问题的答案是“是的”,所以相关法规的限定条件便达到了,这条铁路的交通流量上升幅度的确不低于100%。因此,对环境造成的影响进行审查就是不可避免的。事实上,如果忽略掉这个裁决中的数字谬论,那么我觉得裁决在客观上也有合理性。因为相关法规中还包括一条专门的条款,对重新启用已废弃铁路进行了特殊限定。该条款的大致含义是,只要重新启用的铁路每天被安排运行的列车数量少于8趟,对环境造成的影响进行审查就没必要了。然而该法规制定得相当不严密,以至于我无法确认该条款的真实含义。但是,我们没必要再玩这种稀奇古怪、令人费解的逻辑游戏了。
当讨论内容涉及数学和科学真理时,法庭就变得令人恐惧,因耍弄“数字的骗术”而产生的“替补事实”常常会掩盖真相,这样的情况已经司空见惯了。早在1944年,查理·卓别林就在他倒霉经历中领悟到了这一点。当时一个名叫琼·贝里的精神不正常的年轻女人向法院控告卓别林,声称卓别林是她女儿的生父并且应该承担抚养义务。卓别林面临的情况很糟糕,他承认与这个年轻女人发生过性关系,但两人的暧昧关系在她怀孕以前很久就结束了。除了这起亲子抚养义务诉讼案外,卓别林还面临着公诉。由于他参与了所谓的跨州组织的交流合作,所以美国政府指控他违犯了《曼恩法案》中禁止出于“淫荡的意图”而跨州组织妇女卖淫的行为的法规。(这种起诉是别有用心的,至少部分原因是美国联邦调查局把卓别林列入了共产主义同情者名单。)
案件开始正式审理后,卓别林突然迎来了绝佳的好运。医生们把他和那对母女的血液进行了化验,然后证明他不是那个女孩的生父。B型血的女孩绝对不可能是O型血的卓别林和A型血的贝里的女儿。正如医生们提供的证词所说的:“依照遗传学规律,一系列血液化验结果足以证明,查理·卓别林绝对不可能是这个名叫卡罗尔·安·贝里的女孩的生父。”除非血液化验结果有误(即使任何人认为化验过程中存在着猫腻,重新化验也不难),否则大家可以100%地确信这个女孩的生父应该是B型血或AB型血的男人。卓别林在这起诉讼中明显是无辜的。
然而,检察官和法官公然否认了这确凿的血液化验结果,转而因“外形相似度”测验的结果来充当所谓的“科学依据”,继续审理此案。“外形相似度”测验就是让陪审团成员们仔细观察这个女孩的外貌并且判断她是否长得像卓别林。指控卓别林违犯了《曼恩法案》的诉讼案首先结束,由于陪审团成员们意见不一致,他被判无罪。然而,在亲子抚养义务诉讼案中,卓别林最终被认定是这个女孩的生父。经过法庭审判得出的事实——合法的事实——就是卓别林是琼·贝里的女儿的生父,尽管几乎符合数学上的绝对的确定性概念,但事实却不是这么回事。对此,检察官和法官们都心知肚明。
真正公平的司法体系应该极为看重能够证明真实情况的任何证据,这些证据往往会证明被告人是无辜的。然而美国司法体系并非如此,比如说,美国联邦最高法院曾经在2009年以5∶4的表决结果通过了一项裁决,宣布被指控犯有强奸罪的威廉·奥斯本无权申请接受高质量DNA测试,尽管测试结果有可能证明他无罪。不赞成这项裁决的美国大法官们如此写道:“奥斯本要求的DNA测试简单、容易操作、花费适当,而且结果精准。奥斯本提出申请,愿意自己付费接受这项DNA测试以便获取证据,一步到位彻底弄清真相。然而,州法院却因为不能或不愿意表达清楚的理由拒绝了他的申请。”
甚至当被指控有罪的被告性命攸关时,法官们也宁愿闭上双眼,忽略可以证明他无罪的证据。美国联邦最高法院曾经在1993年作出裁决,宣布被指控杀害了两名警察的莱昂内尔·埃雷拉无权申请重审,该裁决还禁止他出示任何足够公平、令人信服的新证据(包括来自杀害两名警察的疑似真凶所聘请的律师的信件)来证明自己无罪。4个月后,埃雷拉被处以注射死刑。
令人遗憾的是,“数字的骗术”对其他类型案件的影响并不显著,却更容易影响死刑案件。可怕的死刑裁决机制饱受谎言的影响。
死刑裁决中的种族歧视因素
1986年秋天,安东宁·斯卡利亚获得美国大法官职位、进入美国联邦最高法院工作已经有4个月的时间了,此时他不得不面对一个棘手的数学问题。斯卡利亚坚决支持使用死刑来震慑犯罪分子,然而某个令人烦扰的证据告诉他,全美国至少佐治亚州的司法机构在决定是否判处罪犯死刑时的常规做法是违犯宪法的。
这个证据就是一直提交到美国联邦最高法院的“麦克莱斯基诉肯普”案件的主要争议内容。上诉人沃伦·麦克莱斯基被指控在持械抢劫一家家具店时开枪拒捕,他用一把口径为0.38英寸的手枪打中了一位警察的脸部,导致那位警察不幸殉职。麦克莱斯基已经被判处死刑。
麦克莱斯基显然不是清白无辜的。他的确有持械抢劫的犯罪行为,虽然他矢口否认,但他已经被确认是开枪杀害那位警察的凶手。麦克莱斯基坚决宣称自己不应该被判处死刑,因为他是在佐治亚州被宣判有罪的,而佐治亚州的司法机构在决定是否判处罪犯死刑时有种族歧视问题,而且他有充分的数学依据。这多亏了艾奥瓦大学教授戴维·巴尔杜斯,巴尔杜斯为了寻找规律研究了佐治亚州审理的大约250起谋杀案件。
巴尔杜斯已经归纳出了规律,他运用回归分析法找到了导致佐治亚州的某些罪犯被判处死刑的重要因素。为了得出最后结论,他必须完成繁重的工作,逐个分析“罪犯是否拒捕”、“被害人是否持续受到伤害”、“罪犯是否强奸过被害人”之类的因素,以便找出一切有可能导致检察官提议判处被告人死刑,以及法官和陪审团接纳检察官的死刑提议的要素。和其他所有回归分析(尤其和同样包含了诸多变量的回归分析)一样,这次回归分析离完美状态还差得很远。然而,当巴尔杜斯反复分析自己得到的数字时,一种因素突然冒出来成为焦点话题,那就是种族歧视。
当被害人是白人而不是黑人时,检察官更可能提议判处被告人死刑。这自然意味着,任何被指控谋杀了一位白人的被告人被送去坐电椅受死的可能性,要比任何被指控谋杀了一位黑人的被告人大得多,大约高3倍。这令人震惊地证明了美国司法体系中存在的种族歧视问题。还有另外一个证据,受审的黑人比受审的白人更容易遭受死刑判决,当该案件的被告人是白人时,这一点尤其明显。尽管巴尔杜斯的研究存在着一定的缺陷,它还是证明了美国司法裁决深受种族歧视观念的影响,这一点相当令人烦恼。
对斯卡利亚这样的“死刑拥护者”来说,巴尔杜斯的研究是严重的威胁。一旦美国联邦最高法院承认它的死刑裁决中存在严重的种族歧视问题,判处被告人死刑的做法就涉嫌违犯宪法。《〈美国宪法〉第十四修正案》明确作出了“法律面前人人平等”的保证,然而非洲裔美国人在受审时往往被处以更严厉的刑罚,这完全违犯宪法了。
接下来,一场完全耍弄“数字的骗术”的闹剧正式上演了。美国大法官们,尤其是斯卡利亚,耍弄“数字的骗术”,使得死刑可以在美国继续存在下去。表决结果又是5∶4,美国联邦最高法院决定向巴尔杜斯的研究“泼冷水”。佐治亚州地方法院娴熟地采用“最优选择”手法来应对巴尔杜斯的回归分析法,所持观点处于多数的美国大法官们则借助佐治亚州地方法院的结论来反驳巴尔杜斯的观点,使大家怀疑他是否真的找到了足以证明存在种族歧视的任何证据。就算他的确发现了一些证据,这恐怕也不足以确凿地证明什么。美国联邦最高法院判定:“如果麦克莱斯基想要依靠《〈美国宪法〉第十四修正案》提出的‘所有公民应享受到同等保护’的原则来翻案,那么他必须证明那些判处他死刑的人有种族歧视的倾向。他没有为自己的案子提供任何明确证据,以证明种族歧视在他的案子中起到了对他不利的作用。相反,他不过仅仅依赖巴尔杜斯的研究而已。”换句话说,麦克莱斯基所拥有的论据不足以证明自己遭受了不公平对待,他必须证明那些审判他的人有违规行为,至少需要证明他的案子是一个疑案。
美国联邦最高法院坦率地承认,麦克莱斯基在本案中只能败诉,因为“麦克莱斯基的挑战从根本上危及了美国整个司法体系”。如果巴尔杜斯的研究是正确的,那么佐治亚州的各级法院就会被严重地牵扯进来,并且表明无处不在的种族歧视长期以来一直影响着各级法院的裁决结果。这样的结论会造成严重后果,以至于大法官们根本不愿意让它成真。他们不得不捏造出“替补事实”,判定巴尔杜斯的研究因为存在致命缺陷而无法成立,同时肯定佐治亚州的司法体系完全公正,宣布受害人或被告人的种族身份对案件结果没有任何影响。
斯卡利亚没有动手写意见书,另一位大法官刘易斯·鲍威尔担负了这个任务。然而,斯卡利亚在本案中扮演的角色仍然值得我们特别关注,因为他留下的一份备忘录在“麦克莱斯基诉肯普”案件结案多年以后被公之于世。那份备忘录的写作日期是1987年1月6日,当时“麦克莱斯基诉肯普”案件已经结案好几个月了。斯卡利亚在备忘录中透露了他的真实想法,他认为巴尔杜斯的研究是合理有效的,而且美国各级法院的确深受种族歧视观念的影响:
我的真实观点就是,毫无理性的同情或反感情绪会导致陪审团成员和检察官们无意中作出带有种族歧视色彩的决定。这种现象属实,已被许多法院判例证明,而且根深蒂固难以消除。然而我不能坦诚地向大家宣布我承认巴尔杜斯的研究属实,而且只不过需要再补充一些证据而已。
这样的陈述令人震惊。在斯卡利亚的心中,案件结果早已注定,提供再多的证据也没用,因为他原本就知道佐治亚州的各级法院在决定是否判处罪犯死刑时明显带有种族歧视的立场。但是,事实不足以改变他的主意,死刑裁决机制必须继续不受阻碍地运行下去。斯卡利亚不但没有承认自己的真实看法,还加入到以鲍威尔为代表的多数派一方,卖力指责巴尔杜斯的研究,而且对巴尔杜斯提出了凭借已有数学依据完全无法证明的过高要求。斯卡利亚的备忘录暴露了自己当时刚刚就任美国大法官的犬儒主义嘴脸。尽管他相信巴尔杜斯的研究结果,他还是对此进行了抨击,并且依我看来,他施展了“最优选择”手法来夸大它的缺陷,忽略它的价值。尽管他知道佐治亚州的死刑裁决机制带有严重的种族歧视色彩,他还是逼迫正在努力求生的被告人提供根本无法作出的证明。斯卡利亚的备忘录扯掉了他为自己施行“数字的骗术”的行为蒙上的那层遮羞布。
1991年9月25日,麦克莱斯基坐到电椅上被处以死刑。此时鲍威尔早已退休,他写完这起案件的意见书后仅过了几个月就申请退休,离开了美国联邦最高法院。又过了好几年,有位传记作者问他是否认为自己曾在投票表决某些案件时作出了错误的抉择。他立刻回答说:“的确如此,比如说‘麦克莱斯基诉肯普’案件。”和他的某些同行一样,鲍威尔最终断定,由于当前美国司法体系存在深层缺陷,死刑判决是不可行的。巴尔杜斯的分析报告已经发表多年,然而种族偏见在案件审理中的不良影响却越来越严重。许多由其他人进行的研究得到了同样的结果,重复验证了巴尔杜斯在死刑案件中发现的规律。1990年,一份根据28项研究得出的美国官方报道显示,近年来,大量证据表明,死刑案件的控告、审判、实施环节都充满了种族不公平现象。
面对如此多的铁证,斯卡利亚依然坚定不移。总之,他更为尖锐地捍卫死刑,而且依赖“数字的骗术”的程度是空前的。
死刑的威慑力与误判可能性
“麦克莱斯基诉肯普”案件结束20年后,跟斯卡利亚同一代的美国大法官们几乎都已去世,只剩下他和他的老对手、持较开放立场的约翰·保罗·史蒂文斯。在这漫长的日子里,斯卡利亚多次使用了捏造的数学论据。2008年,两位研究人员把斯卡利亚逮了个正着。他们公开严厉斥责斯卡利亚在“巴泽诉里斯”案件中按照自己的立场歪曲了他们的研究成果。
在“巴泽诉里斯”案件中,已经被判有罪的谋杀犯拉尔夫·巴泽提起上诉,试图避免自己被执行死刑。他的理由是,注射死刑很残忍,而且属于不寻常的惩罚。如果情况真是这样,那么注射死刑就违犯了《〈美国宪法〉第八修正案》。根据7∶2的表决结果,美国联邦最高法院驳回了他的请求。然而,这导致斯卡利亚和史蒂文斯之间出现了激烈的争论。尽管这两位法官都站在多数派一方,而且都同意注射死刑不违犯《〈美国宪法〉第八修正案》,但他们却就死刑是否带来了威慑性效果——对于死刑的恐惧是否能让某些人因害怕而不敢犯下可能被判死刑的重罪——争论不已。
史蒂文斯怀疑死刑具备足够的威慑力。“人们把威慑力作为继续保留死刑的正当的、可接受的理由,但这种做法的效果大有疑问,”他写道,“尽管在某些地区已经进行了整整30年的实验性研究,人们依然无法找到任何可靠的统计学证据来证明‘死刑事实上阻止了潜在犯罪’的观点。”对斯卡利亚来说,这些话充满了挑衅意味。他引用了《斯坦福法律评论》刊载的一篇论文,宣称:“史蒂文斯大法官的分析居然否认了‘人们前不久刚获得的意义重大的证据,该证据足以证明死刑完全具备威慑力,而且很可能具备强大的威慑力’。”
我认为,斯卡利亚正在对数据材料进行“最优选择”,他似乎已经忽略了还有相当多的反面证据。就在他引用的同一篇论文里,身为研究人员的作者承认自己还无法断定死刑是否具备威慑力。有关威慑力的说法不过是模棱两可的。然而,斯卡利亚就愿意篡改数据材料,使得可以表明法律具备威慑力的证据占到了绝大多数。“巴泽诉里斯”案件被裁决后不久,那篇论文的作者之一就揭穿了斯卡利亚。他在《华盛顿邮报》发表了一篇专栏文章,指责斯卡利亚歪曲了他的研究结果,“简而言之,对我们提供的所有数据材料的最恰当分析便是,它们完全不足以证明死刑有威慑力。”这篇专栏文章也抨击了史蒂文斯,表明“缺乏足以证明威慑力效果的证据”并不等于“现有证据足以证明威慑力效果不存在”。换句话说,你证明不了死刑有用,这并不意味着死刑没用。
这是斯卡利亚一生中少见的丢人现眼的时刻。他的“最优选择”行为被当场拆穿,而且居然正是被他盗用的研究成果的作者拆穿。然而,“巴泽诉里斯”案件并不是证明斯卡利亚使用“数字的骗术”上瘾的最恰当案例。他在另一起死刑案件——“堪萨斯诉马什”案件——里的主张才算得上是典型的令人震惊的司法奇谈,他公然利用了一个与数字有关的弥天大谎把罪犯送上了绝路。
迈克尔·李·马什被指控犯下了特别残忍的罪行。他非法闯入玛丽·阿尼·普施的家并藏匿在那里等她。当她回家时,他枪杀了她并切开了她的喉管。在离开现场前,他点燃了整栋房子,让普施家还在学走路的小孩被活活烧死。他被宣判有罪并且被判处死刑。
马什的案例取决于判决原则里的一个技术性细节,即马什受审的堪萨斯州如何衡量罪行中的从轻情节、从重情节。2006年,美国联邦最高法院撤销了地方法院之前作出的要求重新审理马什的裁决。根据5∶4的表决结果,美国大法官们重新确认了之前被搁置的死刑裁决。4位所持观点处于少数的大法官提出异议,他们引用一些证据表明,被施以不适当刑罚的重罪犯的数量“异乎寻常地多,而且死刑案件判决不适当的情况更是出乎意料地常见”。他们使用的证据包括《刑法和犯罪学杂志》刊载的一篇文章,文章提供了340名在1989~2003年被最终宣告无罪的囚徒(这些人不都是死刑犯)的名单。
斯卡利亚进行了粗暴的反击,把对方的看法称为“废除死刑论者伪善的指手画脚行为”。他的论点基本建立在无耻透顶的“数字的骗术”的基础上。斯卡利亚武断地宣称美国司法体系能够近乎完美地自动纠错,“重罪案件的误判可能性仅仅为0.027%。”这个数字令人兴奋不已,如果它是真实的,那么它意味着陪审团成员和法官们几乎拥有超人般的能力来预防无辜者被关到监狱里大声喊冤的情况发生。
这个数字来自《纽约时报》刊登的一篇专栏文章,其作者是一位俄勒冈州检察官,名叫约书亚·马奎斯。这篇专栏抨击了有关340名无罪囚徒的研究结论,而且通过粗略计算捏造了0.027%这个数字:
现在,我们不妨先假定这位教授在文章中提到的情况都是真实的,我们甚至可以进一步假设全美国在这15年内所有被判入狱的无辜者的人数超过了他提供的“340名”这个数字的10倍,那就是说大约一共有4000名无辜者被误判入狱了。而在这15年内,全美国一共有大约1500万名被处以重刑的罪犯。那就是说,误判可能性仅为0.027%,或者换一种说法,判决恰当的可能性为99.973%。
绝大多数行业都想宣称能达到这样的水准。
这个计算结果错得离谱。最主要的问题是,他根本就不应该在计算误判可能性时拿“全美国大约共有1500万名被处以重刑的罪犯”来充当分母。这显然是在“指鹿为马”,因为无论判决是否公平,绝大多数被处以重刑的罪犯都毫无机会翻案。要计算出真实的误判可能性,必须非常仔细地对大约1500万名被处以重刑的罪犯的情况进行分类鉴别。这样的任务可不轻松。
首先,这些罪犯被定罪的过程千差万别。相对而言,被指控犯下开具空头支票诈骗钱财、写恐吓信敲诈勒索以及其他非暴力性质的严重罪行的犯罪嫌疑人往往会被“快审快判”,基本没有机会翻案;而那些被指控犯下谋杀、强奸等暴力性严重罪行的犯罪嫌疑人,需要经历长时间的审判过程才会被最终定罪,他们能获得来自律师们的无偿服务,以及来自“无罪计划”之类的公益组织的援助,并且有翻案的机会。在每年全美国被判重刑的罪犯当中,被指控犯下谋杀、强奸等暴力性严重罪行的罪犯只占很小的比例。2002年,谋杀犯只占全美国被判重刑的罪犯的0.6%,强奸犯和犯下其他性暴力罪行的罪犯只占全美国被判重刑的罪犯的3.3%。然而,根据那篇刊载在《刑法和犯罪学杂志》上的文章提供的无辜者人数,340名最终翻案的无辜者当中就有326人是因为被指控犯下谋杀、强奸以及其他性暴力罪行而被关押的。这就是说,这些最终翻案的无辜者仅占被判重刑的罪犯数量的不到4%。在大约1500万名被判重刑的罪犯当中,仅有大约60万名被指控犯下谋杀、强奸以及其他性暴力罪行的罪犯拥有翻案的机会,因为他们会被反复审查并且经历长时间的审判过程。马奎斯在计算误判可能性时只应该考虑这60万名特定类型的罪犯,而不是所有1500万名形形色色的罪犯。
其次,60万名罪犯的数字还存在着一定的水分,毕竟这其中有很多罪犯从未试图为自己翻案。如果想计算出被误判有罪的无辜者所占的比重,那么你就应该只关注那些宣称自己无辜的罪犯而忽略那些认罪伏法的罪犯。2002年,超过90%被指控犯下强奸以及其他性暴力罪行的犯罪嫌疑人爽快地认罪伏法了;大约70%被指控犯下谋杀罪行的犯罪嫌疑人也认罪伏法了。计算误判可能性必须把这些人排除在外,最终只剩下8万名有机会翻案、宣称自己无辜的罪犯。
这个数字明显远远小于马奎斯所选用的1500万名罪犯的数字。重新计算一遍,拿8万取代错得离谱的1500万,可以得出误判可能性高达5%,而不是0.027%。或许每20次无视被告人喊冤的有罪判决就有1次是错误的。就实际情况而言,这种思考方式过于简化了,因为至少有1名借助DNA证据翻案的无辜者为了避免遭受更为严厉的刑罚而忍气吞声、认罪伏法。这意味着,严格地说,我们不应该把所有认罪伏法的罪犯都排除在外,我们应该把那些曾经认罪但已被证明无罪的无辜者统计在内。这会导致最终得出的误判可能性略低于5%。其实很显然,这些计算结果本身就是很草率的,别忘了马奎斯为了制造轰动效果把无辜者的数量增加了10倍左右,而且它只不过是相当粗略的猜测而已。
当然,这也不过是大概估算的结果而已,但它很可能更接近真相。人们已经开展了大量研究,试图准确地计算误判可能性,而且得到了类似的结果。比如说,有篇发表于2007年的论文就专门研究了那些借助DNA等确认误判的典型依据来翻案的强奸犯、谋杀犯。论文最终根据已有数据材料暗示,3%~5%的这类判决是误判。
“重罪案件的误判可能性仅仅为0.027%”,这不过是斯卡利亚为美国司法体系描绘的近乎完美的幻象而已,它荒谬无比。斯卡利亚自己也知道这一点。他足够老练,对美国司法体系存在许多缺陷的情况有着足够的了解。毋庸置疑,他也一定明白,诸如案件审理工作之类的易受参与者主观因素影响、存在诸多肮脏交易的人类活动不可能准确无误,它们不出错的可能性不可能达到99%,更不可能达到他当时宣称的99.973%。斯卡利亚必然意识到了马奎斯给出的数字是“波将金数字”,然而无论如何,他还是使用了它。
为了明确的犬儒主义意图,斯卡利亚施展“数字的骗术”。“美国司法体系存在缺陷”的事实、“大约5%的死刑犯原本无辜”的惊人误判可能性都被他矢口否认,因为他支持保留死刑。美国各地法庭上出现的误判情况如此之多,以至于人们很难为会造成不可挽回的惨痛错误——误杀无辜者——的死刑制度辩护。面对这样严酷的事实,唯一可以回避它的办法就是假装事实并非如此。斯卡利亚使用“波将金数字”制造出了“替补事实”。他似乎生活在“虚拟宇宙”中,那里的司法体系几乎是完美的,那里几乎没有无辜者会被含冤处死,而且那里的法官每天晚上都高枕无忧。
第八章 当数字变成一种炒作手段
现代人需要对客观事实进行陈述,需要想办法自我辩白,以便说服自己相信自己之前的某种行为是合理的,是遵循已有的经验准则的。问题在于,合理、确凿的证据往往可能激发出非理性的回应。如果那种回应以事实为依据,那么其中包含的极度狂乱的因素就必然是被严酷的逻辑推理过程激发出来的。——雅克·埃吕尔,《宣传》(Propaganda)
美国国防部时常尝试借助捏造的数字——“波将金数字”以及其他形式的“数字的骗术”——来替代令人不快的真实情况,这样做似乎非常荒谬可笑。但是,美国国防部的这种尝试在应付新闻媒体时充当了极其有效的工具。“数字的骗术”利用新闻记者的最重要的优点——对客观事实和真相的尊重——来对付他们。
新闻媒体的致命弱点
美国国防部不过是大量制造“数字的骗术”的“工厂”当中的一家,这些“工厂”制造出大量捏造的统计结果和虚假的信息,然后把它们散布开来,并且希望某些利益同盟者能把它们派上用场。尽管这些“工厂”所提供的内容往往是人们可想象到的最荒谬的“波将金数字”,但此类策略还是经常会奏效。没有哪个数字会傻到让人一下子辨认出来是假的。
2007年3月,一家市场调研机构为汽车行业的客户们提供了一份报告,这份报告的结论相当令人吃惊:驾驶一辆臭名昭著、耗油量大的悍马H3比驾驶一辆高能效比的丰田普锐斯混合动力车更环保。
即使粗略地瞄一眼这份报告,人们也能发现它塞满了“波将金数字”。例如这份报告毫无根据地宣称,普锐斯轿车平均每年可以开9146英里而且可以使用11.92年,这意味着它一共可以开大约109000英里。另一方面,悍马H3平均每年可以开更远的距离而且使用更久,每年13543英里与15.28年,这意味着它一共可以开大约207000英里。这和报告中提到的悍马H1相比还差得远,报告居然宣称悍马H1可以不可思议地平均使用34.96年之久,并且一共可以开大约379000英里!这些数字很明显都是“波将金数字”。一辆典型的悍马H1绝对不可能开大约400000英里,而且它们被用来高估悍马的能效比与低估普锐斯的能效比。
这份报告显然没有任何实际价值。但是在那些反对环保的专家和质疑全球变暖现象的人耳中,它成了悦耳的乐曲。拉什·林博在他的广播节目中大肆鼓吹这份报告,由此掀起的支持声浪此起彼伏。在几周之内,这份报告就影响了主流社会。2007年4月,《华盛顿邮报》的专栏作家、顽固不化地否认全球变暖现象的乔治·威尔把这份报告吹嘘成了专业研究:“说到悍马,或许买一辆悍马是对自然环境尽责的表现呢,甭去考虑买什么普锐斯啦!”他在自己的文章中复述了这些“波将金数字”。在接下来的半年中,只要有专家愿意跳出来抨击环保活动,他就只需把这份报告再拿出来即可。
即使这份报告里的数字都是捏造的,它们也足以用来实现捏造者的预期意图。市场调研机构利用这些数字帮助了汽车行业的客户们,为它们提供了攻击对手的论据。反对环保的专家们利用这些数字来质疑大众购买高能效比轿车的明智举动。就“悍马是否比普锐斯更有助于环保”这个问题辩论不休是没有意义的,因为正方观点基于相当可疑的前提,然而新闻媒体却不断提起这场辩论。
在某种程度上,这是因为辩论是新闻业的另一个致命要害。新闻记者们被培训成永远只能持中立观点的人,他们需要努力让辩论双方表现出平衡状态,尽量让辩论双方都显得言之有理、势均力敌,以便凸显自己的客观、公允。然而,当论题难以平衡、观点对错分明时,正确一方拥有的依据就会明显占据优势,而新闻记者们的“平衡”技巧就和辩论本身一样虚假,他们往往有意增强基于“数字的骗术”的观点的可信度,而损害正确的观点的可信度。无论错误一方的观点多么荒谬可笑,或者多么依赖“数字的骗术”,新闻媒体都会报道它、增强它,让这些人造的“事实”显得很有生命力。
女性患乳腺癌跟堕胎有关系吗?
新闻媒体并不是被“数字的骗术”瞄准的唯一目标。那些“波将金数字”、基于“最优选择”的错误研究,以及其他类型的以数字形式表示的毫无意义的言行的制造者们,拥有不少对他们的“产品”感兴趣的形形色色的客户。在一些有影响力的人手中,被精心选用的“数字的骗术”甚至可以充当有力的武器来帮助实施者在艰苦无比的政治斗争中取得进展。
比如说,有关堕胎的争论在美国已经持续了好几十年。1973年,美国联邦最高法院对“罗诉瓦德”案件作出裁决,彻底推翻了各州法律中禁止堕胎的条款。从那以后,很多州开始设置法律障碍,让堕胎行为难以实施,并且试图借此与美国联邦最高法院的裁决斗争。
“罗诉瓦德”案件的主角简·罗和亨利·瓦德来自得克萨斯州,该州法律要求实施堕胎手术的医生必须向每个有可能要求堕胎的女人重申一遍基于“数字的骗术”的说法,这样做正是为了劝她改变主意留下胎儿。2003年通过的《女性知情权法案》规定,每个实施堕胎手术的医生必须告知每个病人“堕胎可能导致罹患乳腺癌的风险增大”。问题是,其实堕胎并不会让女性罹患乳腺癌的风险变大。堕胎和乳腺癌之间毫无关联。
多年以来,多项研究似乎都表明曾经堕胎的女人罹患乳腺癌的风险略有上升,然而这种观点在1996年才真正流行了起来,因为当时一位名叫乔尔·布林德的内分泌学家分析了20多项同时具备癌症数据、堕胎数据的研究。在艰难地处理完一大堆数字后,他得出结论,曾经堕胎1次的女人罹患乳腺癌的风险比不堕胎的女人高30%。然而,布林德未考虑他所总结出的“规律”中隐含的多种偏差,使得这个“规律”完全无法成立。比如说,身体完全健康的女人不太愿意宣告堕胎史,而患重病的女人则更愿意宣告堕胎史,病人往往会更为坦率地讲述以往病史。根据一项在荷兰进行的研究,研究人员得到了比布林德更加引人注目的结果:曾经堕胎的女人罹患乳腺癌的风险比不堕胎的女人高90%。然而一旦大家只关注那些来自该国较为开放的地区、愿意承认堕胎史的女人,该结果就从根本上被推翻了。自从布林德的分析结果发表以来,已有大量谨慎的分析研究结论发表,它们都表明堕胎不会让女性罹患乳腺癌的风险变大。
堕胎和乳腺癌之间的关系不过是“关联诡辩”,人们自以为发现了规律,但事实上这规律并不存在。2003年,美国国家癌症研究所为此特意召开了会议,安排在会议最后环节的报告重申了堕胎不会让女性罹患乳腺癌的风险变大,并宣布这一结论早就经过科学研究的确认。这个报告受到几乎所有与会者的认可,唯独乔尔·布林德除外。有关这个问题的科学共识是相当明确的,所谓的关系是捏造的。在整个得克萨斯州,实施堕胎手术的医生被迫向病人的脑海里灌输捏造的令人怀疑的说法,让她们担心自己会因堕胎而罹患乳腺癌。
得克萨斯州的情况并不是个案。以“保护病人”为借口,反堕胎人士已经让另外5个州通过了类似的法律,要求实施堕胎手术的医生把堕胎与乳腺癌之间的可能关联告诉病人。尽管目前最先进的科学知识表明这种关联是子虚乌有的,但有些人出于政治目的还是把所谓的风险宣扬得很高。风险炒作手段居然让错误的关联被编进了法规之中,并且有意借此吓唬女人改变主意、放弃堕胎的想法。为了吓唬有可能要求堕胎的女人,立法者们不仅仅在名称很具讽刺意味的《女性知情权法案》中加入了这种类型的“数字的骗术”,它还要求医生必须告诫病人“堕胎可能导致你更容易出现自杀念头,更容易自杀”。同样,以数字形式表示的毫无意义的言行再一次写入了法律。
跟不堕胎的女人相比,曾经堕胎的女人确实更容易自杀。公布于2005年的一项在芬兰进行的研究表明,曾经堕胎的女人自杀的可能性是不堕胎的女人的6倍。然而,同一项研究也发现,曾经堕胎的女人更容易被谋杀,她们被谋杀的可能性比不堕胎的女人大10倍。就连她们死于意外事故的可能性也是不堕胎的女人的4.4倍。这些统计结果暗示出与此相关的一种“数字的骗术”——“因果诡辩”。并不是堕胎导致这些女人自杀、被谋杀或者死于意外事故,而是这些容易遭遇不测的女人更容易陷入不得不堕胎的生活困境之中。患有心理疾病的女人、女冒险家、混迹于粗野人群的女人更容易遇到各种各样的麻烦,这些麻烦也包括意外怀孕。相反,愿意生育孩子的女人们往往生活稳定、富有责任感,而且不太愿意担负不必要的风险。然而,反堕胎的立法者们故意把因果关系颠倒过来,强迫医生吓唬病人,让她们相信堕胎可能导致自己在不久以后自杀身亡。制定《女性知情权法案》根本不是为了让女人了解更多知识,而是把它们作为介质来承载任意类型的“数字的骗术”的结论,以便支撑立法者们的主张。
美国的左翼人士也有罪。跟美国的保守主义者在堕胎问题上的表现一样,美国的自由主义者为了阻止公民持枪而不遗余力,所以他们同样试图借助“数字的骗术”捏造结论,以便于支持他们的观点。1996年,埃默里大学的一位年轻历史学家迈克尔·贝莱希尔斯提出了震惊学术界的观点。他将蹩脚的主张写成文章发表在《美国历史杂志》上。这篇文章的主旨是,枪支在18、19世纪的北美洲是很罕见的,而且当时的平民反对官方试图把公民武装起来的行为。如果属实,那么这足以影响长期以来人们就枪支管制、公民持枪权展开的辩论,也足以改变人们对“公民可以持枪”的态度,让公民持枪权从美国文化的根本传统之一降格为后人捏造出的伪传统。这篇文章让贝莱希尔斯饱受称赞和关注,也为他带来了出版合同。贝莱希尔斯的代表作《武装的美国》(Arming America)受到《经济学人》杂志的好评,甚至获得了颇具声望的“班克罗夫特奖”。他的观点很快成了有影响力的前沿研究热点,而且被“禁枪积极分子”虔诚地信奉着,尽管这项研究不过是数学意义上的废话而已。
贝莱希尔斯的主张基于他从很多档案文件中找到的有关枪支数量的记载,这些档案主要是全美国范围内的遗嘱和遗嘱公证记录。但是,很快人们就发现这些数据材料不太可靠。他很明显曲解了某些数据材料的本意,还对其他数据材料进行了“最优选择”。有证据表明,贝莱希尔斯还捏造出一些数字,试图让论据显得充足。一位批评家指出,从数学角度来分析,贝莱希尔斯提供的所有数字当中有一组是完全不可能成立的,这表明贝莱希尔斯有意低估了该地区当年的公民持枪数量。埃默里大学审查了贝莱希尔斯的科研工作,发现他使用的数据材料里出现了“弄虚作假篡改数据的铁证”,并宣布这位教授可能犯下了“极其粗心大意地处理原始档案”的过错或者故意进行学术欺诈,后者的可能性明显大一些。换句话说,贝莱希尔斯很可能犯下了最严重的学术不端罪行。他渴望自己能够影响长期以来人们就枪支管制、公民持枪权展开的辩论,并为此捏造出“波将金数字”。当然,贝莱希尔斯“义正词严”地发表声明对此进行坚决否认。他的代表作出版社取消出版了,他也被迫辞职。
左翼人士和右翼人士都会采纳“数字的骗术”手段,因为它已经证明了自己的威力。无论数字如何荒诞,无论统计结果的造假痕迹如何明显,通过耍弄“数字的骗术”都能来立法、制定公共政策甚至宣扬错误理念。
“数字的骗术”把空想的产物粉饰得如同事实,添油加醋地包装它,以便它能够经受住外来的质疑、抨击。从某种意义上来说,“数字的骗术”与知识形成了鲜明的对比。
伊拉克战争只是美国政府的炒作
20世纪前半叶,为贝尔实验室等机构工作的科学家们开创了一个全新的科学分支,这就是信息论。起初,他们构想出信息论只是为了解决一些非常普通的通信问题,比如说单根铜线可以同时承载多少条通话线路,不过信息论很快就取得了长足发展,而且成了20世纪发现的为人类带来深远影响的科学理论之一。它解释了信息是怎样被传输、被存储和被信息处理装置操控的,这些装置包括电脑以及我们的大脑。
正如描述信息论的一条名言所说的,信息突如其来地丰富起来。当我们偶遇闻所未闻的事物时,我们就能够丰富自身知识。如果我们能够完美精确地预测数据流的真实内容,那么它对我们来说就不包含任何信息。对知识的追求就是对新奇性的追求,就是对那些可以让我们以略微不同的方式看待世界的新数据、新想法的搜寻。采集知识的过程就是系统性地破坏与重新建构个人世界观的过程。
这个过程或许混乱、令人不适。摧毁一个受人珍视的神话,让人放弃根深蒂固的信念,或者使得曾经看似黑白分明的辩论出现灰色的阴影,这真的不容易。人性会本能地抗拒改变,让人坚守老旧、熟悉的想法,而不愿意放弃它们去接受新信息。我们在那些挑战我们的成见的数据材料面前退缩了,我们往往会寻求而且信赖那些有助于稳固我们的成见的数据材料。
这一点在新闻行业最为明显。10多年前,我们只能通过极少的渠道获知新闻。吃早餐时,我们可能会浏览一两份报纸。开车上下班时,我们可能会收听两三家广播电台的节目。吃完晚饭后,我们可能会看三四家电视台的新闻报道。入睡前,我们可能会躺在床上看杂志以放松自己。随着有线电视和互联网的出现,我们可以获知新闻的渠道迅速增加。受众群体因此变得分散、孤立。那些美国人只能在3家电视台的晚间新闻报道节目中作出选择的日子一去不复返了。现在大家可以通过很多渠道来获知新闻,这让人们感到相当惬意。
人们似乎越来越希望找到有助于稳固他们成见的新闻渠道,而不喜欢那些会挑战他们成见的新闻渠道。保守派人士可以有选择地收看福克斯新闻;自由派人士可以登录为他们预备的《赫芬顿邮报》的网站。人们不再勇敢地面对那些会迫使他们重新审视自身立场的观点。相反,人们只愿意听到那些自己原本赞同的观点。人们沉湎于自己的神话中,丝毫不想受疑虑的打扰。汲取知识已经不再是收听新闻所带来的令人不适的意料之外的结果。
问题的核心就是“数字的骗术”。捏造的数字被粉饰成似乎可以表现出绝对真理、纯粹客观事实的样子,因此我们可以依靠它们来为自己坚持成见的行为辩解。“成果包装”可以给最固执离谱的观点罩上“得体”的光环,被人别有用心地使用的“波将金数字”或“反统计”手法足以消解可以证明观点有误的最有利的证据。政党可以借助“数字的骗术”来对抗基于知识的质疑、抨击,把不合理的事物粉饰得貌似理性、科学。这就是“数字的骗术”成为有力的宣传工具的原因。
在美国,宣传是暗中侵蚀与损害民主体系的一种方式。蛊惑民心的煽动者通过宣传来激发起非理性的激情风暴与不假思索的狂乱行为,引诱人们投票反对符合他们利益的政策而赞成那些他们原本会反对的有害政策。这是一种意识操控的微妙方式,一种诱骗人们赞同他们的“代言人”的有效机制。跟“数字的骗术”侵蚀、损害民主体系时用到的其他方式——消解支持另一方的选票、剥夺部分公民的选举权、损害司法体系——一样,利用宣传,“数字的骗术”可以剥夺我们原本应该用来谋求自身权益的民主权利。
并非所有的宣传行为都必须用到“数字的骗术”手段。事实上,或许算得上当代最有效的一次宣传行为并没有借助任何“数字的骗术”手段。在伊拉克战争爆发前几个月,诸如理查德·珀尔之类的身为新保守主义者的美国政府官员,就寻求到了《纽约时报》新闻记者朱迪思·米勒的帮助,整天散布“伊拉克拥有大规模杀伤性武器”的谣言。小布什政府把这些子虚乌有的武器当成入侵伊拉克的借口,当人们最终发现这不过是彻头彻尾的谎言时,一切已成定局。
不过,宣传的操控者们知道“数字的骗术”很可能是他们的最佳武器,因为它足够微妙。如果“数字的骗术”来自专业人士的构思,那么它就很难被人识别出来。如果采取恰到好处的方式来宣传精心捏造出的数字,那么它就足以潜移默化地影响全美国甚至全世界的主流观点,使其变得更合乎宣传意图。人们很难与之抗争,尤其当证明该数字作假的数据材料不足时更是如此。基于“数字的骗术”的精心策划的宣传行为可以有效地发挥作用,其影响力甚至可以持续数十年之久。比如说,在20世纪七八十年代活跃一时的一帮来自美国国防部的强硬派人士,就应该为基于“数字的骗术”而发起的一拨极端狡诈的宣传攻势负责,这拨宣传攻势几乎彻底毁灭了美国民主党提出的与苏联签订禁止核试验的条约的和平要求。
1982年7月20日,《纽约时报》的头版爆出了令人震惊的消息:美国终止与苏联的核条约对话。这是一次谨慎的故意泄密行为。为了向全世界公布这条新闻并且给这种看似好战的行为提供合理的解释,美国政府官员们联系了《纽约时报》的一名新闻记者。第二天,《纽约时报》就报道了官员们的说法,苏联很可能在之前履行相关的条约时已经有了欺诈行为,所以完全没必要再签署新的条约了。这一控诉具备相当明确的内容,一位匿名的美国政府官员指责苏联极有可能违背了《限制地下核试验条约》,该条约要求美苏双方进行地下核试验时使用的核武器当量不得超过150千吨,这大约是投掷到广岛的那颗原子弹的10倍。“我们多次检测到了来自苏联的异常地震波信号,其震级相当大,足以令我们质疑苏联在进行地下核试验时并未遵循150千吨的最大限额”,这位(匿名的)美国政府官员告诉《纽约时报》的新闻记者。几天以内,此类浮夸的言论就变得更加夸张了。《纽约时报》再次报道了另一位(匿名)的美国政府官员的断言,“好几次”苏联核试验使用的核武器当量“已经达到了300千吨左右”。这些控诉听起来明确、可靠,它们最终葬送了当时美国民主党提出的与苏联签订全面禁止核试验条约的愿望。然而它们完全是彻头彻尾的谎言,不过是在估测核试验当量的计算方法上耍弄了“数字的骗术”手段而已。
……
这种情况的严重程度在里根政府执政时期达到了顶峰。美国国防部的官员们,特别是时任负责国际安全事务的助理部长等强硬派人士对里根总统不断施加压力,他们越来越大声地公然抱怨苏联在履行核试验条约时作弊。具有讽刺意味的是,苏联人的确正在作弊,不过他们违背的是禁止使用生化武器的条约而不是核试验条约。而许多地震学家和物理学家只能在幕后向里根政府提交报告,希望里根政府能使用正确的公式,并且制止军方人士再发表类似的错误言论,然而美国国防部压制了所有报告,负责国际安全事务的助理部长还公开恶毒地咒骂这些试图说出真相的科学家。“他居然指控地震学家是支持苏联的内奸。”兰姆说。与此同时,抹黑苏联的错误控告继续被肆意宣传着。
1985年,里根前往美国国会,提出正式控诉:“近期,苏联进行的多次核试验极有可能违背了美苏两国在1974年签署的《限制地下核试验条约》的法律规定。”而且他此后每年都喋喋不休地重复这个话题,丝毫没有为他的错误指控感到后悔。“尽管可证明真相的证据越来越多,尽管相关的论点一个个被驳倒,美国政府至今仍坚持苏联‘极有可能违背’了相关条约的立场,”哥伦比亚大学的地理学家保罗·理查兹说。早在1988年,为验证正确估测苏联核试验的方法,相关各方就联合进行了一项实验。结果该试验证明地震学家自始至终是正确的,第二个公式才适合推算苏联核试验使用的核武器当量,而且苏联并没有违背条约。
然而,这个谎言是有效的宣传手段。它为强硬派提供了反对美国向苏联表明和平姿态的“正当理由”,而且导致人类全面禁止核试验的梦想被拖延了10多年。直到克林顿政府执政的1996年,《全面禁止核试验条约》才正式问世。尽管克林顿总统签署了这项条约,但由于美国民主党已经丧失了在国会中的多数席位,该条约还是未能获得被美国共和党控制的美国参议院的批准。结果,《全面禁止核试验条约》至今在美国还是一个悬而未决的难题。
这些控诉是一种邪恶的宣传形式。极其微妙的“数字的骗术”就足以向美国人提供指控苏联的虚假证据。这或许是一种典型的炒作模式,官员们借助新闻媒体撒谎的这一幕再次在伊拉克战争爆发之前上演。强硬派的政府官员,比如说那位负责国际安全事务的助理部长把捏造的信息传达给一位《纽约时报》的记者,然后把报纸变成实现自身宣传意图的平台。重复上演的这一幕或许有些吓人。
没错,那位负责国际安全事务的助理部长就是身为新保守主义者的理查德·珀尔,那位《纽约时报》的新闻记者就是朱迪思·米勒。多年来,两人一直默契配合。
用知识打败“数字的骗术”
“数字的骗术”会严重损害民主,因为数字会影响到我们每一个人。数字的作用是明显的,其作用甚至大到神秘莫测的程度。因为我们总以为数字代表着真相,所以我们很难想象出有人会专门为撒谎而捏造数字。就算造假工作拙劣不堪的那位笨手笨脚的约瑟夫·麦卡锡也知道这一点,当他公然宣称已经有205名共产党员“潜伏”进白宫时,他的无耻谎言就被粉饰成了事实。麦卡锡把“数字的骗术”当做宣传工具,然而“数字的骗术”并不仅仅是宣传工具,它比单纯的宣传工具可怕得多。民主建立在数字基础上,错漏百出的数字会从内部侵蚀掉整个民主体系。在美国,“数字的骗术”已经被用来剥夺某些选民的选举权、影响选举结果,被用来窃取大众的财富并将这些钱装进肆无忌惮的商人们的腰包,还被用来倾斜法律天平、对无辜者施以刑罚。“数字的骗术”使得谎言从新闻记者们的嘴里说出。民主国家里发生的一切都受到“数字的骗术”的玷污。
颇有讽刺意味的是,唯一可以对抗“数字的骗术”的手段也是数学。数字可以用来粉碎神话、反驳谎言。我们可以利用数字与那些歪曲数字本意的人针锋相对。数字可以消灭“数字的骗术”,至少可以减轻其影响力。
你必须了解,真实世界里的数字都来源于不够完美的计量行为。这有助于你对“波将金数字”、“反统计”和“成果包装”等类型的“数字的骗术”免疫,它会让你持有理性的怀疑态度,细致地分析数字是否来源于客观事实、是否足够可靠、是否被直观正确地表达。你只需了解少许复杂的数学知识并且经过少量练习,让自己在看待数学问题时更加老练一点,就可以识别出“关联诡辩”、“因果诡辩”和“胡乱回归分析”的错误。一旦你习惯于指出捏造的规律和错误关联,你就会发现它们无处不在。你会弄明白广告商怎样吹嘘他们的产品、官僚主义者怎样掩盖他们的错误决策、神棍怎样说服易受蒙骗的人们相信他们那毫无意义的“预言”。尽管数学知识还不足以阻止那些破坏经济体系的奸商、那些窃取选举胜利果实的政客和那些暗中侵蚀并损害司法体系的法官,它至少可以揭穿那些作恶多端的人的真面目,让他们无法把恶行隐藏到不为人知的地步。
复杂的数学知识是唯一可以对抗“数字的骗术”的手段,而且我们的知识水平将决定我们是屈服于“数字的骗术”还是勇敢战胜它。这可不仅仅是运用花言巧语的口舌之争,数字将决定人类民主的未来,成败在此一举。
附录A:统计误差
假如你是一位民意调研人员,而现在正是2000年10月——一个适合实施民意调研的绝佳时机,因为小布什和戈尔正在竞选美国总统一职。你并不了解他们俩的支持率非常接近(毕竟你还没有对此实施民意调研呢),但整个国家似乎已经被精确地等分成了两半:大约50%的州倾向于支持小布什,而另外50%的州倾向于支持戈尔。真相——全体选民的真实倾向——被正好从中截然分开了。排除了所有差错的理想的民意调研会显示出两位候选人的支持率都在50%左右。
让我们一起来实施一次民意调研,看看你的答案是否能够反映真相。想回到2000年去询问当时选民的真实意愿,这完全不切实际。幸运的是,有一种合适的东西足以替代2000年的选民:硬币。正面朝上,小布什;背面朝上,戈尔。
现在一起来问问硬币吧:“不好意思,冒昧打扰一下……你愿意投票给小布什还是戈尔?”然后把硬币抛到空中——出现的结果大约会有50%倾向于小布什,另外50%倾向于戈尔,这精确地模拟了当时全体选民中出现的两种意见支持率相当的状况。在这场特殊的情景剧中,抛硬币正好模拟了向选民提问并了解他们愿意支持谁的整个过程。
“正面朝上?那么结果是支持小布什。很感谢占用了您的宝贵时间。”
向人们提问需要花钱,我们假设你服务的公司很不景气,他们只能提供给你一点零钱,这点钱只够支付给16位被调研对象。那么,这意味着现在你需要抛16次硬币,然后统计正面朝上和背面朝上的结果出现的数量。
你的民意调研能得出正确结果吗?结果碰巧是8次正面朝上、8次背面朝上,正确表达了全体选民中两种意见支持率相当的状况吗?很可能并非如此。当你抛16次硬币时,正面朝上和背面朝上的结果恰好各占一半的可能性仅为大约1/5。绝大多数情况下,你的民意调研会得到存在着轻微偏差的结果。你经常会发现,代表小布什的正面朝上的结果出现了9次,代表戈尔的背面朝上的结果出现了7次,它所反映的情况似乎是获得了56%的选票的小布什领先于获得了44%的选票的戈尔。同样,你也经常会发现代表小布什的结果只出现了7次,而代表戈尔的结果出现了9次,似乎正好反映出与刚才相反的趋势。当然,代表小布什的结果出现10次、代表戈尔的结果出现6次的情况或者与之对应的情况也出现得比较频繁——似乎反映了其中一位候选人获得了大约62%的选票并且领先于只获得了大约38%的选票的另一位候选人的情况。
如果你反复模拟民意调研(不妨试试看),那么你就会发现每轮抛硬币得到的结果都在相当大的范围内波动。有时候,民意调研表现得极其精准——两类结果拥有合适的比例,反映了两位候选人正处于并驾齐驱的状态。然而由于随机性的影响,更多时候,你碰巧会遇到显示支持其中一位候选人的结果较多的情况,不自然地反映出一位候选人领先一些的状态。在大约80%的情况下,你会得到错误的结果——只是因为运气而已。这就是统计误差,而且这是抽样方法带来的不可避免的后果。随机法则在民意调研过程中渗入了不确定性。你永远无法确信自己的答案反映了真相。
幸运的是,统计误差是相当易于预测的。如果你反复进行拥有16位调研对象的民意调研而且描绘出结果发生的百分比,你就会发现它们按照一种特定的规律演变——这种规律就是上图中的钟形曲线。
如果统计误差并不存在,如果你的民意调研结果总能完美地反映真相,结果就不会显示成曲线的样式了,而是一条沿着50%标记延伸的线段。你的每一次民意调研都会得出50%选票投给了小布什、50%选票投给了戈尔的结果。然而,现实世界不是这样的。统计误差导致你得到了延伸幅度较大的曲线。有时你的民意调研得到了正确的统计结果,但大多数时候你的结果是有偏差的,而且偏差很明显。曲线的延伸幅度越大,你的民意调研偏离真相的程度越明显。
你没办法消灭统计误差,只能想办法缩小它。如果你可以说服你的老板支付更多的钱,让你能够征求到64位调研对象来替代最初的16位调研对象,上图中的曲线的延伸幅度就变小了。
这意味着你的民意调研出现较大偏差的可能性变小了。你的调研对象越多,随机误差让调研结果大幅度偏离真相的可能性越小。随机误差绝对不会完全消失,但是你可以通过在民意调研中不断增加调研对象的方法来让它的误差减小。比如说,如果你成功地找到了1024位调研对象,那么曲线就会变成下图中的样子。
正如你能预料到的那样,绝大多数时候,你民意调研的结果会相当接近真相。当你只拥有16位调研对象时,你常常会发现调研结果居然显示小布什或戈尔的支持率领先对手达到20个百分点以上,但这种情况绝对不会在拥有1024位调研对象的民意调研中出现。
误差范围是什么呢?它本质上是对曲线的延伸幅度的计量。在这几张插图中,误差范围就是插图最下方用线段作出的标记,它标明了多次民意调研的结果在95%的情况下所在的区间。在95%的情况下,拥有16位调研对象的民意调研所反映出的支持小布什的选民的百分比在26%~74%之间。这意味着,在95%的情况下,得出的结果与支持小布什的选民恰好为50%的真相的差距不超过24个百分点。这就是拥有16位调研对象的民意调研的误差范围——正负24个百分点。在极端情况下,你得到的民意调研结果会因为统计误差偏离24个百分点以上,这种情况会发生,但很少见。
当民意调研拥有64位调研对象时,曲线的延伸幅度变小了,所以误差范围也缩小了。这样一来,在95%的情况下,拥有64位调研对象的民意调研所反映出的支持小布什的选民的百分比在39%~61%之间——误差范围为正负11个百分点。民意调研的调研对象越多,误差范围就越小。当民意调研拥有1024位调研对象时,曲线的延伸幅度会变得相当小,误差范围随之缩小到正负3.1个百分点,你有95%的把握确认调查结果与真相的差距不超过3.1个百分点。曲线的延伸幅度进一步变小,民意调研的结果偏离真相的可能性就更小,而误差范围也进一步缩小。
随着你的样本空间越来越大,误差范围会越来越小。它绝不会完全消失,但它能够降低到足够合理的水平——使得民意调研者不再为它担忧,转而为那些不属于统计误差、有可能导致民意调研失去实际意义的差错担忧。
附录B:电子投票
今天,只要谈到选举活动中的欺诈行为,我们就不得不讨论电子投票。许多批评家非常关注电子计票机的出现,其中多数来自左翼。他们十分害怕这类电子机器会让投给他们的选票消失得无影无踪,或者会导致对方政客只需轻轻按动开关就能窃取选举胜利果实。电子投票的确有可能带来更严重的选举混乱。然而它也拥有光明的前景,它可以让选举活动变得更完善,减少错误、节省时间和金钱。
就理想状态——假如电子计票机可以完美地完成任务——而言,电子投票有许多优点。最显著的优点便是选举活动的工作人员不用再清点选票了,只要选民在投票时按下按键或者在触摸屏上按下相应区域来表明自己的意愿,他的选票就在投下的一瞬间被正确地统计了。投票、清点、制表都不用分开进行了。选举活动的工作人员们更不用设计、印刷、运输和存储纸质选票了,选举活动的成本因此大为降低。更为重要的是,电子计票机可以让残疾人士更为方便地投票,比如说机器可以发出语音提示让盲人选民表达自己的意愿。负责选举活动的官员们很希望尽快采用电子计票机,这一点也不奇怪。
然而,电子计票机也有缺点。跟采用纸质选票的传统投票方式不同,电子投票方法意味着电子计票机不包含任何实实在在的物理记录介质。你按下相应的按键,并且希望电子计票机能正确地记录下你的选票,但即便它漏记、误记了你的选票,你也永远不会知道真相。结果,当电子计票机出现故障时,它们有时会这样,会完全破坏相关选民的选票结果。在2000年美国大选中,电子计票机的程序错误在新墨西哥州导致至少678张选票被漏记。(阿尔·戈尔在该州以多获得366张选票的优势“胜出”。)据报道,全球各地都发生过电子计票机漏记选票的事情,比如说,2008年一位法国计算机专家曾宣称,在该国使用电子计票机的各个选区,选票被漏记的可能性是惊人的。所有法国选区都出现了抵达投票站的选民人数与实际记录的选票数不符的情况,相对应的两个数字的差距在使用电子计票机的选区达到了30%,而在使用传统纸质选票的选区仅有5%。此外,电子计票机似乎还能凭空捏造出选票:2003年,在一场艾奥瓦州布恩县举行的地方性选举活动中,注册投票选民仅有19000名,然而电子计票机汇总出的选票却有144000张。有时候电子计票机会“夺走”某位候选人的一张选票然后算成另一个的。在2000年美国大选中,佛罗里达州的某些电子计票机居然把戈尔的得票数记录成大约—16000张,而把小布什的得票数记录成大约2800张——上述情况都发生在一个注册投票选民不到600名的县。今天市场销售的许多电子计票机都带有各种软硬件缺陷而且设计得很糟糕,所以很多选民(无可争议地)小心提防它们。
工程师们如何保证这些电子计票机值得信赖,也就是说它们能够正确地清点选票?这确实是个难题。如果你在办事时希望确认已经办理成功,那么你会索取回单,比如说,当你到银行存款时,存款机可以提供一张纸质回执向你证明交易顺利完成了。这意味着,如果银行无法提供交易记录,你就可以证明机器出错了。非常不幸的是,你在选举活动中投票时拿不到类似的回单。如果你能拿到回单,那么有些污秽不堪的事情就会发生:“嘿,伙计!如果你明天不投票给戈登·布朗先生,那么我看到你的投票回单之后就会打断你的膝盖骨。”一旦你想要让选民留下任何足以表明他们投票选择的证据,你就创造出了适合胁迫他人投票和买卖选票的肮脏环境。所以选民不能留下任何类型的投票回单,以免陷入困境当中。
另一种可行的解决办法是:让电子计票机打印回单,但把它们存储在机身内,只让选民查看回单但不让选民拿走。这种方法就是所谓的“经选民验证后备案记录”,确实可以在一定程度上改进电子投票方法。然而,它仍然存在着一些严重问题。首先,它会提高整体成本,因为打印回单用的纸、墨都要花钱买。其次,它带来的卡纸、错误走纸等问题会使电子计票机更容易出现故障。然而,这都是小问题,最重要的是“备案记录”依然没有解决如何正确计票的核心问题。比如说,某位选举活动主管发现电子计票机打印出的回单的汇总结果与机器本身显示的电子记录结果不吻合。那么你觉得他应该相信电子记录还是回单汇总结果呢?情况扑朔迷离,难以弄清。原因有可能是电子计票机里潜伏的软硬件缺陷导致电子记录的结果不准,也同样有可能是少数回单被卡在了电子计票机内部、被工作人员弄丢甚至只是在清点时被遗漏了(正如我们曾经提到过的那样,纸质选票也经常会遇到这种问题)。到底是什么导致出错?通常情况下,机器比人可靠,所以你很难使用人工清点回单得到的汇总结果来驳倒机器的电子记录。
“经选民验证后备案记录”确实会为电子投票方法带来一定程度的改善,但作者以为更好的解决方案是公开电子计票机的源代码。如果把它运行的软件公之于众,接受大家的仔细审查——如果任何程序员都可以在这些代码中检索其中的差错,那么我们就会更加信赖电子计票机的可靠性。其硬件架构也不妨公开。只要电子计票机的软硬件设计仍被列为某些公司的商业机密,电子计票机仍然运行着不允许公众检验的带缺陷的软件,公众就有足够的理由来质疑电子投票方法。
据报道,目前已有利用电子计票机在选举活动中舞弊的事件发生了。2007年在肯塔基州举行的一场地方选举活动中,一个法官、一个书记员、一个竞选活动主管以及一群其他身份的被告人供认他们勾结在一起操控了6个地方职位的选举结果,他们使用的手段就包括篡改电子计票机的数据。根据起诉书列举的证据,这帮阴谋家故意在介绍使用电子计票机的方法时误导选民。他们告诉选民,只需按下电子计票机上标有“投票”的按键,投票结果就被记录下来了。事实上,还有一个步骤——让选民查看选票的当前内容,并且可以自愿修改。最终,当选民按下标有“确定”的按键后,选票内容才最终正式确定。选民按下标有“投票”的按键就离开了那里,而这帮阴谋家则偷偷溜到电子计票机前面,更改选票内容并按下标有“确定”的按键,让电子计票机认为是选民自己“更正”了选票内容。这种手段是没有什么技术含量的。它比电子计票机里隐藏着的任何软硬件缺陷都严重,更为直接地窃取了被迷惑的选民的选举权,而且它表明邪恶的事情往往会在你根本没有注意到的地方冒出来。
电子投票方法的确会对选举制度的可靠性造成潜在的风险,但这种风险是可以避免的。而且,如果有关部门正当地贯彻执行电子投票方法,选举活动中有可能出现的差错就能被控制到最低限度,我们不再因为手工清点选票这种方式自身的缺陷而无法准确统计出选票数量了。而且总的来说,跟其他便于政客使用“数字的骗术”来赢得选举的方法相比,电子投票方法似乎问题不多、相对公正。
附录C:“检察官谬论”
“检察官谬论”只是在人类解读事情发生的可能性时遇到的困难当中的一点点小花招儿。法律专家可以故意不以正当的方式来解读可能性,以便在证据不足的情况下利用它让被告的“罪行”显得无可辩驳。
为了阐明这是一种谬论,我们首先暂时关注一下司法体系以外的东西。假设医学研究人员发现了一种罕见的致命性疾病——脑袋爆炸综合征(Head-Exploding Syndrome,HES)。其致死率高达100%,如果你不幸患上了这种疾病,你就会极其痛苦,最后难看地死去。幸运的是,医学研究人员已经研发出了一种血液化验方法来判断你是否患上了脑袋爆炸综合征。这种化验方法极端准确——它发生差错的可能性只有1/1000000。借助这种化验方法,医生们开始逐个检查居民来寻找脑袋爆炸综合征案例。
于是你来到医院接受化验,医生抽取你的血液并离开了诊室。几分钟后,她脸色惨白如同鬼魅地回到这里,告诉你“化验结果呈阳性”。由于化验方法极端准确——发生差错的可能性只有1/1000000,这几乎可以确诊你患上了脑袋爆炸综合征。既然这个结论出错的可能性只有1/1000000,这就意味着你患上这种疾病的可能性只有1/1000000,对吗?
别那么快断言。在你相信自己确实患上脑袋爆炸综合征以前,不要忽略了一条重要的信息。你必须设法了解这种疾病的真实发病率。碰巧的是,脑袋爆炸综合征格外罕见——流行病学家估计,在全世界范围内,它只能在10亿人中感染1个人。这意味着在全世界70亿人当中,只有7个人会患上这种疾病。这一点极为重要,因为它有助于你更清醒地了解阳性化验结果在真实背景中的含义。
发生差错的可能性只有1/1000000的化验方法固然极端准确,但如果你把它放大到全世界70亿人当中,这1/1000000的差错就会导致大约7000个人在接受化验时拿到错误结果。这就是说,在全世界范围内,会有7000个没有患上这种疾病的人得到“呈阳性”的化验结果。因为真正的患者只有7个人,所有绝大多数得到“呈阳性”化验结果的人并没有患上这种疾病。确切地说,如果你得到了“呈阳性”化验结果,那么你患上脑袋爆炸综合征的可能性仅为7/7000——或者0.1%。然而,这个化验结果出错,你没有患上这种疾病的可能性高达99.9%。你可以高枕无忧了。1/1000000的发生差错的可能性误导了你,这种可能性本身没有任何意义。仅当你在真实背景中观察这个可能性——把它与1/1000000000的发病率对比——时,你才能算出自己真正患上这种疾病的可能性。
你需要从这件事中学到一点,那就是可能性必须在真实背景中才有意义。绝不要同等地看待化验结果正确的可能性和你患上这种疾病的可能性,那是荒谬的。反之,你应该把化验结果出错的可能性和疾病出现的可能性对比——而且当疾病非常罕见时,它会让化验结果出错的可能性增大许多倍。
这就是所谓“检察官谬论”的另一种形式。我们讨论的是血液化验和疾病,而审案时讨论的是证据和罪行,但其数学原理是一样的。法律专家可以脱离真实背景宣布某种情况为假的可能性极小。结果,这极小的可能性就导致陪审团完全信赖了这种情况。如果法律专家提供了这种情况的真实背景,它就不会具备那样强的说服力,甚至会让陪审团作出相反的裁决。
比如说,艾伦·德肖维茨为辛普森进行无罪辩护的理由是,习惯殴打妻子的丈夫最终谋杀妻子的可能性仅有1/1000。他暗示这个数字足以表明辛普森有罪的可能性仅有1/1000。这就是实实在在的“检察官谬论”,因为德肖维茨并没有提供真实背景。在尼克尔·布朗被谋杀的那一年,35岁的女人被谋杀的可能性仅为极低的1/40000,这使得1/1000的概率变得没有任何意义。1/1000000000的发病率会让血液化验的1/1000000的差错可能性变得巨大无比,1/40000的可能性同样也让1/1000的可能性变得巨大。当统计学家按照恰当的方式来分析这些数字时,他们发现辛普森谋杀前妻的可能性其实非常大——超过了50%。如果德肖维茨提供了真实背景,那么这一点应该很清楚:辛普森曾经殴打前妻,这使得他更有可能就是凶手。
同样,梅多爵士在指控萨利·克拉克杀害自己的孩子提出的可能性是存在的(但在这里并不属实),它单独出现就具有了欺骗性。梅多并没有考虑到英国人沦为谋杀犯的可能性相当小——连续谋杀犯更加罕见。如果把那些本来应该考虑到的可能性都纳入比较范围,梅多提出的可能性就不会对陪审团产生那么大影响了。的确,利用数学手段很容易算出萨利·克拉克并非连续杀害自己两个孩子的凶手的可能性高达90%左右——这远远大于梅多宣称的她不是凶手的可能性:1/73000000(也就是同一个家庭中连续出现两例“突发性婴儿死亡综合征”的可能性)。
“检察官谬论”相当有效,因为它利用了人类习惯于错误解读可能性的天性。一个极小的可能性(比如血液化验的/1000000的差错可能性)在适当的真实背景中会变得巨大,这是违背直觉的。结果,当检察官故意忽略掉真实背景、耍弄起数字花招儿时,几乎没人能注意到,这使得疑案似乎变成了定案。