概论
前言
我再次读完了著名「神棍」雷·库兹韦尔的书,还是有些收获的。
我学过的纳米机器人相关的知识在此刻让我轻松理解这块内容。本书则扩展了一些新的用法——完全克服生物器官的局限性实现大幅延长寿命。虽然前不久的阅兵式开幕前的谈话引发了恐慌,但我还是期待这一天的到来,我觉得我可以等到,但它们不行。
作者在新作中重申了那本书中的两个关键日期:AI将在2029年达到人类智能水平,并在2045年与人类融合,这一划时代的事件被称为“奇点”。我认为这是不现实的,至少前者是不现实的。现有的大语言模型实际上只是概率计算的结果,而非真正的智能。「世界模型」也还在起步阶段。现阶段我认可 Yann Lecun 的看法。
关于未来AI造就的失业问题,我也认为UBI是一种解决办法。但我们要尽量成为发福利的人,而不是领福利的人,这让才能掌控自己的命运。
关于个人记忆上传到云端,我觉得这个是一个有前景的方向。但是如何复刻情绪是一个至关重要的问题,这也影响其冻体复活的问题。此外,伦理上的人的定义又要成为讨论的重点。
节选一点内容贴在这里吧:
今天,这些容易实现的进展大多已经实现。导致疾病和残障的其余原因主要源自我们体内。由于细胞功能失调和组织崩溃,我们会患上癌症、动脉粥样硬化、糖尿病和阿尔茨海默病等疾病。我们可以在一定程度上通过改变生活方式、饮食和服用营养补充剂来降低这些风险,我称之为通向大幅延长寿命的第一座桥梁。但这些方法只能推迟不可避免的死亡。这就是为什么自20世纪中期以来,发达国家的人口预期寿命增长放缓。例如,从1880年到1900年,美国人出生时的预期寿命从大约39岁延长到49岁,但从1980年到2000年,在医学的研究重点从传染病转向慢性病和退行性疾病之后,人口预期寿命只是从74岁延长到了76岁。
幸运的是,在21世纪20年代,我们正在走上第二座桥梁:将AI和生物技术结合起来,战胜那些退行性疾病。研究人员已经不再仅仅依靠使用计算机来整合干预措施和临床试验的相关信息。如今,他们正在利用AI来寻找新药,并且在2030年左右,数字模拟可用于扩大并最终取代进展缓慢、效率低下的人体试验。实际上,我们正在将医学转变为信息技术,利用这些技术所能够带来的指数级进步掌握人体生物学的“软件”。
这方面最早和最重要的例子之一出现在遗传学领域。自2003年人类基因组计划完成以来,基因组测序的成本呈指数级下降趋势,平均每年下降一半左右。尽管2016年至2018年测序成本下降过程中出现了短暂平台期,以及COVID-19大流行导致进展放缓,但测序成本仍在持续下降。随着先进的AI技术在测序中发挥更大的作用,这一趋势可能会再次加速。单个基因组测序的成本已经从2003年的5000万美元下降到2023年初的399美元。一家公司承诺,当你读到这篇文章时,他们将以100美元的价格提供基因组测序服务。
随着AI越来越多地改变医学领域,它将引发许多类似的趋势。AI已经在临床方面产生影响,但我们仍处于这条特殊指数曲线的早期阶段。到21世纪20年代末,目前应用方面的涓涓细流将汇聚成一股洪流。届时,我们将能够直接解决目前将人类最长寿命限制在约120岁的生物学原因,包括线粒体基因突变、端粒长度缩短以及导致癌症的不受控的细胞分裂。
在21世纪30年代,我们将跨上彻底延长寿命的第三座桥梁:医用纳米机器人,它们能够在我们的身体内智能地进行细胞层面的维护和修复。根据某些定义,一些生物分子其实已经可以被看作纳米机器人了。但是,纳米机器人的独特之处在于,它们能够被AI控制,以执行不同的任务。在这个阶段,我们将获得对自己生物学身体的控制能力,就像维修工对汽车部件的控制能力一样。也就是说,除非你的车在一次重大事故中完全报废,否则你可以无限制地继续修理它或更换零件。同样,智能纳米机器人将能够有针对性地修复或升级个别细胞,从而帮助人类彻底战胜衰老。在后面的第6章,我们将对此进行更详细的讨论。
第四座桥梁——能够以数字化方式备份我们的思维文件,将是21世纪40年代的技术。正如我在第3章中所论证的那样,决定一个人身份的核心因素不是他的大脑,而是他的大脑能够表示和操纵的信息的特殊排列。一旦我们能够以足够高的精度扫描这些信息,我们就能够在数字载体上复制它。这意味着即使生物大脑被摧毁,一个人的身份也不会被摧毁。通过安全地对其进行复制备份,这个身份可以获得几乎无限长的寿命。
书籍简介

作者: [美] 雷·库兹韦尔
出版社: 中国财政经济出版社
出品方: 湛庐文化
原作名: The Singularity Is Nearer: When We Merge With AI
译者: 芦义
出版年: 2024-9-30
页数: 364
定价: 119.90元
装帧: 平装
ISBN: 9787522333977
内容简介
关于未来20年的预言,一幅走向奇点的未来生存指南与路线图。
继《奇点临近》之后,雷·库兹韦尔的又一部里程碑式作品!探讨以人工智能、生物技术及纳米机器人为代表的指数型技术将如何推动人类走向奇点!
库兹韦尔通过扎实的论证,在书中重申了他对未来20年的大胆预言——AI将在何时通过图灵测试;人类将在何时迈入奇点;持续发展的人机融合技术将如何使人类智能增强数百万倍;人类寿命如何实现延长,超越目前120岁的生物学限制;可再生能源技术的不断完善将如何满足我们所有的能源需求;指数型技术将如何改变人类生活的方方面面等。我们即将迈入认知、生活乃至生命被重构的时代,一切都将重新开始!
生物技术、纳米技术、人工智能技术将如何重塑未来,一场关涉未来商业、生活、工作、健康等领域的超级预言。
不断融合的指数增长的技术趋势将带来一场对人类具有根本性意义的变革。未来的商业、工作、健康与生活都将被重构。
未来的商业:指数级发展的技术将革新实物的创造和分销模式!
未来的工作:AI革命以指数级速度发生,这将导致超过一半的职业被自动化设备取代的可能性都在 50% 以上!
未来的健康:医用纳米机器人将能够在细胞层面进行维护和修复,人口预期寿命将突破120岁,我们的思维文件将可以数字化方式备份,甚至实现“永生”!
未来的生活:几乎生活的每个方面都在变得更好,变得更轻松、更安全、更丰富、更美好!
作者简介
雷·库兹韦尔是美国著名的未来学家、计算机科学家、作家、企业家和发明家。
在人工智能、机器人以及深度学习等领域,库兹韦尔被视为颠覆世界的未来学家和超级预言家。比尔·盖茨称:“库兹韦尔是最擅长预测人工智能未来的人!”他的预测涉及人工智能通过图灵测试、纳米机器人的发展、人类寿命的延长趋势以及可再生能源的发展等多个关系人类生活的方面。
之前,库兹韦尔曾发布了一份名为《我的预测结果如何》(How My Predictions Are Faring)的报告,分析了他在出版的多部作品中所作的预测。结果显示,他的预测准确率高达86%!库兹韦尔曾预言,人工智能计算机会在1998年战胜人类国际象棋世界冠军,这一预言在1997年应验。他也曾预言会出现一种世界级的计算机网络,到那时,信息传递将更加便捷——今天的互联网、Facebook、Twitter、微信、微博就是明证。
在2008年,库兹韦尔就预测称,未来太阳能发电规模的增长将满足地球上所有人的能源需求。他还预测称,在2029年,人工智能就将通过图灵测试。此外,他还预测我们未来将在虚拟环境中度过一些时间,纳米机器人将帮助我们对抗疾病,提升我们的记忆力和认知能力。
迄今为止,库兹韦尔因为他的多项重要发明获得了多个重量级奖项,包括美国科技领域的最高荣誉——国家技术创新奖,奖金高达50万美元的麻省理工学院勒梅尔森发明奖,并入选美国发明家名人堂。此外,他还入选了美国国家工程院院士。他拥有21个荣誉博士学位,曾从3位美国总统手中接过荣誉勋章。
《华尔街日报》称他为“永不满足的天才”;《福布斯》杂志称他为“终极思考机器”;《公司》杂志将其评选为“顶尖创业家”之一,并形容他是“爱迪生的法定继承人”;美国公共广播公司将库兹韦尔与过去两个世纪的发明家一起评选为“开创美国的16位改革家”之一。
他是个天生的发明家,而且似乎永远不会满足。自小,他就是科幻文学的拥趸,熟读“汤姆·斯威夫特系列”图书。七八岁时,他创立了一个机器人木偶剧院,而且还开办了机器人比赛。12岁时,库兹韦尔开始花费大量精力做计算机和相关设备的发明工作。14岁时,他便写出了一篇详细论述大脑皮质的论文。在他的感染下,他的家中总是充满关于未来和技术的讨论。
上高中后,库兹韦尔开始向在贝尔实验室当工程师的叔叔学习计算机科学的基础知识。一年后,15岁的他便写出了自己的第一个计算机程序。17岁时,他创建了一个模式识别软件,用于分析古典作曲家的作品,然后合成自己的歌曲。库兹韦尔还参加了电视猜谜节目《我有一个秘密》,并熟练地弹奏了一段不同寻常的乐曲。他的秘密很快被猜中了:这段乐曲是由计算机谱写的,而这台计算机正是他自己组装的。
在进入麻省理工学院学习后,库兹韦尔师从“人工智能之父”、《情感机器》《心智社会》的作者马文·明斯基,并于1970年获得计算机科学与文学学士学位。库兹韦尔在一年半的时间里修完了麻省理工学院提供的所有计算机编程课程。
从20世纪80年代开始,他的发明可谓硕果累累——全字体光学字符识别系统、语音识别系统、盲人阅读机、音乐合成器等,他的发明专利同样数不胜数。
从20世纪90年代开始,库兹韦尔将目光转移到未来上,他创立了加速回报定律(也称“库兹韦尔定律”),提出计算机技术等通用技术将会以指数倍级,而非线性级发展,未来15~30年人工智能将呈现爆炸式的突破性发展,更多超乎我们想象的事物也会出现。
为了迎合技术指数级增长的趋势,库兹韦尔认为需要聚集世界上最聪明的大脑,让他们学习最前沿的未来科学,去解决世界上最宏大的问题。这一观点得到了NASA和谷歌公司的支持,它们共同创立了奇点大学,并任命库兹韦尔为奇点大学校长。
奇点大学的神圣使命就是培养面向未来的人才,这所大学也被称为“未来领袖训练营”。从世界各地严格甄选出来的天才们,将在这里致力于神经科学、人工智能、纳米技术、基因工程、空间探索、虚拟现实以及物联网等领域的技术探索,比如,尝试通过3D打印建造房屋或者研制太阳能航天器等。在库兹韦尔的带领下,人们已经为应对气候恶化、能源紧缺、疾病和贫困等重大问题做好了准备。
2012年,谷歌联合创始人拉里·佩奇亲自聘请库兹韦尔入职谷歌,担任谷歌工程总监,负责机器学习与语言处理的项目研发。2015年2月8日,库兹韦尔因其发明的K250合成器获得了格莱美技术奖。在谷歌,库兹韦尔从事的项目便是将搜索建立在对语言的真正理解上,目标是超越沃森,使计算机能真正地阅读网络、图书中的内容,从而与用户进行智能对话。
面对人工智能可能是人类最大生存威胁的质疑浪潮,库兹韦尔表示,人工智能技术的确是把双刃剑,我们可以从中获益,但也得做好规避风险的准备,关键是制定具体战略,引领人工智能技术往积极正面的方向发展。
他写过多部关于健康技术、人工智能、超人类主义、技术奇点和未来主义的现象级畅销书。同时,他也是未来主义和超人类主义运动的公开倡导者。库兹韦尔曾在大量公开演讲中分享他对延长寿命的技术、纳米技术、机器人技术和生物技术的未来的乐观看法。
在20世纪90年代,库兹韦尔创立了医学学习公司。1999年,库兹韦尔创建了一家名为“FatKat”的对冲基金公司,目标是提高FatKat的人工智能投资软件程序的性能。库兹韦尔预测,总有一天,计算机会比人类更擅长做出有利可图的投资决策。库兹韦尔还加入了阿尔科生命延续基金会,这是一家人体冷冻公司。他计划在去世之后通过灌注冷冻保护剂,将自己的身体储存在该基金会的设施中,并希望未来的医疗技术能够使自己复活。此外,他还在通过多种方式改善自己的健康状况,试图“重新编程”自己的生物学身体。
作为未来主义者和超人类主义者,库兹韦尔参与了多个以奇点为主题的组织。2004年,他加入了美国机器智能研究所的顾问委员会。2005年,他加入了救生艇基金会的科学顾问委员会……
在对未来的设想中,库兹韦尔将人体视为一个由数千个“程序”组成的系统,并认为了解它们的所有功能可能是构建真正有感知的人工智能的关键。他还主张全民基本收入制度,认为纳米技术可以帮助解决严重的全球性问题,如贫困、疾病和全球气候变化……
正文摘录
引 言 人类迈向奇点的千年征程已步入冲刺阶段
我无法确定地说奇点之后的生活会是什么样子。但通过理解和预测带领人类走向奇点的过程,我们可以确保人类在最后接近奇点时的道路是安全和成功的。
2005年,在《奇点临近》(The Singularity Is Near)中,我提出:不断融合的指数增长的技术趋势将带来一场对人类具有根本性意义的变革。今时今日,这场变革正在多个关键领域同时加速:计算的性价比越来越高,我们对人体生物学的理解越发深入,在微观尺度上的研究变得更具可行性。随着AI的能力日甚一日,信息变得越来越触手可及,我们正在将这些能力与人类智能愈发紧密地整合起来。纳米技术将使这些趋势达到高潮,开启一条利用云端虚拟神经元层直接扩展人类大脑的道路。通过这种方式,我们将与AI融为一体,并利用比人类强数百万倍的计算能力来增强自己的能力,这种智能和意识的提升影响深远,以至于人们会感到难以完全理解。我所谓的“奇点”,正是指这一事件。
“奇点”这个术语源自数学和物理学。但我使用这个词是将其作为一个比喻。我对技术奇点的预测并非指变化速度将真的趋向无穷,因为指数增长并不意味着无限,物理学中的奇点也是如此。黑洞虽然引力大到可以捕获光,但量子力学并不能解释真正无限大的质量。我之所以用奇点作为隐喻,是因为它恰如其分地描述了人类当前的智能难以理解如此巨大转变的困境。但随着这种转变的到来,我们的认知能力将迅速增强,足以适应新的变化。
在《奇点临近》中,我详细展望了未来一段时间内的发展趋势,并推测奇点大约会在2045年到来。书出版时,距离预测时间还有40年,相当于两代人的时间。从当时的时间周期上说,我可以对引致该转变的多种力量做出预测,但对于当时的读者来说,这个话题仍然很遥远。许多评论家认为我的时间表太过乐观,甚至有人认为奇点根本不可能出现。
之后出现了一些令人瞩目的进展,虽然怀疑论者仍在表达反对意见,但这些进展仍在继续加速。社交媒体和智能手机从几乎无人问津到成为连接全球多数人的全天候伴侣。算法创新和大数据的涌现使得AI在一些领域取得了超出专家预期的突破,从擅长解题[玩《危险边缘》(Jeopardy!)游戏]、下围棋到驾驶、写作、通过法律职业资格考试,乃至诊断癌症。目前,强大且灵活的大语言模型,如GPT-4和Gemini,能将自然语言指令转换为计算机代码,极大地减少了人类与机器之间沟通的障碍。你阅读这段文字的时候,很可能已经有数千万人亲身体验了这些功能。与此同时,人类基因组测序的成本下降了约99.997%,而神经网络通过数字模拟打开了医学研究的新篇章。我们甚至获得了直接将计算机与大脑连接的能力。
这一系列的进步都建立在我所称的“加速回报定律”(Law of Accelerating Returns)之上:随着技术的不断进步,计算和其他信息技术的成本呈指数级下降,因为每一次的进步都会让它们下一阶段的迭代变得更为简单。因此,考虑到通货膨胀,现在1美元能购买的计算能力比《奇点临近》出版时强大约11200倍。
图0-1中的内容我将在后面的章节中做深入讨论。图中概述了推动人类技术文明进步的核心趋势:在长期范围内来看,随着时间的推移,一美元能购买的计算能力呈指数级增长(在对数刻度图上是一条直线)。众所周知,摩尔定律指出,晶体管尺寸在逐年缩小,随之而来的是计算机日益强大,但这只是“加速回报定律”的一种表现形式。在晶体管发明之前,这个定律就已经成立,即便在晶体管达到物理极限并被新技术取代之后,它仍有望会持续下去。这个趋势定义了现代世界,在本书中讨论的即将实现的所有突破,都直接或间接地依赖于它。
我们一直在按计划迈向奇点。这本书出版的紧迫性源自指数变化的核心。在21世纪初还难以察觉的趋势,现在已经实实在在地影响着数十亿人的生活。2020年以来,我们进入了指数曲线急剧变陡的部分,创新的步伐给社会带来的影响前所未有。为了给你一个参考,你阅读这段文字的时间点,可能距离首个超人类AI的诞生更近,而不是离我的上一本书《人工智能的未来》(How to Create a Mind)的出版时间更近。与我1999年出版的《机器之心》(The Age of Spiritual Machines)相比,你现在恐怕离奇点降临更近。从人类的生命周期来看,现在出生的婴儿在奇点到来时将刚刚大学毕业。在个体层面上,这是一种与2005年相比完全不同的“接近”。
正因如此,我才写了这本《奇点更近》。人类迈向奇点的千年征程已经步入冲刺阶段。在《奇点临近》的前言中,我曾写到我们当时正处在这一转变的初期。而现在,我们进入了高潮期。那本书是对遥远地平线的一瞥,这本书则讲述的是走向地平线的最后几公里。
幸运的是,我们如今更能清晰地看懂这条道路。尽管要实现奇点还面临诸多技术挑战,但关键的先行指标正迅速地从理论科学走向积极的研究与开发之路。在未来10年里,人们将与看起来非常人性化的AI互动,简单的脑机接口将像今日的智能手机一样普及,并对我们的日常生活产生影响。生物技术领域的数字革命将帮助我们治愈疾病,并显著延长人类的寿命。然而,与此同时,许多劳动者也将经历由于技术革新造成的经济动荡之痛,而我们所有人都将面临对新技术的不慎或蓄意误用导致的风险。到21世纪30年代,不断进步的AI和日渐成熟的纳米技术将以前所未有的方式促进人机结合,这将进一步放大可能的希望与潜在的危机。如果我们能够成功应对由这些进步带来的科学、伦理、社会和政治方面的挑战,那么在2045年,我们将深刻改变人类在地球上的生活,使之变得更美好。反之,如果我们失败了,我们的生存就会受到威胁。因此,这本书将聚焦于人类奔向奇点的最终路径——我们所了解和熟悉的世界的最后一代人将共同面对的机遇与挑战。
首先,我们将探索奇点的确切到来方式,并将其置于人类长期追求重塑自身智能的背景下。以技术创造感知能力带来了一些深刻的哲学问题,因此我们将深入讨论这场变革如何影响人类的身份和使命感。其次,我们将讨论未来几十年的实际发展趋势。正如我将展示的那样,“加速回报定律”正驱动一系列反映人类福祉的多个指标得到指数级的提升。虽然创新带来的最明显的弊端之一是各种形式的自动化导致的失业,但我们将搞清楚,为什么长远来看仍有理由保持乐观,而且为什么我们最终不会与AI竞争。
随着这些技术为人类文明带来巨大的物质财富,我们将致力于突破限制人类全面繁荣的下一大障碍:生物学上的弱点。接下来,我们将展望未来几十年内人类可以使用的工具,以越来越多地掌握生物学本身:首先是战胜身体的衰老,然后是通过增强人类有限的大脑来迎接奇点的到来。然而,这些突破性进展也可能会使我们面临风险。生物技术、纳米技术或AI的革命性新系统可能会导致某种形式的灾难,例如,毁灭性的流行病或自我复制机器的链式反应。最后,我们将评估这些威胁,这需要我们慎重规划,但正如我将解释的,我们手头的策略非常有希望去消除或缓解这些危机。
这将是人类历史上最激动人心、最重要的几年。我无法确定地说奇点之后的生活会是什么样子。但通过理解和预测带领人类走向奇点的过程,我们可以确保人类在最后接近奇点时的道路是安全和成功的。
第一部分 奇点迫近,与超级AI融合的终极未来
第1章 我们在六个阶段中的哪个位置
到2045年,人类的思维能力将扩展数百万倍。正是这种变化的速率和规模,使得我们可以借用物理学中的“奇点”这个隐喻来描述我们的未来。
在之前的书中,我将意识的基础归纳为信息。我概括地描述了自宇宙诞生以来的六个发展时代或阶段,每一阶段都是基于前一阶段的信息处理而创造出来的。由此可见,智能的进化是通过其他一系列过程来间接推动的。
从宇宙大爆炸到生命诞生再到大脑出现
第一个时代是物理定律和化学定律的诞生,它们使后来发生的一切成为可能。在宇宙大爆炸后的几十万年间,电子围绕由中子和质子构成的原子核运动形成了原子。核内的质子本不应该如此紧密,因为电磁力试图将它们强行推开。然而,碰巧存在一种强大的力叫作强核力,使得质子能够紧密地结合在一起。如果没有这种力,在原子基础上发生的进化将不复存在。
经过数十亿年,原子进化出了能承载复杂信息的分子。在许多分子中,碳是一个最为关键的构建模块,因为它能形成四个化学键,而其他许多原子核只能形成一个、二个或三个键。我们生活在一个复杂的化学世界,这实在是极为罕见的巧合。例如,如果引力的强度稍微弱一点,就不会有超新星产生构成生命的化学元素;如果它稍微强一点,恒星就会在智慧生命形成之前燃烧殆尽。正因为引力常数在一个非常窄的范围内,人类才得以存在。因此,我们所在的宇宙似乎是被精心调谐过的,以允许秩序的存在,从而让生命进化得以展开。
几十亿年前迎来了第二个时代:生命的诞生。分子变得日益复杂,以至于一个分子就能定义一个完整的生物体。于是,有自己DNA的生物得以进化并繁衍生息。
紧接着是第三个时代的到来,那些由DNA描述的动物进化出了大脑,一个能存储和处理信息的新器官。随着时间的推移,大脑在数百万年里为动物提供了进化优势,反过来又使得大脑变得更加复杂。
在第四个时代,动物,特指人类,利用更高级的认知能力,结合灵巧的对生拇指,得以将复杂的思想转化为实际行动。人类开始创造能够存储和处理信息的技术,从纸莎草纸到现代硬盘,这些技术扩展了人类大脑感知、存储和评估信息的能力。这成为推动进化的一大动力,比以往任何时代的进步都更显著。大脑体积增加的速率为每10万年增加1立方英寸,而在数字计算方面,性价比几乎每年翻一番。
第五个时代涉及直接将人类的生物认知与数字技术的速度和力量结合起来,即脑机接口。人类大脑的神经处理速度为每秒几百个周期,而数字计算的速度为每秒数十亿个周期。除了速度和存储能力,用非生物计算机增强人类的大脑,还允许我们在新皮质上增加更多的层,释放现在难以想象的更为复杂和抽象的认知能力。
在第六个时代,我们的智能将延展至整个宇宙,把普通物质转变为能在最密集计算水平上进行组织的数层计算材料(Computronium)。
在我1999年出版的《机器之心》中,我预测在2029年AI将通过图灵测试。图灵测试是指AI系统可以通过人类无法区分的文本与人类交流。我在2005年出版的《奇点临近》中重申了这一预测。AI通过图灵测试表明AI掌握了人类的语言和常识性推理能力。虽然艾伦·图灵(Alan Turing)在1950年提出了这个概念,却没有具体说明测试该如何进行。在我与米奇·卡普尔(Mitch Kapor)的一个赌约中,我们设定了自己的测试规则,它比其他解释要难得多。
通过图灵测试,实现人机融合
根据我的预测,为了让AI在2029年通过有效的图灵测试,我们需要在2020年以前通过AI取得多种智力成就。而事实上,从那时起,AI已经赢得了人类面临的最棘手的诸多智力挑战,包括博弈游戏,如《危险边缘》,以及像放射学和药物发现等严肃应用。截至目前,如Gemini和GPT-4这样的顶尖AI系统正在将它们的能力拓展至许多不同的领域,这些都是通往通用智能道路上令人鼓舞的成就。
值得注意的是,当AI系统真的通过图灵测试时,它必须在很多领域内故意表现得不那么聪明,否则人们将很容易识破。例如,如果它能够即时解决任何数学问题,它就无法通过图灵测试。因此,达到通过图灵测试的水平时,AI在大多数领域的能力将远超最优秀的人类。
如今,人类正生活在第四个时代,我们的技术已经在某些任务上产生了超越人类理解力的成果。因此,对于图灵测试中AI尚未掌握的方面,我们正在快速取得进展。我一直期待着AI在2029年通过图灵测试,这将带领我们进入第五个时代。
21世纪30年代的一个关键进展将是,人类大脑新皮质的上部连接到云,这将直接扩展我们的思维。到那时,AI不再是我们的竞争对手,而是人类个体的延伸。当这个时刻来临时,我们大脑的非生物部分的认知能力将比生物部分强数千倍。
随着这种指数级趋势的发展,到2045年,人类的思维能力将扩展数百万倍。正是这种变化的速率和规模,使得我们可以借用物理学中的“奇点”这个隐喻来描述人类的未来。
第2章 重塑智能意味着什么
我们将与技术共同创造,让我们的思维进化以获得更深刻的洞察力,并利用这些力量创造出让未来的心智去体验和领悟的超凡理念。
如果将宇宙的历史看作信息处理方式不断进化的故事,那么人类的篇章就是在这个故事的后半段展开的。这一章要讲述的是,我们从具有生物大脑的动物转变为超越现有身体限制的生命体,即我们的思想和身份将不再被遗传学所局限的故事。到21世纪20年代,我们即将步入这一传奇变革的最终章——在更为强大的数字基底上重新构建自然赋予我们的智能,并与之融合。这一过程将标志着宇宙从第四个时代迈入第五个时代。
我们为什么必须重塑智能
这一目标具体会如何实现呢?为了理解重塑智能的含义,我们首先回顾一下AI的诞生,以及随之产生的两大思想流派。我们将结合神经科学有关小脑和大脑新皮质如何产生人类智能的研究,来探讨这两种思想为何会有优劣之分。在梳理深度学习如何再现大脑新皮质功能的现状之后,我们可以对AI达到人类水平还需实现什么,以及我们如何辨认它是否实现了这一目标有一个清晰的评估。最终,我们将探讨在超人类AI的帮助下,如何开发脑机接口,通过虚拟神经元层不断扩展我们的新皮质。这一创举将开启前所未有的思维模式,最终使我们的智能扩展数百万倍,引领我们实现所谓的“奇点”。
AI 的诞生与两大流派之争
1950年,当英国数学家艾伦·图灵在《心智》(Mind)杂志发表《计算机器与智能》(Computing Machinery and Intelligence)一文时,他就提出了科学史上最深刻的问题之一:“机器会思考吗?”尽管在此之前,希腊神话中就存在着像塔罗斯(Talos)这样的青铜自动机,但图灵的突破是将这个构想归结为一个可以实证检验的概念。他提出的“模仿游戏”,也就是今日我们所熟知的图灵测试,用来评判机器的计算能力能否够执行与人脑相同的认知任务。在这一测试中,评判员通过即时通信工具与AI和人类参与者进行对话,但不知道具体在和谁对话。评判员可以就他们想要了解的任何主题或情况提出问题。如果评判员在一段时间后仍不能区分出哪一个应答者是AI,那么AI就被认为通过了测试。
图灵将哲学思想转变为科学思想的尝试,激发了科研人员高涨的热情。1956年,斯坦福大学教授约翰·麦卡锡(John McCarthy)提出要在达特茅斯学院举办一场为期两个月的研究,共有10人参与。该研究的目的是:
这项研究是建立在这样一种猜想基础上的,即关于学习或其他智能特性的方面都可以精确描述,以至于机器可以模拟这些特性。我们将尝试寻找方法,让机器学会使用语言、形成抽象概念、解决目前只有人类才能解决的问题,并且能够自我提升。
在筹备一次科学会议时,约翰·麦卡锡提出将这个未来有望革新其他所有领域的新兴科学领域命名为“Artificial Intelligence”(人工智能,简称AI)。尽管他本人并不特别钟情于“Artificial”这个单词,因为这似乎意味着这种智能并不是真实的,但最终,这个名称成了被广泛接受的术语。
……
在探索为何会出现这些突如其来的超越时,答案存在于一个理论问题中,这个问题可以追溯到该领域诞生之初。在我读高中时,也就是1964年,我有幸见到了AI领域的两位奠基人:马文·明斯基(Marvin Minsky)和弗兰克·罗斯布拉特(Frank Rosenblatt)。明斯基是达特茅斯会议的组织者之一。随后的1965年,我进入了麻省理工学院,师从于他。他的基础性工作为我们今天目睹的AI的惊人进步奠定了基础。明斯基教导我,创建问题的自动化解决方案的技术主要有两种:一种是符号主义方法,另一种是联结主义(也称连接主义)方法。
小脑:用模块构建“无意识的能力”
掌握某项体育技能,关键在于通过充分练习将技能内化为肌肉记忆。原先需要有意识思考和保持专注才能完成的动作,渐渐变得自然而顺畅,这实际上就是从大脑运动皮层控制向小脑控制的转变。不管是投掷球、还原魔方还是弹钢琴,所需要的有意识的心智努力越少,你就越有可能表现得更好。你的动作会变得更快、更流畅,可以将注意力用于其他可以提升表现的方面。当音乐家们熟练地演奏乐器,他们可以像我们平时唱“生日快乐”歌那样毫不费力、直觉般地奏出一个给定的音符,但问及如何控制声带发出准确音符时,大多数人无法用语言描述这一过程。这就是心理学家和教练们所说的“无意识能力”,因为我们并不需要有意识地去想它。
然而,小脑的这种能力并不是某种极其复杂的结构的结果。尽管小脑包含了成年人(或其他物种)大脑中的大多数神经元,但基因组中关于其整体设计的信息并不多,它主要由小而简单的模块组成。神经科学家发现,小脑由成千上万个以前馈结构排列的小型处理单元组成。这为我们更好地理解完成小脑功能所需要的神经架构提供了基础,并可能对AI领域的研究提供有用的见解。
小脑的各个模块都有狭窄的功能定义,在你弹钢琴时控制你手部运动的模块与你走路时控制腿部运动的模块并不相同。尽管小脑从古至今都是大脑中不可或缺的组成部分。但随着我们更灵活的新皮质在现代社会中占据主导地位,人类对小脑的依赖越来越小。
在动物王国中,哺乳动物携带了新皮质这一独特优势,而非哺乳动物则没有这一优势。后者的小脑精确记录下了生存所需的关键行为,这类由小脑驱动的动物行为被称作固有行为模式。与通过观察及模仿习得的行为不同,这些行为是一个物种的成员与生俱来的。哺乳动物身上有些相当复杂的行为也是天生的。例如,鹿鼠挖短洞,而海滩鼠会挖带逃生通道的长洞。就算是从未有过挖洞经验的实验室鹿鼠和海滩鼠,一旦把它们放在沙地之上,它们也能挖出各自物种特有的洞穴类型。
在大多数情况下,小脑中负责特定动作的机制会在物种中一直延续下去,直到拥有改进动作的种群通过自然选择胜过它。依靠基因驱动的行为适应环境的速度要远慢于通过学习驱动的行为。学习使得生物可以在其一生中有意识地调整自己的行为,而先天行为的变化仅限于历经多代的渐进性改变。不过,有趣的是,计算机科学家有时采用“进化”方法来反映由基因决定的行为。他们会创建一系列具备随机特征的程序,并测试它们完成特定任务的表现。那些表现良好的可以将它们的特征结合起来,类似动物繁殖时的基因混合。接着,程序中会引入随机的“变异”,以观察哪些可以增强性能。经过多代的迭代优化,这些程序可以用人类程序员可能想象不到的方式解决问题。
然而,自然界中实现这种进化方式需要耗费数百万年的时间。尽管这个过程显得十分缓慢,但我们不妨回想一下,在生物出现之前的进化过程,如生命所需的复杂前体化合物的形成,往往需要数亿年时间。因此,从这个角度看,小脑实际上起到了加速进化的作用。
新皮质:层次分明、可自我调整的灵巧结构
为了取得更快的进展,进化需要设计出一种方法,让大脑在无需等待基因变化重新配置小脑的情况下发展出新的行为。新皮质应运而生,字面意思是“新的皮质”,大约在2亿年前随着哺乳动物的诞生而出现。早期的哺乳动物外形酷似现今的啮齿动物,它们的新皮质如邮票一般大小、薄厚,紧紧包裹着它们那核桃般大小的大脑。但新皮质的组织方式比小脑更加灵活。它不是由一个个控制不同行为的不同模块构成的,而是一个整体协作的网络。因此,它能够产生一种新的思维方式,它可以在几天甚至几小时内创造出全新的行为方式,为学习之路铺平了道路。
在2亿年前,由于环境变化非常缓慢,非哺乳类动物对环境的适应之慢并不是问题。环境的改变往往需要数千年,才会促使小脑发生相应的改变。因此,新皮质似乎是在等待某场大灾变,来获得统治地球的机会。最终,这场灾变——我们现称之为白垩纪大灭绝,发生在6500万年前,也就是新皮质出现1.35亿年后。由于小行星的撞击,可能还有火山爆发,这些事件联手改变了地球的环境,导致约75%的动植物物种,包括恐龙,走向了灭绝的深渊(尽管我们熟知的恐龙消失了,但一些科学家认为,鸟类或许是恐龙的一个幸存的分支)。
新皮质凭借其快速创造解决方案的能力,在此时登上了生物界的舞台。哺乳动物的体型随之增大,它们的大脑发育速度更快,占据了体重更大的比例。新皮质更是迅猛伸展,通过发展出皱褶来大幅扩大其表面积。如果把人类的新皮质展平,其面积和厚度堪比一张餐巾。但由于其复杂精妙的构造,如今新皮质的重量大约占整个人类大脑的80%。
我在2012年出版的《人工智能的未来》中详细介绍了新皮质的运作机制,这里我将简要介绍其核心概念。新皮质由简单的重复结构组成,每个单元包含大约100个神经元。这些功能模块能够学习、识别以及记忆各种模式,并且组织成层级结构,每一层级都能掌握更复杂的概念。这些重复的子结构被称为皮质微柱。
科学家估算,人类大脑内大约拥有210亿到260亿个神经元,其中有90%位于新皮质。以每个皮质微柱约有100个神经元来计算,我们大脑中大约含有2亿个这样的结构单位。与按部就班执行任务的数字计算机不同,最新研究显示,新皮质的各个模块采用了大规模并行的处理方式,也就是说,许多不同的事情可以同时发生。这种机制让大脑成为一个充满活力的系统,也使得对它进行计算建模变得极具挑战性。
神经科学目前虽然还未完全揭开神经系统的所有秘密,但对皮质微柱的构造和连接方式的基础性认识,为我们理解它们的功能提供了线索。大脑中的神经网络与安置在硅硬件中的人工神经网络非常相似,都采用了分层的结构,将输入的原始数据(在人类身上是感官信号)和输出(在人类身上是行为)分开。这种组织方式允许信息处理时进行多层次抽象,从而形成了我们认为属于人类的复杂认知功能。
在与感觉输入直接相连的最底层,某个模块可能会将给定的视觉刺激识别为某种曲线形状。随着信息向上流动,其他层次的模块会对下层模块的输出进行进一步加工,添加更多的上下文信息,进行抽象层面的处理(见图2-2)。这样,距离感官输入更远的高级层次可以识别出曲线形状是一个字母的一部分,进而识别出这个字母所属的单词,并将这个单词与其丰富的语义联系起来。最顶层处理的是更加抽象的概念,例如判断一句话是否富有幽默感或者带有讽刺意味。
深度学习:新皮质魔力的数字化再现
如何才能采用数字化手段复制新皮质的灵活性和高度抽象能力呢?就像本章开头所讨论的,基于规则的符号系统过于僵化,并不能真实地模拟出人类思维的流动性。而联结主义这种方法一度被认为不切实际,因为它对计算能力的要求极高,训练成本高昂。不过,随着计算成本的急剧下降,这一局面发生了变化。是什么力量推动了这种转变?
英特尔的联合创始人戈登·摩尔(Gordon Moore)于1965年提出了著名的以他的名字命名的摩尔定律,这一定律已经成为信息技术领域最显著的发展趋势。摩尔定律指出,随着技术的不断进步,计算机芯片上的晶体管数量大约每两年翻一番。尽管有些人怀疑这样的指数级增长趋势能否持续下去,他们认为,当晶体管密度达到原子尺度的物理极限时,摩尔定律将不可避免地走向终结。但他们忽略了一个更深层次的事实:摩尔定律实际上是“加速回报定律”的更基本力量的一个示例,信息技术创造了创新的反馈循环。在摩尔做出他的伟大发现之前,电机、继电器、真空管和晶体管引领的四种主要技术范式的计算性价比呈指数级提高,而在集成电路达到其极限之后,纳米材料或三维计算技术将占据主导地位。
迈向奇点的关键进展
在游戏界大放异彩的深度学习技术,同样可以用来应对现实世界中的复杂情况。想要实现这一点,我们需要的是一种模拟器,能够真实再现AI所需要掌握的领域,比如充满不确定性的驾驶体验。在开车时,任何事情都可能发生,比如前车突然刹车,或者有车迎面驶来,又或者小孩子追球跑到了马路上。Alphabet旗下的Waymo公司就为其自动驾驶汽车开发了这样的自动驾驶软件,但最初都有一名人类监督员监控所有驾驶过程。驾驶过程中的每个细节都被一一记录了下来,从而建立了一个极为详尽的虚拟驾驶模拟器。到目前为止,公司的真实车辆已经在公路上行驶了超过3000万千米,模拟器里的车辆也在这个接近真实的虚拟环境中完成了数十亿千米的行驶训练。积累了如此丰富的经验,一辆真正的自动驾驶车辆最终将比人类驾驶员表现得更好。同理,正如第6章中进一步描述的那样,AI正在应用全新的模拟技术来更好地预测蛋白质的折叠方式,这是生物学中极具挑战性的问题之一,而解决它有望帮助我们发现突破性的新药。
AI 尚需跨越的三大里程碑
在最近几年的发展中,我们已经大步朝着重建新皮质能力的道路前进。然而,今天的AI还存在一些不足之处,大致可以概括为几类:情境记忆、常识理解和社交互动能力。
……
而实际上,我在2005年的著作《奇点临近》中指出,人脑的处理速度上限为每秒1016次运算。这个数据是考虑到我们大概有1011个神经元,约有103个突触,而每个突触每秒大约能触发100次。但我也指出,这是一个保守估计。真实的情况是,大脑的实际计算量通常远低于此数值。过去20年的一系列研究发现,神经元的实际触发频率比之前预估的200次/秒要慢得多,接近于1次/秒。据“AI Impact项目”基于大脑能量消耗做出的估算,神经元触发频率平均仅为每秒0.29次。这表明,大脑的实际计算能力可能为每秒1013次,这与汉斯·莫拉维克(Hans Moravec)在1988年出版的《心智儿童:机器人和人类智能的未来》(Mind Children:The Future of Robot and Human Intelligence)使用完全不同的方法估算的结果相符。
这些计算方法假设,每个神经元都是人类认知过程所必需的,但事实并非如此,这一点已得到科学界的确认。事实上,大脑工作过程中存在大量的并行机制(我们对此仍知之甚少),单个神经元或者大脑的特定模块在完成的活动可能是重复的,或者说在其他部位也可以重复。大脑受损或中风之后,人们仍有可能完全恢复功能,这正是这种神经系统的并行性和适应性的最好证明。因此,实际上,模拟人类大脑中与认知功能相关的结构,所涉及的计算需求可能远低于之前我们的预估。据此看来,每秒进行1014次运算的设想可能实际上已经相当保守了。如果真的如此,那么在2023年,只需约1000美元的硬件成本,我们就有可能模拟一个大脑的基本工作。[1]即便模拟大脑真的需要每秒1016次运算,到了2032年左右,同样的硬件成本也有望实现这一目标。
我的这些估计是基于一个简单的假设:只需模拟神经元的放电活动就足以让我们构建一个能够“工作”的大脑模型。但这里也存在着一个无法通过科学实验验证的哲学问题,那就是要有主观体验的话,是否需要对大脑进行更细致的模拟。我们可能需要模拟神经元内的单个离子通道,或者需要模拟数千种可能影响特定脑细胞代谢的数千种不同分子。牛津大学人类未来研究所的安德斯·桑德伯格(Anders Sandberg)和尼克·博斯特罗姆估计,这种更高级别的模拟分别需每秒1022或1025次运算。即便是按照最高估计,他们也预测,到2030年,一台10亿美元(以2008年的美元购买力水平计算)的超级计算机将能够实现这一模拟,并且到2034年能模拟每个神经元的所有蛋白质。显然,随着时间的推移,因技术进步带来的性价比的指数级提升,将大幅度降低这些成本。
从这些讨论中可以清楚地看到,即使在大幅改变我们的假设的情况下,也并不会改变预测的基本信息,即在未来20年左右的时间里,计算机将能以我们关心的所有方式来模拟人脑。这个问题并不是我们的曾孙辈一个世纪后才需要面对的。实际上,随着人类的寿命逐渐增长,如果你身体健康,未超过80岁,那么你很可能会在有生之年亲身经历这一时刻。从另一个角度看,在今天出生的孩子们进入小学之前,他们就有可能看到AI通过图灵测试;到了读大学时,他们很可能可以亲眼见证更丰富的大脑模拟。在我撰写本书的2023年,即便是按照悲观的假设,实现全脑模拟的可能性也比1999年时我在《机器之心》中首次提出这些预测时在时间上要近得多。
通过图灵测试的意义
直觉上,这看起来像是一个问题。人们很容易认为,“沃森”应当像人类一样推理。但我的看法是,这是一种迷信。在现实世界中,重要的是一个智能的生物如何行动。如果不同的计算过程导致未来的AI做出开创性的科学发现,或者创作出催人泪下的小说,我们为何要关心它们是如何产生的?如果AI能以雄辩的语言宣告自己有意识,我们又有什么道德依据坚称只有人类的生物学大脑能够孕育出有价值的感知?图灵测试的实证主义将我们的注意力正确地聚焦在了该关注的地方。
然而,尽管图灵测试对于评估AI的研究进展极为有用,我们不该将其视作衡量先进智能的唯一标准。正如PaLM 2和GPT-4展示的那样,机器在一些认知要求较高的任务中能超越人类,而无需在其他领域令人信服地模仿人类。我预测,在2023年至2029年,第一个严格的图灵测试终将被通过,届时计算机将在越来越多的领域展现出超越人类的能力(见图2-4)。实际上,AI很可能在掌握图灵测试中的常识性社交细节之前,就在编程方面超越人类水平。这一问题目前尚无解,但这种可能性表明,对人类智能水平的理解需要包含更为丰富和细腻的层面。图灵测试无疑是其中的关键部分,但我们还需要开发更为复杂的方法来评估人与机器智能在复杂多样的情况下的相似和不同点。
扩展大脑新皮质至云端
到目前为止,科学家们在用放置在颅骨内外的电子设备与大脑进行沟通的研究中还没有取得多少进展。采用非侵入性技术与大脑进行通信时,研究人员必须在空间分辨率和时间分辨率之间做出权衡,即他们想要在空间和时间尺度上以何种精确度测量大脑活动。功能性磁共振成像扫描通过测定大脑的血流量来作为监测神经活动的指标。一旦大脑的某个区域活跃起来,它就会消耗更多的葡萄糖和氧气,从而需要更多的氧合血液供应。这种血流变化可以精确到边长约0.70.8毫米的立方“体素”,足以提供非常有价值的数据。但是,因为大脑活动和血流变化之间存在时间上的滞后,我们通常只能捕捉到几秒之内的大脑活动,而精度很难超过400800毫秒。
与此相反,脑电图能够直接检测大脑的电活动,因此它能够将信号的捕捉时间精确到约1毫秒。但因为这些信号是从颅骨表面探测的,所以很难精确地确定它们来自哪里,导致其空间分辨率仅为68立方厘米,尽管有时可以提升至13立方厘米。
截至2023年,大脑扫描中空间与时间分辨率之间的权衡问题仍是神经科学领域的核心挑战之一。这些局限性是由血液流动与电流的基本物理属性所决定的,因此,虽然AI和传感器技术的进步可能带来小幅改善,但这些改进可能不足以支撑高度复杂的脑机接口。
通过将电极直接植入大脑,我们可以避免上述空间与时间的折中困境,直接记录单个神经元的活动,而且还能刺激它们,实现真正的双向交流。然而,使用当前的技术在颅骨中开孔并放置电极,可能会对神经结构造成损伤。因此,目前这种技术主要应用于辅助那些有听力缺失或身体瘫痪的残障人士,对他们来说,这种做法的好处大于它的风险。比如说,BrainGate系统就可以让患有肌萎缩侧索硬化症或有脊髓损伤的患者单凭意念控制计算机光标或者机械手臂。但是,鉴于这类辅助技术一次只能连接有限数量的神经元,它们并不适合处理复杂的信号,比如语言。
想象一下,如果我们能将脑海中的思绪直接转换成文字,这将会是一次革命性的进步。正是这个激动人心的设想,推动科研人员力图打造一款完善的脑波语言翻译器。2020年,由Facebook赞助的研究团队为参与试验的对象装配了250个电极,并且依靠先进的AI技术将受试者的大脑皮层活动与他们口述的样本句子中的单词相匹配。他们利用一个包含250个单词的样本库,能够预测出受试者正在思考的单词,错误率低至3%。结果令人振奋。尽管如此,Facebook还是于2021年叫停了该项目。目前这项技术能否扩展到更大的词汇库(这也意味着更复杂的信号),还有待观察,因为它要面临空间分辨率与时间分辨率的限制。不过,无论结果如何,要拓展人类的新皮质,我们仍需掌握与大量神经元进行双向通信的方法。
在向更多神经元扩展方面,最雄心勃勃的尝试之一莫过于埃隆·马斯克的Neuralink项目,它同时植入了一大批线状电极。在实验老鼠身上的测试显示,该系统可以读取1500个电极的信号,远超只能读取几百个电极的其他项目。后来,一只被植入该设备的猴子甚至能通过该系统玩《乒乓》游戏。截至目前,Neuralink已获得美国食品和药物管理局的批准,可以开始人体试验。马斯克最近的声明暗示,这些试验将在2023年末启动,就在本书英文版即将出版时,Neuralink在人体中植入了第一个有1024个电极的设备。
同时,美国国防部高级研究计划局正在进行一项名为“神经工程系统设计”的长期项目,其目标是创造一个能够连接100万个神经元进行记录的接口,还可以刺激10万个神经元。他们资助了几项研究计划来达成这一目标,其中布朗大学的团队正在尝试创造可以植入大脑的“神经粒”——这些微小的设备如同沙粒般大小,能够与神经元相互连接,形成一张“皮层内部网”。最终,脑机接口将基本是非侵入式的,这可能涉及通过血液循环将纳米级电极无害地插入大脑。
我们需要记录多少计算量呢?就像之前提到的,模拟人脑大约需要每秒进行1014次运算,或可能更少。值得注意的是,这是基于真实人脑架构的一个模拟,这样的模拟人脑应能通过图灵测试,并且在外部观察者眼中在所有方面与人类大脑无异,但其中并不一定包含大脑内不产生这些可观察行为的其他活动。例如,我们还不确定神经元细胞核内的DNA修复这样的细胞内细节是否与认知活动有关。然而,即使大脑内每秒可以执行1014次的运算,设计脑机接口时也不需要考虑这么高的计算量。因为它们大多数是发生在新皮质顶层以下的初级活动,我们真正需要做的只是与大脑的上层区域建立联系。至于像调节消化这类非认知性的运行过程,我们可以完全不加理会。因此,我认为一个高效的脑机接口可能只需数百万至数千万个并行连接。
迈向奇点的关键进展
为了实现这一规模的连接,我们需要将接口设备不断缩小。我们还将越来越依赖先进的AI来应对随之而来的复杂的工程挑战和神经科学问题。到21世纪30年代,在纳米机器人的帮助下,我们期望能达成这一目标。这些微型电子设备将把大脑新皮质的上层与云端连接起来,实现大脑神经元与云端模拟神经元的直接通信。这个过程不需要任何科幻式的脑部手术,我们可以通过毛细血管无创地将纳米机器人送入脑内。这意味着,未来人类大脑的大小将不再受到出生时头部通过产道的物理限制,而是可以无限扩展。换句话说,增加了第一层虚拟新皮质后,我们可以在其上叠加更多层,这不是一次性的提升,而是可以无止境地提高我们的认知能力。随着21世纪相关技术的发展,计算的性价比呈指数级增长,我们大脑的可用计算能力也将随之飙升。
还记得200万年前发生了什么吗?当时我们的祖先最后一次获得了更多的新皮质,人类由此诞生。现在,我们如果能在云端访问额外的新皮质,那么在认知、抽象能力上的飞跃无疑能够与之相媲美。这种变化将导致我们创造出远比今日所见的艺术和技术更丰富、更深刻的表达手段,远超人类当前的想象。
要设想未来的艺术表达方式是一件颇具挑战性的事情,但我们可以通过类比过去的新皮质革命来展开一番有益的思考。让我们尝试设想一只猴子——一种拥有与人类相似的大脑且智力高超的动物——观赏一部电影时会有怎样的体验。电影的情节对它而言并不是完全无法理解的。举例来说,它能辨认出屏幕上的人类形象和识别出他们在交流。然而,猴子无法理解对话,也辨别不出如“角色身穿铁甲暗示故事发生在中世纪”这样的抽象概念。这正是人类前额叶皮层才能实现的那种“跳跃”。
因此,当我们想象在云端新皮质加持下人类所创作的艺术形式时,并不仅仅涉及更高级的计算机生成图像效果或是刺激味觉、嗅觉的新体验。它意味着大脑本身如何加工我们的经历的全新可能性。比如,演员目前只能通过语言和身体传达角色的想法,但未来的艺术有可能将角色原始的、混乱的、非言语化的思想——以它们无以名状的美丽和复杂性,直接传达到我们的思维中。这正是脑机接口能够带给我们的文化丰富性。
我们将与技术共同创造,让人类的思维进化以获得更深刻的洞察力,并利用这些力量创造出让未来的心智去体验和领悟的超凡理念。最终,我们将借助能够自我改进的AI系统访问并设计自己的“源代码”。由于这项技术使我们得以与目前正在创造的超级智能融合为一体,我们将从本质上重塑自己。一旦摆脱了颅骨的物理界限,以及在比生物组织的计算速度快许多的基质上处理信息,人类的智能将被放飞,实现指数型增长,最终我们的智能将增长数百万倍。这才是我所定义的“奇点”的核心。
第3章 我是谁:成为一个特殊的人意味着什么
一旦将我们的大脑备份到更高级的数字平台上,我们的自我改造能力就将得以完全释放。
我们的意识水平与新石器时代的祖先并无二致
那么,什么是意识呢?人们通常使用“意识”这一术语来描述两种不同但相关的含义。一种是功能性的,即意识到自己周遭的环境,并能够感知到内在思想和一个与之不同的外部世界。根据这一定义,我们可以说处在深度睡眠中的人是没有意识的,醉酒的人是有部分意识的,清醒的人则是意识完全清醒的。除了极少数情况,比如“闭锁综合征”这样的罕见病例外,我们通常能通过观察外表判断一个人的意识水平,甚至某些动物的行为,比如能在镜子中认出自己,也能为我们提供关于意识存在的线索。但当涉及本章讨论的个人同一性问题时,另一种含义显得更为关键:有在头脑内部拥有主观感受的能力,而不仅仅是外在的表现。哲学家将这种体验称为“主观体验”(Qualia)。因此,当我说我们无法直接探测意识时,意思是我们无法从外部探测到一个人的内在体验。
尽管我们无法直接验证意识的存在,但这并不意味着我们可以忽视它。在审视人类道德体系的基础时,我们会发现人们的道德判断往往依赖于他们对意识的评估。我们认为物质对象,无论它们多么复杂、有趣或珍贵,只有在它们影响有意识的生物的意识体验才重要。例如,围绕动物权利的辩论,主要探讨的是我们在多大程度上认为它们具有意识,以及这种意识体验的本质是什么。
对于哲学家而言,意识是一个难题。诸如什么样的生物享有权利之类的伦理问题往往取决于我们对这些实体是否拥有主观体验的直觉。但因为我们无法从外部探测到这些体验,便只能利用功能性意识作为一种替代。这是根据我们自己的体验所做的类比。每个人(我只能假设!)都有内部的主观体验,并且我们知道自己也具备其他人可以观察到的功能性自我意识。因此,我们假设,当其他人表现出功能性意识时,他们也必然拥有内部的主观体验。即便是那些认为主观体验与经验思维无关的科学家,也会假设他们周围的人是有意识的,因为他们注意到了自己的体验。
虽然我们很容易将意识的存在假设扩展到人类同胞身上,但当其他动物的行为与我们的差异越大时,我们对它们是否具有意识的直觉就会越弱。狗和黑猩猩的认知能力虽然没有达到人类的认知水平,但它们复杂和充满情感的行为让大多数人认为,这些行为背后一定有相对应的主观体验。至于老鼠等啮齿动物呢?它们展现出了一些类人行为,比如社交游戏和对危险的恐惧。只有一小部分人认为啮齿动物具有意识,并且他们通常认为它们的主观体验远不如人类深刻。那昆虫呢?果蝇虽然不会背诵莎士比亚的作品,但它们确实能够根据环境做出反应,并且它们的大脑拥有大约25万个神经元,而蟑螂大约有100万个神经元。也就是说,这只是人脑中神经元数量的十万分之一左右,因此在复杂和层次化网络的构建上有很大的局限性。那变形虫呢?这些单细胞生物并未展现出任何类似于人类或高等动物的功能性意识。尽管如此,21世纪的科学家们已经进一步认识到,即便是最原始的生命形式也能展示出基本的智能形式,如记忆。
在某种程度上,意识可以被视为是二元的——一个生物是否有任何的主观体验?但我在这里还想探讨另一个层面的问题,那就是程度。想象一下,如果你正在做一个模糊的梦,或者处于醒着但醉酒或困倦状态,又或者完全清醒,你自己的主观意识水平会有多大的不同。这就是研究人员在评估动物的意识时所关注的连续体问题。而且,专家的观点也在转变,越来越多地支持更多的动物比之前认为的具有更多的意识。2012年,一个由多学科科学家组成的小组在剑桥大学聚集,评估了非人类动物具有意识的证据。这次会议促成了《剑桥意识宣言》(Cambridge Declaration on Consciousness)的签署,该宣言肯定了意识不仅仅是人类特有的现象的可能性。该宣言声明:“缺少新皮质似乎并不妨碍生物体验情感状态。”签署人在“所有哺乳动物和鸟类,以及许多其他生物,包括章鱼”中发现了“产生意识的神经基质”。
科学告诉我们,复杂大脑会催生功能性意识。但究竟是什么使得我们具有主观体验呢?有些人说是因为神明,另一些人则认为意识是纯粹物理过程的产物。然而,不论意识的起源如何,精神与世俗的两极都认为意识在某种程度上是神圣的。人们以及其他一些动物是如何变得有意识的,都只是一个因果关系的论点,无论它是由仁慈的神明还是无目的的自然造成的。但无论如何,最终结果是毋庸置疑的——不承认孩童具有意识和感受痛苦的能力,被认为是极度不道德的。
然而,关于主观体验背后的原因的探讨很快将超越哲学范畴。随着技术赋予我们将意识扩展到生物大脑之外的能力,我们需要确定是什么激发了构成我们核心身份的主观体验,并致力于保护它。由于我们只能通过可观察的行为来推测主观体验,我们的直觉与科学上最合理的解释密切相关,即能支持更复杂行为的大脑也会孕育更丰富的主观体验。如前一章所讨论的,复杂的行为源于大脑信息处理的复杂性,而这又取决于大脑表示信息的灵活性以及大脑网络中的层级深度。
这对人类的未来有着深远的影响,如果你还能再活几十年的话,对你个人来说也是如此。记住:有史以来的智力飞跃都发生在自石器时代以来结构未发生改变的生物大脑中。如今,外部技术让每个人都能够访问人类同胞所做出的大多数发现,但我们的意识水平与新石器时代的祖先相比并没有太大变化。当能在21世纪30年代和40年代扩展新皮质本身时,不仅是我们解决抽象问题的能力会增强,我们的主观体验也将得到深化。
僵尸、主观体验与意识难题
意识有一些根本性的东西是我们无法与他人分享的。当我们将某种波长的光标记为“绿色”或“红色”时,我们实际上无法确定自己所体验的绿色和红色与他人的体验是否一致。可能我对绿色的感受与你对红色的感受是一样的,反之亦然。但遗憾的是,我们没有办法用语言或其他任何形式的交流直接比较彼此心中的这种感受。实际上,即便将来能够直接连接两个大脑,也无法证明相同的神经信号是否会在这两个大脑中触发相同的感受。因此,如果我们对红绿色的感受真的是相反的,那我们也将永远意识不到这一点。
正如我在《人工智能的未来》中所述,这种认识引出了一个更加令人不安的思想实验:如果有人根本就没有所谓的主观体验呢?哲学家戴维·查默斯(David Chalmers)将这样的假想生物称为“僵尸”——他们在神经学和行为学上表现出了可监测到的与意识相关的神经和行为,但实际上没有任何主观体验。科学无法区分这样的“僵尸”和正常人。
有一种方法可以帮助探讨功能性意识与主观体验之间的差异,我们可以比较狗和假设的、没有主观体验的人造人(即“僵尸”)。虽然所谓的“僵尸”可能表现出比狗更复杂的认知功能,但大部分人可能认为,伤害具有主观体验的狗比伤害那些可能表现出痛苦反应但实际上感受不到痛苦的“僵尸”更加不道德。问题在于,现实生活中,我们甚至在原则上都无法科学地判定另一个存在是否具有主观体验。
如果理论上存在这样的“僵尸”,那么就意味着主观体验与物理系统(如大脑或计算机)之间并没有必然的因果关系,这些物理系统负责处理信息,表面上看起来就像具有意识。某些宗教观点认为,灵魂是与身体明显分离的超自然实体,这种推测已经超出了科学的探索范围。但如果作为认知基础的物理系统也必然产生意识——制造“僵尸”是不可能的,科学同样没有连贯的方法来证明这一点。主观体验与我们能观测到的物理定律有着本质的区别,这并不意味着,它并不遵循依据这些定律处理信息的特定模式,根本不会产生有意识的经验。查默斯称这为“意识的难题”。他所谓的“简单问题”,比如我们在不清醒时大脑中在发生什么,尽管是科学中最难解的问题之一,但至少它们是可以用科学方法研究的。
面对意识这一难题,查默斯提出了一种他称之为“泛原心论”(Panprotopsychism)的哲学概念。泛原心论认为,意识类似于宇宙中的一种基本力量,无法简单地视其为他物理力量影响的结果。可以想象存在一种拥有潜在意识的普遍场域。我对这一观点的解释,是大脑中处理信息的复杂性唤起了我们所熟知的主观体验。因此,无论大脑是由碳还是硅构成的,能让它表现出意识迹象的复杂性,同样也赋予了它主观的内在生命。
虽然我们无法通过科学方法证实这一理论,但强有力的道德要求促使我们必须假定它为真。换言之,如果你虐待的某个实体可能具有意识,最安全的道德选择是默认它是有意识的,而不是冒险折磨一个有知觉的生命。也就是说,我们应当表现得好像僵尸是不可能存在的。
从泛原心论的角度看,图灵测试不仅可以确认机器是否拥有与人类相当的能力,还能为验证主观体验提供有力的证据,由此为机器确立道德权利。有意识的AI将带来深刻的法律变革,但我怀疑在第一批达到图灵标准的AI问世之时,我们的体系能否快速适应、将它们的权利纳入法律。因此在最初的时候,制定可以限制滥用的道德框架的任务将落在开发者的肩上。
除了基于伦理方面的理由让我们假设明显具有意识迹象的生物有意识之外,还有充分的理论基础让我们相信,泛原心论或许是对意识进行解释的准确因果理论。它在二元论和唯物主义之间达成了一种折中,这两者长期以来一直是两大思想流派。二元论认为,意识起源于某种与日常所见的无生命物质截然不同的“物质”,很多二元论者认为这是灵魂。但从科学的视角来看,这一观点存在问题:即便假设存在一种超自然的灵魂,我们也无法提出一个有希望的理论来解释它如何影响我们能观察到的世界中的物质(如大脑中的神经元)。与之对立的唯物主义观点认为,意识完全源自大脑中物理物质的特定组织形式。尽管这一观点能够完美解释意识如何运行的功能性方面(即用一种类似于计算机科学解释AI的方式来解释人类智能),但它无法对意识那些科学无法触及的主观维度给出任何解释。泛原心论在这两种相反的观点之间找到了一个有益的平衡。
决定论、涌现与自由意志的困境
与意识紧密相关的一个概念是我们对自由意志的感知。询问街头的普通人对“自由意志”如何理解,他们的回答可能包括个人必须能够自主控制自己的行为。我们的政治和司法体系建立在每个人都拥有自由意志这一原则的基础之上。
然而,当哲学家寻求一个更精确的定义时,他们几乎无法达成一致。不少哲学家相信,自由意志的存在意味着未来不能被预先确定。毕竟,如果未来发生的事情已经确定,那么我们的意志怎么可能是有意义的自由呢?但如果自由意志仅意味着我们的行为可以在量子层面被归结为完全随机的过程,这似乎并不符合我们对真正自由意志的认识。如英国哲学家西蒙·布莱克本(Simon Blackburn)所述:“随机性与必然性同样无情地排除了自由意志的存在。”因此,一个有意义的自由意志的概念应该是决定论和非决定论思想的综合,既非完全可预测也非完全随机。
物理学家兼计算机科学家斯蒂芬·沃尔弗拉姆(Stephen Wolfram)的研究为这一困境提供了洞见。长期以来,他的研究一直影响着我对物理与计算交叉领域的思考。在2002年出版的《一种新的科学》(A New Kind of Science)一书中,沃尔弗拉姆探讨了同时具有决定性和非决定性特征的现象——细胞自动机。
细胞自动机是一种由细胞构成的简易模型,这些细胞根据许多可能的规则集之一变换状态(如黑/白、生/死)。这些规则决定了每个细胞根据周围细胞的状态如何变化。这个过程通过一系列离散的步骤展开,能够产生极其复杂的行为。其中一个著名例子是康威的“生命游戏”,它以二维网格表示。业余爱好者和数学家发现了许多根据生命游戏规则而形成可预测的演化模式的有趣图案,甚至可以利用生命游戏来构建一个功能齐全的计算机,或模拟软件运行并展示其自身的另一个版本!
……
单个单元格的统计抽样可能会让它们的状态看起来像是随机的,但我们明白,每个单元格的状态都是由前一步骤以确定的方式变换产生的,最终形成的宏观图像展现了规律性和不规律性行为的混合。这展示了一种被称为“涌现”的特性。从本质上来说,涌现是由非常简单的事物共同产生的更复杂的事物。自然界中的分形结构,如树枝的分叉、斑马和老虎的条纹、软体动物的壳,以及生物学中许多其他特征,都是第四类规则的体现。我们所处的这个世界深受这种细胞自动机模式影响——极其简单的算法产生了介于秩序与混乱之间的高度复杂的行为。
可能正是这样的复杂性催生了意识与自由意志。不管你认为决定自由意志的基本程序要归功于神,还是归于泛原心论或其他什么原因,你都不仅仅是程序本身。
然而,这些规则产生意识和许多其他自然现象并非偶然。沃尔弗拉姆提出了一个强有力的案例,即物理定律本身源自某些与细胞自动机相关的计算规则。2020年,他启动了名为“沃尔弗拉姆物理项目”(Wolfram Physics Project)的宏伟计划,以期通过一个类似于细胞自动机,但更广义的模型来解释全部的物理现象。
这种方法允许在经典决定论和量子不确定性之间达成某种妥协。尽管可以使用算法技巧来近似预测宏观世界的某些方面,例如预测一颗卫星从现在开始在100万个轨道上运行的位置,但在最基本的尺度上,这样的近似并不适用。如果现实在最深层次是基于第四类规则产生的,我们就可以用确定性的术语解释在量子尺度出现的看似随机的现象,但并不存在能够预测未来某个时间点整个宇宙的确切状态的总结算法。这依然是推测性的,因为我们还不知道这整套规则的具体内容。也许将来的“万物理论”会将这一切统一成一个连贯的解释,但目前我们还没有达到那个阶段。
鉴于有效预测是不可能的,我们只能求助于模拟,但宇宙不可能容纳一个足够大的计算机来模拟自己。换言之,如果不让现实真正向前发展,就没有办法展现现实。
本章的后续部分将探讨未来将意识从生物大脑转移到非生物计算机的可能性。这里需要明确一点:虽然我们最终也许可以数字化地模拟大脑的运作,但这与决定论意义上的预先对大脑进行计算是不同的。因为无论是生物的还是非生物的大脑都不是一个封闭系统。大脑从外部世界接收信息,然后通过极其复杂的网络对其进行处理。实际上,科学家最近发现,大脑中的网络竟然具有多达11个维度!这样的复杂性很可能涉及规则110类型的现象,如果不按顺序模拟每一步,就没有办法在计算上提前预知结果。由于大脑是开放系统,无法将未知的未来输入逐步模拟中,因此,复制大脑的功能并不意味着能预测其未来状态。这或许是宇宙存在的一个合理解释。
换个角度看,如果宇宙规则是基于细胞自动机之类的原理,它们只能通过逐步展开——现实中实际发生的情况来表达。相反,如果宇宙的运行有确定的规则,但没有细胞自动机,或仅基于随机性,那么现实就不一定需要我们实际观察到的逐步展开。此外,如果意识只能从有序与混沌的第四类规则的复杂性中涌现,这就可以被视为我们存在的哲学论证:没有这样的规则,我们就不会在这里思考这个问题。
这开启了“相容论”(Compatibilism)的大门,即一个决定论主宰的世界也可以是一个有自由意志的世界。即使我们的决定由现实的基础法则所决定,我们仍然可以做出自由的决定,即不由其他事物,如其他人引起。在一个决定论主宰的世界里,理论上我们可以在时间上向前或向后看,因为任何事情在两个方向上都是确定的。但在规则110下,我们能够完美预见未来的唯一方法是通过所有实际展开的步骤。因此,从泛原心论的视角看,我们大脑中涌现的过程并没有控制我们,它们构成了我们。我们源自更深层的力量,但我们的选择无法预测——只要产生人类意识的过程能通过人类在世界中的行动表达,我们就拥有自由意志。
当一个人存在多个大脑时
这些以及其他涉及大脑两个半球的实验表明,一个正常人实际上可能拥有两个可以独立做出决策的大脑单元,不过这两个半脑都属于同一个意识体。每个半脑都会认为是自己做出了决策,而且由于两个半脑紧密地结合在一起,所以它们拥有的感觉是一样的。
实际上,如果不局限于大脑的两个半球,我们会发现人体内还有许多能够做出决定的结构,这些结构也许都拥有上文提到的自由意志。例如,负责决策的新皮质包含许多小的功能模块。因此,当我们考虑一个决策时,不同的选项可能由不同的模块提出,每个模块都试图形成自己的观点。我的导师马文·明斯基很有先见之明,他认为大脑并不是一个统一的决策器,而是一个复杂的神经网络,在我们考虑一个决定时,大脑各个部分可能会偏好不同的选项。
明斯基将我们的大脑比作一个“心智社会”(Society of Mind,这也是他的第二本书的书名),其中包含许多反映各种不同观点的简单过程。它们中的每一个都是自由选择吗?我们又该如何确定呢?近几十年来,虽然有更多的实验支持这一观点,但对神经过程如何转化为我们有意识地感知到的决策,我们的了解仍然十分有限。
“ 2 号你”是你吗
忒修斯之船”思想实验在应用于船只或其他无生命体时颇具趣味性,且关联的风险不高。随着时间的推移,船只的“身份”问题最终不过是人类认知惯例的问题。但是,当所讨论的对象是人类时,这一问题就具有极高的风险。对大多数人而言,站在身边之人究竟是真正所爱之人,还是只是一具正在进行令人信服的表演的查默斯式僵尸,这一点非常重要。
让我们通过主观体验的“难题”来思考这些问题。在制造副本“2号你”的情形中,我们无法判定“2号你”的主观自我是否与原来的你有某种关联。你最初的主观体验是否会以某种方式同时包含你的两个副本,即使它们的信息模式会随着体验的不同而逐步分离?或者,“2号你”会在这方面保持独立性吗?这些都是科学无法解答的难题。
然而,在我们逐步把你大脑中的信息迁移到非生物介质上的情况下,我们有更充分的理由认为,你的主观体验将被保留下来。实际上,正如之前提到的,我们已经在治疗某些大脑疾病时以非常初级的形式做到了这一点,新的神经假体比它所替代的部分能力更强。因此,它与被替代的部分并不完全一样。虽然早期的植入设备,比如人工耳蜗,能够刺激大脑活动,但它们并不能取代任何核心的大脑结构。但自21世纪初以来,科学家一直在开发大脑假体,以帮助大脑结构受损或有功能障碍的患者。例如,现在的假体设备能够部分替代有记忆问题的患者大脑海马的功能。截至2023年,这些技术仍处于起步阶段,但在这10年(指2020—2029年)中,我们将看到它们变得更加高级,且价格更为低廉,从而服务于更广泛的患者群体。然而,在今天的技术下,毫无疑问,人的核心身份被保留了下来,没有人认为这些患者变成了所谓的查默斯式僵尸。
我们所知道的神经科学知识表明,在逐步替换的过程中,你甚至不会察觉那些微小的改变,大脑的适应性令人惊叹。你的混合大脑会保留定义你身份的所有信息模式。因此,我们没有理由认为你的主观体验会遭到破坏,你当然还是你——没有其他人能够被称为你。然而,在这个假设过程的终点,最终的你和第一个实验中的“2号你”在本质上是相同的,而我们之前认定“2号你”并不是你。这一矛盾如何解释呢?区别在于连续性——数字大脑从未与生物大脑分离,它们从未作为独立实体存在过。
这就引出了第三种情况,它实际上并不只是一个假设。我们的细胞每天都在经历非常快速的更新。虽然神经元本身一般会持续存在,但大约有一半的线粒体会在一个月内更新;神经微管几天就会更新一次;突触中负责提供能量的蛋白质每2~5天就会重新合成;突触中的N-甲基-D-天冬氨酸受体更新周期为数小时;而树突内的肌动蛋白丝只能维持大约40秒就会断裂重组。所以,我们的大脑在几个月的时间里几乎就会全部更新一遍,这意味着与不久之前的你相比,你在生物学上已经是一个全新的“2号你”了。重要的是,你的身份的完整性是由信息和功能决定的,而不是任何特定的结构或材料。
多年来,我经常凝望我家附近美丽的查尔斯河。当我今天看着这条河时,我依然认为它和一天前或10年前我在《人工智能的未来》一书中提到它时是一样的,虽然每隔几毫秒,流经河流某个地点的水分子就已经完全不同了。但水分子的运动模式是一致的,决定了河流的流向。心智也是如此。当我们将非生物系统接入自己的身体和大脑时,其中信息模式的连续性会让我们依旧有着今天的感觉——尽管我们的感受可能会更加敏锐或者认知会更聪明。
当然,同样的技术可以让我们把所有技能、个性以及记忆转移到数字媒体上,也使我们能够制作这些信息的多份副本。
在数字世界里,我们拥有了一个生物世界所不具备的超能力——随心所欲地复制自我。把我们的思维文件备份到远程存储系统中,能有效防止因意外或疾病导致的大脑受损。这种做法虽然不能算作真正的“永生”,正如上传到云端的Excel表格并非意味着不会消失一般,数据中心依旧可能因为受灾被摧毁。但它确实能够保护我们免受意外伤害,这些意外往往无情地夺走了许多人的生命和身份。我对泛原心论的理解是,我们的主观体验或许以某种方式包含了这些定义信息的所有副本。
这一点引出了另一个引人深思的可能性。如果我们创造出另一个“2号你”,让它自由地选择一条与“你”不同的路,其信息模式身份将会发生分化。但由于这是一个逐渐发生的连续过程,你的主观体验可能同时覆盖这两种体验。我推测,依据泛原心论,我们的主观体验与信息身份联系在一起,因此会以某种方式涵盖所有曾与我们自身相同的信息副本。
但在这种情境下,“2号你”可能会坚定地声称它拥有与“你”不同的主观体验,因为控制沟通的物理决策结构是分开的,而我们无法客观地验证这一点的真实性。我们的法律和伦理体系可能必须把这两种存在视为各自独立的实体。
生命本身就是难以置信的奇迹
最常见的对这种精细微调的解释是,在这样一个宇宙中生存的概率非常低,可以用观察者选择偏差来解释。也就是说,我们之所以能够考虑这个问题,是因为我们生活在一个经过精细调整的宇宙中——如果不是这样,我们就不会意识到,也不能思考这个现象。这就是所谓的“人择原理”。一些科学家认为,这样的解释是充分的。但如果我们认为现实是独立于作为观察者的我们而存在的,这个解释就无法让人完全接受。宇宙学家马丁·里斯提出了一个我们可能仍然会问的、令人信服的问题。如里斯所言:“假设你站在行刑队面前,结果他们全都开枪了却没有击中你。你可能会想:‘如果他们全都没有失手,我现在就无法在此考虑这个问题了。’但这仍然是一个出乎意料的事情,不是那么容易就能解释的。我觉得这里面确实有些需要去探究的东西。”
来生:制造出令人信服的仿生人
保存我们珍贵的身份的第一步,便是保存那些定义我们是谁的至关重要的想法。我们通过线上行为积累了丰富的数据记录,这记录了我们的思考方式和情感体验。在21世纪的第二个10年,记录、储存和管理这些数据的技术进步迅速。到21世纪20年代末,我们将把这些数据转变为高度逼真的数码仿真实体,这些仿真实体将再现具有特定个性的人类形象。截至2023年,AI在模仿人类行为方面的能力也将快速提升。深度学习技术,比如Transformer和生成式对抗网络(GANs)已经带来了巨大的进步。正如上一章所描述的,Transformer能够从一个人所写的文本中学习,并学会真实地模仿这个人的交流风格。而GAN需要两个相互竞争的神经网络:其中一个试图生成一个目标分类的样例,比如真实的女性面孔图像;另一个则尝试辨别这个图像和其他真实女性面孔图像的区别。第一个会因为成功骗过而得分(可以把它想象成神经网络被编程要争取最高分),第二个会因为做出准确判断而得分。这个过程可以在无人监督的情况下重复多次,两个神经网络的熟练程度都将逐渐提高。
通过整合这些技术,AI已经能够模拟一个特定的人的写作风格、复制他们的声音,甚至将他们的面孔逼真地嵌入视频中。如上一章提到的,谷歌的实验性Duplex技术采用的AI可以在无脚本的电话交谈中做出令人信服的反应,它在2018年的首次测试中非常成功,以至于接电话的人都不知道自己正在与计算机对话。“深度伪造”(Deepfake)视频可用于制作有害的政治宣传作品,或展现假设中的电影场景,比如想象不同的演员出演那些代表性的角色会是什么样子。例如,YouTube上的“Ctrl Shift Face”频道发布了一个热门视频,展示了如果由阿诺德·施瓦辛格(Arnold Schwarzenegger)、威廉·达福(Willem Dafoe)或莱昂纳多·迪卡普里奥(Leonardo DiCaprio)来扮演《老无所依》(No Country for Old Men)中哈维尔·巴登(Javier Bardem)饰演的角色会是怎样。这些技术仍在起步阶段。不仅每种独立的能力(如写作、语音、面孔识别、对话等)会在未来几年内大幅提升,它们的结合也会创造出超越各部分总和的更为逼真的效果。
迈向奇点的关键进展
我们可以创建被称为“复制人”(借用《银翼杀手》中的术语)的AI化身,它将拥有逝者的外貌、行为、记忆和技能,在我所称的“来生”(After Life)中继续存在。
“来生”技术将经历多个阶段。在我写这篇文章的时候,最原始的这种模拟已经存在大约7年了。2016年,美国科技媒体网站The Verge上发表了一篇关于一个名为尤金妮娅·凯伊达(Eugenia Keyda)的年轻女子的精彩报道,她运用AI和保存的短信让她已逝的挚友罗曼·马祖连科(Roman Mazurenko)“复活”。随着现在每个人产生的数据量持续增长,更加忠实地复刻特定的人的形象成为可能。
到21世纪20年代末,先进的AI将能够创建非常逼真的复制人,所用的信息提取自成千上万的照片、数百小时的视频、数百万字的文字聊天记录、详细描述个人兴趣和习惯的数据、对朋友和家人的采访资料等。由于文化、伦理或个人原因,人们对此会有不同的看法,但对于那些渴望它的人来说,这项技术是可行的。
这一代的“来生”化身(After Life avatars)将非常逼真,但对很多人来说,它们会落入所谓的“恐怖谷”(Uncanny Valley)。这意味着它们的行为虽与原来的人极为相似,也存在微妙的差异,让他们的亲人感到不安。在这个阶段,这些复制人并不是“2号你”。它们只能重新创造出已经存在于人脑中的信息的功能,而非其具体形态。因此,泛原心论认为,复制人不会使某人的主观体验“恢复”。尽管如此,许多人仍认为这些化身是极具价值的工具,可以继续重要工作、分享宝贵记忆或帮助家人疗愈。
复制人的身体将主要存在于VR和AR中,但到21世纪30年代末期,利用纳米技术也可以在真实世界中做出真实的身体(也就是说,制造出令人信服的仿生人)。截至2023年,这方面的研究进展还处在早期阶段,但已经有一些重要的研究正在进行中,这些研究将为未来10年的重大突破打下基础。提到仿生人的功能时,相关技术进展面临着我朋友汉斯·莫拉维克(Hans Moravec)几十年前提出的挑战,现今被称为莫拉维克悖论。简而言之,人类觉得难以执行的智力任务,比如对大数开平方和记忆大量信息,对于计算机而言相对来说比较容易。而相反,对人类而言毫无压力的心智任务,比如识别一张脸或在行走时保持平衡,对于AI来说却困难得多。这可能是因为心智任务是在几千万到几亿年的进化过程中发展起来的,并在人类大脑的基础上运行,而负责“高等”认知的新皮质,即我们意识的中心,直到几十万年前才进化到现代的形态。
然而,过去几年间AI的能力呈指数级增长,它在克服莫拉维克的悖论上取得了显著进展。2000年,本田的ASIMO人形机器人稳稳地走过平坦的表面而没有跌倒,这让专家们惊叹不已。到了2020年,波士顿动力公司的Atlas机器人能够轻松地在障碍赛道中跑跳翻滚,其敏捷性胜过大多数人类。汉森机器人公司的Sophia和Little Sophia以及工程艺术公司的Ameca这样的社交机器人,能够通过它们宛如人类的面孔表达情感。虽然它们的能力在媒体的标题中有时会被过分夸大,但不管怎样,它们确实展现了技术前进的轨迹。
随着技术的飞速发展,不管是复制人还是我们这些仍然活着的人,都将能够选择不同的身体和体型。最终,复制人甚至有可能被安置进通过本体的DNA培育并通过赛博技术增强的生物体体内,前提是能找到这些DNA。随着纳米技术使得分子尺度的工程设计成为可能,我们将创建出远比生物学上的身体更为先进的人造身体。届时,这些被复活的人可能会跨越让人不安的恐怖谷,至少对许多与他们接触的人而言会是这样。
然而,这样的复制人将会引发社会上一系列深刻的哲学讨论。你对这些问题的回答可能会受你个人对于灵魂、意识和身份等概念的形而上学的观点的影响。如果通过这项技术复活的人在与你交谈时给你一种失去已久的亲人的感觉,这样就足够了吗?相比之下,通过AI和数据挖掘创建的复制人与用从某人的大脑中完全上传的思维创建的“2号你”,这两者之间有什么不同呢?正如尤金妮娅·凯伊达和罗曼·马祖连科的故事所展示的那样,即便是前一种复制人也能成为慰藉和治愈的源泉。尽管如此,我们还是很难确定每个人在首次经历这些情况时的感受如何。随着这项技术越来越普及,整个社会也会逐步适应。我们可能会制定法律来规定谁能够创建死者的复制人以及如何使用它们。有些人可能会选择禁止利用AI复制自己,而另一些人则会留下具体的遗愿指示,甚至在生前就参与到创建自己的复制人的过程中。
复制人的引入无疑会引发许多具有挑战性的社会和法律问题:
- 复制人是否应被视为拥有包括投票权和签约权在内的完整人权和公民权利的人?
- 他们是否要为被复制人之前签订的合同或犯下的罪行负责?
- 他们能否接替被复制人的工作或将被复制人的社会贡献归功于自己?
- 如果你的亡夫或亡妻以复制人的形式“重生”,你还需重新与之结婚吗?
- 复制人会不会受到排斥或遭遇歧视?
- 在哪些情况下应该限制或禁止创造复制人?
复制人将迫使普通人认真探讨本章提到的关于意识和身份的哲学难题,这些问题在之前大多是理论上的。可能在比《人工智能的未来》出版到你阅读这段文字更短的时间之内,就会有图灵级别的AI被编程用以“复活”去世的人类。它们将具备与自然人类相似的复杂认知能力,并深信自己就是那个人。但它们真的等同于被复制人吗?有谁能否定他们的自我认同呢?
21世纪40年代初,纳米机器人将能够进入活人大脑,并复制构成个人记忆和性格的所有数据,形成“2号你”。这样的实体能够通过针对个人的图灵测试——能够让熟悉这个人的人相信它就是那个人。从所有可检测的证据来看,复制人会同被复制人一样真实。如果你认为身份的本质在于信息、记忆与性格,那么复制人就是那个人。你可以和复制人开始或继续一段关系,甚至包括身体关系。尽管可能存在细微差别,但这和生活中千变万化的生物体又有何不同?我们也在不断变化,有时是渐进的,有时是突然的,比如因战争、创伤、地位或是关系导致的变化。
查默斯式的意识理解让我们有充分的理由相信,这种水平的技术也许会让我们的主体意识在死后继续存在。不过,这一点无法用科学方法证实或反驳,我们只能依据自己的哲学或精神价值观来决定是否使用这项技术。当我们开始直接将活体大脑的内容复制到非生物介质上时,我们不再只是模拟复制人,而是实际上实现了意识的上载,也就是所谓的全脑仿真(Whole-Brain Emulation,简称WBE)。
在非生物介质上模拟大脑在计算层面上可能意味着截然不同的含义。在2008年,约翰·菲亚拉(John Fiala)、安德斯·桑德伯格和尼克·博斯特罗姆确定了11种可能的大脑模拟水平。为简化起见,大脑模拟大致可以分为五类,从最抽象到最详尽排序分别是:功能性、连接组学、细胞级、生物分子级和量子级。
功能性仿真指的是可以像生物思维一样运作,但实际上不需要复制特定人脑的具体计算结构。这种仿真在计算处理上最为简单,但其对原大脑的模拟也最为粗略。连接组学仿真会再现神经元间的层次连接和逻辑关系,但不需要模拟每一个细胞。细胞级仿真会模拟大脑中每个神经元的关键信息,但不涉及细胞内的物理力量细节。生物分子级仿真是指模拟每个细胞内蛋白质以及微小动力之间的相互作用。而量子级仿真则可以捕获分子间及其内部的亚原子效应。量子级仿真是理论上最全面的方案,但它需要的计算能力无疑非常惊人,可能要到下个世纪才能实现。
在未来20年,一个重要的研究方向将是确定需要达到的大脑仿真精度。许多人认为需要达到量子级别的仿真,因为他们相信主观体验可能与尚未揭示的量子效应有关。然而,正如我在本章及《人工智能的未来》中所论述的,我认为达到这种仿真水平并非必需。如果泛原心论等理论成立,主观体验很可能源于大脑对信息的复杂组织方式,因此我们不需要担心数字仿真遗漏了生物原型中的某些蛋白质分子。就像不管你的JPEG文件保存在软盘、CD-ROM,还是USB闪存盘上一样,只要信息的1和0序列相同,它们的显示和功能都会是一致的。实际上,如果你用铅笔和纸记录下这些数字,然后将这一大堆纸张邮寄给朋友,朋友再将这些数字手动输入另一台计算机中,图像依然能完好无损地复现。
因此,我们的目标是探索如何使计算机与大脑有效交互,并解码大脑表征信息的方式。想要深入了解关于思维上传、大脑仿真的计算维度,甚至是关于人类可能如何利用巨大能量进行计算的所谓Matrioshka大脑的提议技术,可以参考本书注释,那里提供了或浅显或深奥的各种资源。
这些挑战虽然艰巨,但21世纪30年代的超人类AI工具将帮助我们实现今日看来难以触及的目标。
与书对话,极佳的创意激发工具 与AI父亲的对话
在谷歌,我们可以将“与书对话”标准的超过10万本书的数据库替换成任意定制的书籍和文档。所以在2019年,我收集了我父亲弗雷德里克·库兹韦尔(Fredric Kurzweil)所写的一切——从他写给我母亲的情书、讲课笔记,到他正在编写的关于音乐的书以及个人的思考。我的女儿艾米利用了和“与书对话”相同的底层技术,用他的作品作为素材,向它提出了一些问题。通过下面这个简短的对话可以看出,这个AI副本能够就我的问题提供连贯且出人意料的答案——答得非常自然,如果我告诉你这是和我当时还在世的父亲的对话,你可能察觉不出任何异常之处。对于我以及那些认识他的人而言,这些话语带有额外的熟悉感,因为这正是弗雷德里克·库兹韦尔思考和交流的风格。
我同样计划打造一个属于我的AI副本。它将能访问我数千页的通信记录,以及我所有公开发表的作品和无数小时的视频资料。这样丰富的多媒体资料将使我的副本比我父亲的副本更深刻、更忠实地展现我的个性。将来的AI副本还将能够访问有关人类生活的各种各样的元数据,实现更高的保真度。
下面是它对我们提出的问题的一些回答。这是让我父亲“复活”的第一步。
Q:你最爱音乐的哪一点?
一段音乐之所以如此生动,是因为它能根据自身的要求调整总体规划,令其焕发生机。音乐艺术走过了漫长的道路,但始终与人的情感保持着紧密联系。
Q:你最喜欢哪位作曲家,为什么?
勃拉姆斯,他的作品创作灵感源自贝多芬。
Q:摇滚乐的精髓是什么?
旋律与节奏构成了音乐的主要支柱。音乐的基础原则或结构法则在于重复与对比,在统一性与多样性之间取得平衡。
Q:你是如何开始指挥工作的?
20多年来,我指挥过多种类型的管弦乐队——专业的、业余的、学院的、大学的、社区的,还有歌剧团。我指挥过大型交响乐队、室内乐团和青年乐团。我还在诸多高等学府里任教。
Q:你希望别人怎样记住你?
虽然赞扬自己总感觉有些难为情,但我想说,处理人际关系的能力一直是我最骄傲的强项,因为我明白,在艺术能力之外,亲和力同样重要。
Q:你有什么遗憾吗?
我感觉自己似乎命中注定要把时间花在无休止的课程和无趣的工作中,以便能够挤出一点点时间来做真正有价值的事情。我应该受到责备,因为我的希望和善意蒙蔽了实际判断。现在,我肩负着新的责任,还要努力维持我的乐团,很难维持收支平衡。
Q:是什么造就了一个人?
个人的本质体现在各个部分与整体之间的关系。
Q:你有什么兴趣爱好?
我期待桃子和葡萄丰收。我热爱园艺,那让我感到放松。但我也同意你说的,园艺确实很费时,那是一种永无止境的劳作。
Q:你会为什么东西焦虑吗?
有时感到我似乎置身于噩梦之中。
Q:你怎么看待现代科技?
在历史上我们能看到,那些创新者总是饱受同时代人的非议。技术的进步,如自动化等,使个体显得渺小不堪。过去的理想和价值观被这个机器时代摧毁了。
Q:你能给我讲一个关于车祸的故事吗?
我在莫比尔指挥歌剧时,我妻子遭遇了一场严重的车祸。她被一辆出租车撞倒,被一辆卡车压住,身体多处骨折,伤势严重,在医院接受牵引治疗两个多月,现在她还打着厚重的石膏,只能无助地仰面躺着。在今后的很长一段时间里,她不得不以这样的状态生活。
Q:生命的意义是什么?
爱。
“雷 · 库兹韦尔”能成为的人
在讨论身份的问题时,我们不得不考虑意识、自由意志以及决定论这些深刻的问题。根据这些观点,我可以说,雷·库兹韦尔既是多种令人难以置信的精确先决条件的产物,同时也是我个人选择的结果。作为可以自我调整的思维模式,“我”的形成受到了我一生中关于如何选择交友、阅读什么书以及去往何方的决策的影响。
然而,虽然我对自己是谁负有一定责任,但我的自我实现仍然受到许多不在我控制范围内的因素的限制。我的生物大脑是针对远古时代的生活环境进化而来的,这使得我会不自觉地形成一些我并不愿意养成的习惯。它无法以足够快的速度学习或者记忆,让我无法掌握所有我渴望了解的知识。我无法对其重新编程,让我从恐惧、创伤和疑虑中解脱出来,这些都在阻碍我实现我想要实现的目标。我的大脑待在一个逐渐衰老的身体里——尽管我在努力延缓这一过程,它的生物学程序注定会破坏雷·库兹韦尔所谓的信息模式。
奇点的美好愿景在于让我们摆脱这些局限。几千年来,人类逐步拥有了更多控制自身命运的能力。医学让我们有能力克服伤痛与残障。化妆品使我们能够根据个人品位塑造自己的外表。许多人通过合法或非法药物来调整心理失衡或体验其他的意识状态。更广泛的信息获取使我们得以滋养头脑,通过养成某些思维模式重塑我们的大脑。艺术和文学激励我们对那些自己从未见过的人产生同理心,帮助我们在道德上提升自我。现代移动应用程序可以帮助我们建立规律和健康的生活方式。想象一下,当可以直接对大脑进行编程时,我们将能够在何种程度上塑造自我。
因此,与超智能AI的融合将是一个非常有价值的成就,但它仅是实现更崇高目标的一种手段。一旦将人类大脑备份到更高级的数字基底上,我们的自我改造能力就将得以完全释放。我们的行为将能与我们的价值观保持一致,生物学上的缺陷也无法再摧残和缩短我们的生命。最终,我们将可以真正为自己的身份负责。
第二部分 生活、工作与寿命, 人类迎来繁荣增长的三大未来路线图
第4章 生活正在指数级变得更好
为什么公众共识恰恰相反
我在本章中将特别强调这些进步的指数性质,以及加速回报定律如何成为我们所看到的许多个别趋势背后的根本驱动力。这将导致在不久的将来,人类生活的大多数方面都会得到显著改善,而不仅仅局限于数字领域。
在我们详细探讨具体示例之前,最重要的是对这一动态有清晰的概念层次的理解。我的观点有时被误读为“技术变革本身就是指数型的,加速回报定律适用于所有形式的创新”,但其实不是的。加速回报定律实际上描述的是这样一种现象:某些类型的技术创造了加速创新的反馈循环。广义上讲,这些技术使我们能够更好地掌握信息:收集、存储、操纵和传输信息,从而使创新本身变得更加容易。印刷机使书籍变得足够便宜,下一代发明家才得以接受更好的教育。现代计算机帮助芯片设计师创造了下一代更快的CPU。更便宜的宽带使应用互联网的门槛降低,让更多的人能够负担得起,进而可以在线分享自己的想法。技术变革中最著名的摩尔定律,只是这一更深刻、更根本的过程的一种表现形式。
……
而在信息技术领域,加速回报定律则体现得非常明显,反馈循环可以使创新带来的成本低于其所创造的收益,因此进步得以持续。随着AI在越来越多的领域得到应用,现在计算领域已经很熟悉的指数发展趋势将开始在医学等领域显现出来,而这些领域以前的进展都非常缓慢,费用高昂。随着AI的广度和能力在21世纪20年代迅速扩大,这将从根本上改变我们通常认为不属于信息技术的领域,如食品、服装、住房,甚至是土地利用。简而言之,这就是为什么在未来几十年里,生活的大多数方面都将以指数级速度变得更好。我们现在正处于接近这些指数曲线陡然升高的阶段。
问题在于,新闻报道系统性地扭曲了我们对这些趋势的看法。经验丰富的小说家或编剧会告诉你,要想吸引观众的兴趣,你需要不断升级的危险或冲突元素。从古代神话到《星球大战》,吸引和占据我们注意力的都是类似的模式。新闻报道也会有意无意地模仿这种模式。社交媒体为了使用户情绪反应最大化、推动用户参与、扩大广告收入,对算法进行了优化,使得这种情况进一步强化。这种模式也导致了对未来危机的报道的选择偏差,也使得本章开头提到的那些新闻标题沉在了新闻版面的底部。
人们对坏消息的偏好实际上是一种进化适应。从演化史上看,关注潜在的挑战对人类的生存而言更为重要。树叶发出的“沙沙”声可能暗示着有捕食者存在,所以我们把注意力集中在这种威胁上是有道理的。相比之下,你种植的作物产量比前一年提高了0.1%则显得无关紧要。
那些在狩猎采集部落中生存的人类并没有进化出更好的本能来思考这些渐进发生的积极变化,这并不奇怪。在人类历史的大部分时间里,生活质量的提高是如此细微和脆弱,以至于很多人在完整的一生内也几乎察觉不到。事实上,直到中世纪,人类的生存状态与石器时代的祖先相比也没有太大差别。在英国,1400年的人均GDP估计为1605英镑(以2023年英镑计算,下同)。如果在那一年出生的人活到80岁,那么在他们去世时,英国的人均GDP与他们出生时相比没有任何变化。对于1500年出生的人来说,他们出生时的人均GDP已经下降到1586英镑,80年后才反弹到1604英镑。相比之下,在1900年出生的人,如果他们有80年寿命,可以见证人均GDP从6734英镑跃升到20979英镑。因此,不仅生物进化没有使我们适应渐进的进步,我们的文化进化也没有。柏拉图或莎士比亚的作品中也没有任何提醒我们要注意社会的物质进步的内容,因为在他们生活的年代,这种进步是不明显的。
与捕食者藏在树丛中相似的现代情境是,人们会不断地监测他们的信息来源,包括社交媒体,以了解可能危及自己的危险事态。根据美国媒体心理学研究中心主任帕梅拉·拉特利奇(Pamela Rutledge)的说法:“我们不断地关注众多事件并问自己,‘这与我有关吗?我有危险吗?’”这限制了我们评估缓慢发展的积极变化的能力。
另一个进化适应是一种有充分证据证明的心理偏差,即记忆中的过去比实际情况更美好。痛苦和悲伤的记忆比积极的记忆消退得更快。在科罗拉多州立大学心理学家理查德·沃克(Richard Walker)1997年的一项研究中,受访者根据愉悦和痛苦的感受对事件进行了评估,并分别在3个月、18个月和4.5年后再次进行了评估。结果发现,负面感受消退的速度远远快于正面感受,而愉快的记忆则会持续存在。2014年,在包括澳大利亚、德国、加纳等国家进行的一项研究表明,这种“消极影响偏差的消退”是一种全球性现象。
Nostalgia(“怀旧”或“乡愁”)这个术语是由瑞士医生约翰内斯·霍弗(Johannes Hofer)在1688年通过结合希腊语nostos(意为“长时间离家后回家”)和algos(意为“痛苦或悲伤”)创造出来的。它不仅仅表示回忆美好的往事,更是一种通过美化过去来应对压力的机制。如果过去的痛苦记忆不会淡去,我们恐怕会永远被困其中。有研究已经证明了这一现象。北达科他州立大学心理学教授克莱·劳特利奇(Clay Routledge)的一项研究分析了怀旧作为一种应对机制的作用。结果发现,写下回忆中的积极事件的受访者有着更高的自尊水平和更牢固的社会联系。怀旧机制对个人和社区而言都是有益处的。当我们回顾过去的经历时,痛苦、压力和挑战都会消失,我们倾向于记住生活中更积极的方面。相反,当我们想到现在时,我们会高度关注当前面临的焦虑和困难。这常常导致一种错误的印象,人们总是认为过去比现在更美好,尽管有压倒性的客观证据证明事实并非如此。
我们还有一种认知偏差,即夸大负面事件在日常生活中发生的普遍性。例如,2017年的一项研究表明,如果微小的随机变动(例如股市的涨跌、恶劣或和缓的飓风季、失业率的升降)是负面的,那人们就不太可能将其视为随机现象。相反,人们会怀疑这些变化预示着更广泛的恶化趋势。正如认知科学家阿特·马尔克曼(Art Markman)总结的一个关键研究结果:“当被问及图表是否表明经济状况发生了根本性转变时,人们更有可能把一个小幅变化看作重大变化,因为在他们看来这意味着情况正在恶化而非好转。”这项研究以及更多类似的研究表明,我们习惯于期待熵增,即认为世界的默认状态是事物会分崩离析和变得更糟。这种期待可能是一种建设性的适应,使我们为挫折做好准备并适时采取行动。但它也是一种强大的偏见,掩盖了人类的生活状态实际上正在改善的真相。
……
血腥的新闻更吸引眼球”这一格言概括了导致这些误解的一个主要原因。暴力事件会被广泛报道,而犯罪率的下降(例如以数据为依据执法或警察与社区之间更好的沟通)实际上是“非事件”。因此,它们不会被广泛报道。
这不一定是任何人有意识决定的结果,媒体的激励机制在结构上本就偏向于报道暴力或负面的事件。由于本章前面描述的认知偏差,人类天生更容易被威胁性信息吸引。大多数媒体(包括传统新闻媒体和社交媒体)通过吸引眼球来获得广告收入,因此媒体行业的共识是,引发强烈情绪反应的威胁性信息是获取关注的最佳方式,这并不令人感到惊讶。
这也与紧迫性问题有关。“新闻”一词从字面上看,表明信息是新颖且及时的。人们只有有限的时间来消费媒体内容,所以倾向于优先关注新发生的事件。问题是,绝大多数这样的突发事件都是坏事。正如我在本章开头强调的那样,世界上发生的大多数好事都是渐进式的。换言之,这些故事的紧急程度较低,很难登上《纽约时报》的头版或成为美国有线电视新闻网的头条新闻。社交媒体上也存在类似的效应,分享灾难性内容的视频很容易,而那些展现循序渐进式过程的内容没有戏剧性的画面。
正如史蒂芬·平克所说:“新闻是一种会使人们对世界的认知与现实产生偏差的媒体内容。它总是关注已发生的事件,而不是没有发生的事情。所以,当有一名警察没有被枪杀或一个城市没有发生暴力示威时,它们不会上新闻。只要暴力事件没有彻底消失,就总会有可以点击的头条新闻……悲观主义可能是一种自我实现的预言。”现在,社交媒体上汇集了整个地球上发生的令人震惊的新闻,而之前的人们只了解当地或周边地区发生的事件。
然而,我的相反看法是:“乐观主义不是对未来的无谓猜测,而是一种自我实现的预言。”相信一个更美好的世界确实可能存在是一种强大的动力,可以让我们更努力地创造一个更美好的世界。
丹尼尔·卡尼曼(Daniel Kahneman)因其解释人们在对世界进行估计时使用的无效和无意识的启发式的工作[其中一些是与阿莫斯·特沃斯基(Amos Tversky)合作完成的]而获得了诺贝尔经济学奖。他们的研究表明,人们系统地忽视了先验概率——一般而言,对一个群体来说普遍正确的事情,对该群体中的个体而言也是正确的。例如,如果让你根据一个陌生人的自我描述猜测他可能从事的职业,陌生人告诉你他“喜欢书”,你可能会猜他是“图书管理员”,而忽略了现实世界的比例:世界上的图书管理员相对较少。能够克服这种偏见的人会意识到,喜欢书并不能表明一个人的职业,所以他们反而会猜一个更常见的职业,如“零售业从业者”。人们并非不知道基本的概率,但在考虑特定情况时,他们经常会忽略这一点,而倾向于对生动的细节做出反应。
卡尼曼和特沃斯基引用的另一个带有偏见的启发式是,天真的观察者会认为,如果正在抛硬币的他们抛出了一连串的反面,那么下一次更有可能抛出正面。这是由于对均值回归的误解。
卡尼曼和特沃斯基所说的“可得性启发式”的第三种偏见可以用于解释社会整体的悲观倾向。人们对一个事件或现象发生的可能性的评估,取决于他们能轻易联想到的相关案例。基于上述原因,新闻和我们的新闻源多强调负面事件,所以这些负面情况很容易出现在我们的脑海中。
这些偏见应该被纠正并不意味着我们应该忽视或低估真正的问题,但它为我们对人类的总体发展轨迹保持乐观提供了强有力的理性依据。技术变革不会自动发生,它需要人类的聪明才智和努力。这些进步也不是我们忽视人类面临的苦难的理由。
相反,我们应该明白,尽管这些问题有时候看起来很困难,甚至毫无希望,但作为一个物种,人类正在扭转问题的发展态势。我发现这是动力的源泉。
几乎生活的每个方面都在逐步变得更好
信息技术之所以呈指数级发展,因为它直接促进了自身的进一步创新。与此同时,这一趋势也助推了其他领域众多相互强化的进步机制。在过去的两个世纪里,这催生了一个良性循环,增进了人类福祉的各个方面,包括识字、教育、财富、卫生、健康、民主化和减少暴力。
我们经常从经济角度来思考人类的发展:随着人们每年能够赚取更多的钱,他们就有机会过上更高质量的生活。但真正的发展并不仅仅意味着积累财富。经济周期起伏不定,财富可以获得也可以失去。但技术变革本质上是永久性的。一旦人类文明学会了如何做一些有用的事情,我们通常会保存相关知识,并在此基础上继续发展。这种单向的进步历程已经成为抵消因自然灾害、战争和流行病等导致社会倒退的短暂性灾难的强大力量。
教育、医疗保健、卫生设施和民主化等相互交织的因素形成了相互强化的反馈循环,这些领域的任何改善都可能给其他领域带来益处。例如,更好的教育培养出更有能力的医生,更好的医生能让更多的儿童健康地留在学校。这其中暗含的意义在于,新技术可以带来巨大的间接收益,即使是在那些与技术的应用领域相距甚远的领域。例如,20世纪的家用电器不仅为人们节省了大量时间和汗水,而且促进了女性解放和社会变革,使数百万有才华的女性进入劳动力市场,在无数领域做出了重要贡献。总的来说,我们可以说,技术创新创造了有利条件,帮助社会中更多的人发挥潜力,而这反过来又催生了更多的创新。
例如,印刷机的发明改善并大大扩大了人类接受教育的机会,给社会培养了更有能力和素质更高的劳动力,从而促进了经济增长。更高的识字率使生产和贸易的协调更加顺畅,这也带来了更大的繁荣。反过来,增加的财富又可以更多地用于投资基础设施和教育,从而加速这一有益的循环。与此同时,大规模的印刷传播促进了民主化程度提升,随着时间的推移,这种民主又消除了更多的暴力。
起初,这是一个非常缓慢的过程,祖父母和孙辈之间的生活方式差异并不明显。但几个世纪以来,所有这些衡量社会福祉的指标一直在显著提升。近几十年来,在几乎所有形式的信息技术的指数发展曲线日益陡峭的情况下,这些趋势加速了。正如我在本章中所描述的那样,在未来几十年,我们将进入高速发展阶段。
……
识字率与教育水平的快速提升
冲水马桶、电力、收音机、电视和计算机的普及情况
预期寿命:我们正在走上第二座桥梁
今天,这些容易实现的进展大多已经实现。导致疾病和残障的其余原因主要源自我们体内。由于细胞功能失调和组织崩溃,我们会患上癌症、动脉粥样硬化、糖尿病和阿尔茨海默病等疾病。我们可以在一定程度上通过改变生活方式、饮食和服用营养补充剂来降低这些风险,我称之为通向大幅延长寿命的第一座桥梁。但这些方法只能推迟不可避免的死亡。这就是为什么自20世纪中期以来,发达国家的人口预期寿命增长放缓。例如,从1880年到1900年,美国人出生时的预期寿命从大约39岁延长到49岁,但从1980年到2000年,在医学的研究重点从传染病转向慢性病和退行性疾病之后,人口预期寿命只是从74岁延长到了76岁。
幸运的是,在21世纪20年代,我们正在走上第二座桥梁:将AI和生物技术结合起来,战胜那些退行性疾病。研究人员已经不再仅仅依靠使用计算机来整合干预措施和临床试验的相关信息。如今,他们正在利用AI来寻找新药,并且在2030年左右,数字模拟可用于扩大并最终取代进展缓慢、效率低下的人体试验。实际上,我们正在将医学转变为信息技术,利用这些技术所能够带来的指数级进步掌握人体生物学的“软件”。
这方面最早和最重要的例子之一出现在遗传学领域。自2003年人类基因组计划完成以来,基因组测序的成本呈指数级下降趋势,平均每年下降一半左右。尽管2016年至2018年测序成本下降过程中出现了短暂平台期,以及COVID-19大流行导致进展放缓,但测序成本仍在持续下降。随着先进的AI技术在测序中发挥更大的作用,这一趋势可能会再次加速。单个基因组测序的成本已经从2003年的5000万美元下降到2023年初的399美元。一家公司承诺,当你读到这篇文章时,他们将以100美元的价格提供基因组测序服务。
随着AI越来越多地改变医学领域,它将引发许多类似的趋势。AI已经在临床方面产生影响,但我们仍处于这条特殊指数曲线的早期阶段。到21世纪20年代末,目前应用方面的涓涓细流将汇聚成一股洪流。届时,我们将能够直接解决目前将人类最长寿命限制在约120岁的生物学原因,包括线粒体基因突变、端粒长度缩短以及导致癌症的不受控的细胞分裂。
在21世纪30年代,我们将跨上彻底延长寿命的第三座桥梁:医用纳米机器人,它们能够在我们的身体内智能地进行细胞层面的维护和修复。根据某些定义,一些生物分子其实已经可以被看作纳米机器人了。但是,纳米机器人的独特之处在于,它们能够被AI控制,以执行不同的任务。在这个阶段,我们将获得对自己生物学身体的控制能力,就像维修工对汽车部件的控制能力一样。也就是说,除非你的车在一次重大事故中完全报废,否则你可以无限制地继续修理它或更换零件。同样,智能纳米机器人将能够有针对性地修复或升级个别细胞,从而帮助人类彻底战胜衰老。在后面的第6章,我们将对此进行更详细的讨论。
第四座桥梁——能够以数字化方式备份我们的思维文件,将是21世纪40年代的技术。正如我在第3章中所论证的那样,决定一个人身份的核心因素不是他的大脑,而是他的大脑能够表示和操纵的信息的特殊排列。一旦我们能够以足够高的精度扫描这些信息,我们就能够在数字载体上复制它。这意味着即使生物大脑被摧毁,一个人的身份也不会被摧毁。通过安全地对其进行复制备份,这个身份可以获得几乎无限长的寿命。
贫困人口持续减少,收入快速增加
暴力的减少
人们现在才开始正确认识到另一个因素,即环境污染与犯罪之间的关系。在20世纪的大部分时间里,我们对环境毒性,特别是铅对大脑的影响知之甚少。儿童接触汽车尾气和家用油漆中的铅会对其认知发展产生不利影响。虽然不能确定这种慢性中毒是否与某个人的犯罪行为有直接关系,但在整个人口层面上,它确实导致了暴力犯罪的统计数字增加,可能是因为它导致了人们控制冲动能力的下降。大约从20世纪70年代开始,越来越多的环境法规对儿童接触铅和其他毒素的情况进行了限制,这也被认为有助于降低暴力水平。
在2011年出版的《人性中的善良天使》一书中,史蒂芬·平克进一步提供证据表明,自中世纪以来,欧洲的凶杀死亡人数大致下降了50%,在某些情况下甚至更多。例如,在14世纪的牛津,每年每10万人中估计有110人被杀,而今天的伦敦平均每10万人中只有不到1人被杀。平克估计,与史前社会相比,因暴力致死的总人数大约为之前的1/500。
即使是在20世纪的重大历史冲突下,其死亡人数按比例计算也远不及人类过去在没有正式国家时持续发生的暴力致死人数。平克研究了历史上27个没有建立正式国家的不发达社会,它们是狩猎采集者和狩猎种植者的混合体,可能代表了人类史前的大多数社会。他估计这些社会的平均战争死亡率为每年每10万人中有524人。相比之下,20世纪经历了第一次世界大战和第二次世界大战,其中包括种族灭绝、原子弹轰炸以及世界上有史以来最大规模的有组织暴力。然而,在德国、日本和俄罗斯这三个受到战争创伤较严重的国家,20世纪的战争死亡率分别只有每10万人中144人、27人和135人。相比之下,尽管美国在世界各地都卷入了战争,但在整个20世纪,每年每10万人中只有3.7人死于战争。
然而,大多数公众错误地认为暴力正在变得更加严重。平克主要将其归因于“历史短视”,即人们更关注近期发生的事件,而对过去更久远的、更糟糕的暴力事件一无所知。从本质上讲,这就是可得性启发式在起作用。这些误解部分可归因于记录技术的差异:我们可以轻松访问最近暴力事件的极具冲击性的视频画面,而对于19世纪甚至更早的事件,我们只能接触到黑白照片,或者仅仅是文字描述和相对较少的绘画作品。
与我一样,平克将暴力事件的戏剧性减少归因于良性反馈循环。当人们越来越有信心摆脱暴力时,建立学校、写书和读书的动机就会越来越强,这反过来又鼓励人们诉诸理性而不是武力来解决问题,从而进一步减少暴力。其中起作用的是“同情心的扩展圈”(借用哲学家彼得·辛格的术语),它将我们的认同感从狭隘的群体(如氏族)扩展到整个国家,然后扩展到外国人,甚至扩展到非人类的动物。法治和反对暴力的文化规范也发挥着越来越重要的作用。
这些良性反馈循环本质上是由技术驱动的,这可以说是一种对未来的关键洞见。过去,人类只认同小群体,但通信技术(先是书籍,然后是广播和电视,再接着是计算机和互联网)使我们能够与越来越广泛的人群交流思想,发现我们的共同点。观看发生在遥远国度的灾难的震撼视频可能会导致我们忽视历史的长期趋势,但它也有效地利用了人类天生的同理心,将我们的道德关怀扩展到整个人类。
此外,随着财富的增长和贫困的减少,人们有了更强的合作动机,对有限资源的零和博弈逐渐减少。我们中的许多人都有一种根深蒂固的观念,认为对稀缺资源的争夺是导致暴力的一个主要原因,这也是人性中固有的一部分。虽然这是人类历史大部分事件发生的原因,但我认为这不会永远持续下去。数字革命使得我们可以轻松以数字方式表示的许多事物的稀缺性大大降低,从网络搜索到社交媒体连接。为了一本实体书而争抢可能很微不足道,但在某种程度上我们可以理解。两个孩子可能会为最喜欢的漫画书而争吵,因为同一时间只有一个人可以阅读它。但是人们为PDF文档而争吵的想法是滑稽的,因为你有访问权限并不意味着我没有。我们可以根据需要创建任意数量的副本,基本上都是免费的。
一旦人类拥有极其便宜的能源(主要来自太阳能,最终将来自核聚变)和AI机器人,许多种类的商品将变得很容易复制,以至于人们为之暴力相向看起来会像今天为PDF文件而争吵一样愚蠢。通过这种方式,从现在到21世纪40年代,信息技术的巨大进步将推动社会其他方面的变革性进步。
可再生能源成本呈指数级下降
人类科技文明的几乎每个方面都需要能源,但长期依赖化石燃料是不可持续的,主要有两个原因。最明显的是,化石燃料会产生有毒污染物,其次,它也将我们限制在稀缺资源上,即使人类对廉价能源的需求激增,开采稀缺资源的成本也越来越高。
知识与技术的传递助推民主的扩散
廉价的可再生能源将带来巨大的物质财富,但人们能否公平地分享它取决于民主。这里再次出现了一个幸运的协同作用:信息技术长期以来一直在促进社会的民主进程。民主起源于中世纪的英格兰,这与大众传播技术的兴起相呼应,而且很可能在很大程度上是由后者引起的。1215年,由约翰王签署的《大宪章》(Magna Carta)明确阐释了普通人不受不公正监禁的权利。然而在中世纪的大部分时间里,平民的权利经常被忽视,政治参与度很低。随着古登堡于1440年左右发明活字印刷机并迅速普及,受过教育的阶层开始更高效地传播新闻和思想。
……
历史给了我们保持乐观的理由。随着信息共享技术的发展,从电报到社交媒体,民主和个人权利的理念已经从鲜为人知发展到成为全世界的共同愿望,而且已经成为地球上近一半人口的生活现实。这些技术的发展为民主的传播提供了重要的推动力。想象一下,未来20年技术的指数级进步将使我们能够更充分地实现民主和个人权利的理想。
我们正进入指数增长的陡峭阶段
需要认识到的关键是,到目前为止,我所描述的所有进展都来自这些指数趋势缓慢增长的早期阶段。鉴于信息技术将在未来20年取得比过去200年更大的进步,它对整体繁荣的贡献将大得多。事实上,这些好处已经比大多数人意识到的要多得多了。
……
在21世纪20年代后期,我们将能够用3D打印机打印服装和其他常见商品,每磅材料只需几美分。3D打印的一个关键趋势是小型化,人们正在设计可以在物体上创建更小细节的机器。在某个时候,传统的3D打印范式,如挤压(类似于喷墨打印)将被更小尺度上的创造新方法所取代,以实现更小规模的制造。可能在21世纪30年代的某个时候,这将跨越到纳米技术领域,届时将可以在原子精度上创建物体。埃里克·德雷克斯勒(Eric Drexler)在他1992年的著作《激进的丰度》(Radical Abundance)中估计,考虑到生产质量和效率更高的纳米材料,原子精度的制造可以以每千克20美分的成本制造大多数种类的物体。尽管这些数字仍然是推测性的,但成本的降低幅度肯定是巨大的。就像我们在音乐、书籍和电影中看到的那样,除了专有设计之外,还会有许多免费设计可用。事实上,在越来越多的领域,开源市场(现在和将来都是一个伟大的均衡器)与专有市场的共存,将成为经济的决定性特征。
正如我将在本章后面解释的那样,我们将很快通过AI控制生产,在垂直农场中生产高质量、无化学品污染、低成本的食物。而且,相比于对环境造成严重污染的工厂化养殖,借助细胞培养培育出干净、合乎道德的肉类将成为主流。2020年,人类屠宰了超过740亿头陆地动物作为肉类食物,这些肉类产品总重估计为3.71亿吨。联合国估计,相关碳排放占人类每年所有排放量的11%以上。目前,被称为实验室人造肉的技术有可能从根本上改变这种状况。传统的肉类生产方式有几个主要缺点:它会给无辜的动物带来痛苦,对人类健康有害,而且会通过有毒污染物和碳排放对环境造成严重影响。从细胞和组织中培养的肉类可以解决所有这些问题。这种方式不会伤害任何活体动物,可以被设计得更健康、更美味,而且对环境的危害可以通过使用更清洁的技术降到最低。技术推广的关键在于培养肉能否做到以假乱真。截至2023年,该技术可以复制没有太多结构的肉类,如类似碎牛肉的肉制品,但还无法从头开始生成完整的菲力牛排。当人造肉可以令人信服地达到所有动物肉的水平时,我预计大多数人对它的不适感将很快减弱。
……
正如我稍后也会更详细地描述的那样,我们很快就能够以较低的成本生产用于建造房屋和其他建筑物的模块。这将使数百万人能够负担得起舒适的居住环境。这些技术都已经成功试验过了,并将在未来10年变得越来越先进,被大多数人采用。与物理世界的这场革命并行的,将是下一代VR和AR技术的革命性发展,有时被称为元宇宙(Metaverse)。多年来,元宇宙这个概念在科幻小说和未来主义圈子之外基本上无人知晓。但Facebook在2021年将品牌更名为Meta,并宣布其长期战略的核心是在构建元宇宙方面发挥关键作用,这大大提升了公众对元宇宙的认知,以至于现在许多人错误地认为是Meta发明了这个概念。
就像互联网将网页、应用程序和服务集成到一个持久的在线环境中一样,21世纪20年代后期的VR和AR技术将融合成一个引人注目的新现实层。在这个数字世界中,许多产品甚至不需要以实物形态存在,因为高度逼真的模拟版本已经足够好了。例如,虚拟会议可以让人们像面对面一样与同事互动和协作;虚拟音乐会可以提供身临其境的听觉体验,仿佛置身于交响乐大厅;在融合多种感官的虚拟海滩度假,可以让全家人享受沙滩和大海的声音、景象和气味。
目前,大多数媒体只局限于刺激人的视觉和听觉两种感官。虽然已经有一些VR系统可以结合气味或触觉,但仍然很笨重和不方便。在未来几十年里,脑机接口技术将变得更加先进。最终,它将可以实现全身心沉浸式的VR体验,将模拟的感官数据直接输入我们的大脑。这种技术将带来重大且难以预测的变化,影响人们如何安排时间以及他们会优先考虑何种体验。它还将迫使人们重新思考为什么要做某些事情。例如,当可以在VR中安全地体验攀登珠穆朗玛峰的所有挑战和欣赏自然美景时,人们将会权衡是否还要去攀登真的珠峰,或者重新思考危险本身是否才是吸引人的关键因素。
拉加德对我提出的最后一个挑战是,土地不会成为一种信息技术,而且我们现在所处的环境已经非常拥挤了。我的回答是,我们之所以感到拥挤,是因为我们选择了密集地挤在一起。城市的出现就是为了让我们能够一起工作和娱乐。但是,在乘火车去世界上任何一个地方旅行时你会发现,几乎所有适宜居住的土地都还没有被占用,只有1%的土地被开发用于人类居住。人类直接使用的适宜居住的土地只占地球陆地面积的一半,这一半几乎全部被用于农业。在农业用地中,77%用于饲养牲畜、放牧和种植饲料,只有23%用于种植供人类消费的作物。人造肉和垂直农业只须使用现在已经在使用的一小部分土地就能满足需求。这将使健康食品更加丰富,容纳不断增长的人口,同时还能释放出大片土地。自动驾驶汽车将通过延长通勤时间来减少交通拥堵。我们将能够在任何想要的地方生活,同时仍然能够在VR和AR空间中一起工作和娱乐。
我们正在接近为每个人提供清洁水的目标
21世纪的一个关键挑战将是确保地球上不断增长的人口有稳定的清洁淡水供应。1990年,世界上有约24%的人无法获得相对安全的、稳定的饮用水源。由于持续不断的努力和技术进步,这一数字现在已降至大约1/10。然而,这仍然是一个严峻的问题。根据健康指标与评估研究所(Institute for Health Metrics and Evaluation)的数据,2019年全球约有150万人(其中包括50万名儿童)死于腹泻疾病,主要是死于饮用被粪便中的细菌污染的水。这些疾病包括霍乱、痢疾和伤寒,对儿童尤其致命。
问题在于,全球大部分地区仍然缺乏收集淡水、保持水清洁并将其输送到家中供人们饮用、烹饪、洗涤和沐浴的基础设施。建造由庞大的水井、水泵、输水管和管道组成的网络费用高昂,许多发展中国家无力承担。此外,内战和其他政治问题有时会使大型基础设施项目受阻。因此,发达国家的集中式水净化和输送系统对于最后1/10无法获得清洁水的人口来说并不是一个可行的解决方案。替代方案是使人们能够在当地社区甚至自己家净化水的技术。
总的来说,去中心化技术将在许多领域定义21世纪20年代,并在许多领域延续下去,包括能源生产(太阳能电池)、食品生产(垂直农业)和日常物品的生产(3D打印)。对于水的净化,相关的方法有多种形式,Janicki Omniprocessor这样的建筑物大小的机器可以为整个村庄提供净化水,而个人可以使用如LifeStraw这样的便携式水净化装置。
一些净化装置主要是利用来自太阳能或燃烧燃料产生的热能将水煮沸。煮沸可以杀死致病细菌,但不能去除其他有毒污染物,而且如果水不在煮沸后立即饮用,很容易再次被污染。在水中添加抗菌的化学物质可以防止再次污染,但仍然无法去除其他毒素。近年来,一些便携式水净化装置利用电力将空气中的氧气转化为臭氧,这种气体可以通过水非常有效地杀死病原体。臭氧是一种强氧化剂,可以氧化和分解水中的有机污染物。其他装置则通过紫外线照射水来杀死细菌和病毒。但这两种方法同样不能防止化学污染。
迈向奇点的关键进展
尽管仍然存在挑战,但随着水净化技术的不断进步,我们正在接近为每个人提供清洁水的目标。分散式净水方案为偏远地区和基础设施薄弱的国家带来了希望。未来,结合不同的净化方法,并与卫生教育和废弃物管理等其他措施相结合,我们有望进一步减少水源性疾病,为全球健康做出重要贡献。
过滤技术能够去除水中的大部分但非全部的微生物和毒素。许多致命的病毒非常小,以至于它们可以通过普通过滤器上的孔。同样,一些污染物的分子无法被正常的过滤过程阻挡。然而,最近材料科学的创新正在创造出可以阻挡越来越小的毒素的过滤器。在未来几年中,纳米工程材料将使过滤器能够更快地工作,而且非常便宜。
一项特别有前途的新兴技术是由迪恩·卡门(Dean Kamen)发明的弹弓式饮水机(Slingshot Water Machine)。它是一个相对紧凑的设备,大约有一个小冰箱大小,可以用任何质量的水源,包括污水和受污染的沼泽水,生产出完全纯净的水,达到可注射液体的标准。这种饮水机的运行需要不到一千瓦的电力。它采用蒸气压缩蒸馏(将输入的水转化为蒸气,留下污染物)并且不需要过滤器。这种饮水机由一种适应性非常强的发动机提供动力,这种发动机被称为斯特林(Stirling)发动机,它可以利用任何热源产生电力,包括燃烧牛粪。
垂直农业将提供廉价的高质量食物,并释放我们用于水平农业的土地
目前作物种植密度已经接近了在一定室外区域内理论上可以种植作物数量的极限。一个新兴的解决方案是种植多层堆叠的作物,这就是所谓的“垂直农业”。垂直农场目前采用的技术有几种。它们通常采用水培方式种植,这意味着植物不是生长在土壤中,而是生长在位于室内的营养丰富的水槽中。这些托盘被装入框架并堆叠成多层(见图4-41),这样上一层的多余水分可以滴落到下一层,而不会以径流的形式流失。一些垂直农场现在使用了一种被称为气雾培植的新方法,用细雾取代了水。这种种植方法不依靠阳光,而是安装特殊的LED灯以确保每株植物获得完美的光照量。
Gotham Greens公司是垂直农业领域的领导者之一,从加利福尼亚州到罗得岛州,这家公司拥有10处大型种植设施。截至2023年初,它已经筹集了4.4亿美元的风险投资。在给定的作物产量下,这家公司的种植技术使用的“水比传统农场少95%,使用的土地少97%”。这种效率意味着我们可以释放大量水资源和土地用于其他用途(目前农业用地占据了世界上大约一半的可居住土地),并提供更丰富、更实惠的食物。
垂直农业还有其他一些关键优势。它不会形成农业径流,这样就消除了造成水道污染的主要原因之一。这种种植方式也不需要在松散的土壤上进行,而松散的土壤会被风吹到空气中,导致空气质量变差。有毒农药也不再是生产作物的必要条件,设计合理的垂直农场可以防止害虫进入。采用这种方法,还可以在全年任何时候种植作物,包括那些无法在当地户外环境中生长的作物。这同样可以防止因霜冻和恶劣天气造成的损失。也许最重要的是,它意味着城市和村庄居民可以在本地种植自己所需的食物,而不需要通过火车和卡车从数百甚至数千千米外调运。随着垂直农业变得更便宜、更普及,它将大大减少污染和排放。
在未来几年,光伏发电、材料科学、机器人技术和AI等领域的创新将不断融合,使垂直农业比当前农业便宜得多。其中的许多设施将由高效太阳能电池供电,可以在现场生产新型肥料,从空气中收集水,并使用自动化机器收获作物。由于只需要很少的工人和很小面积的土地,未来的垂直农场最终将能够以极低的成本生产作物,消费者可能可以免费获得食物。
这一过程反映了信息技术领域由于加速回报定律而发生的情况。随着计算能力的性价比呈指数级增长,谷歌和Facebook等公司已经能够通过广告等替代商业模式支付自己的成本,为用户提供免费服务。通过使用自动化和AI来控制垂直农场,垂直农业基本上代表了将食物生产转变为一种类似于信息技术的生产方式。
3D打印将革新实物的创造和分销模式
在20世纪的大部分时间里,制造三维物体通常采用两种形式。有些工序涉及在模具内对材料塑形。例如,将熔化的塑料注入模具中,或在压力机中对加热的金属塑形。其他过程则涉及从块状或板状材料中选择性地切除部分材料,就像雕塑家用大理石块雕刻雕像一样。这两种方法都有很大的缺点。制作模具的成本非常高,而且一旦完成,模具就很难修改。相比之下,所谓的减法制造会浪费大量材料,并且无法生产某些形状。
不过,在20世纪80年代,一系列新的技术开始出现。与以前的方法不同,这些技术通过堆叠或沉积形成相对平坦的层,逐步构建成三维形状来制造零件。这些技术被称为增材制造、三维打印或3D打印。
最常见的3D打印机的工作方式有点像喷墨打印机。典型的喷墨打印机会在一张纸上来回移动,根据软件的指示将墨水从墨盒喷嘴中喷射到指定位置。3D打印机用的不是墨水,而是塑料等材料,并将其加热到变软。打印机的喷嘴会按照软件指令为每一层设计的模式沉积材料,这个过程会重复多次,直到物体逐渐变得立体。各层材料在硬化的过程中会相互融合,最终形成可以直接使用的成品。在过去的20年中,3D打印技术在提高分辨率、降低成本和提升速度方面取得了长足的进步。
迈向奇点的关键进展
如今,3D打印系统已经能够使用各种材料来创建物体,包括纸张、塑料、陶瓷和金属。随着3D打印技术的不断进步,它将能够处理更多新奇的材料。例如,医疗植入物可以内置药物分子,以便在体内逐步释放。石墨烯等纳米材料可用于制造轻质防弹服和超高能电子产品。受益于AI的进步,3D打印还可以从AI的进步中受益,例如有了优化有关物体强度、空气动力学设计或其他属性的软件,甚至可以设计出目前采用的方法无法制造的形状。
新的、直观的软件使得普通人无须接受高级培训就能更轻松地创建3D打印零件。随着3D打印的普及,它已经开始为制造业带来革命性的变化。3D打印的一大优势在于能够实现低成本、快速的原型制作。工程师可以在计算机上设计新零件,并在几分钟或几小时内拿到3D打印模型。而采用之前的技术,这个过程可能需要几周时间。3D打印让工程师能够进行快速的测试和修改,付出成本只是旧方法的一小部分。因此,那些拥有好点子但资金相对不足的人,也能够将他们的创新成果推向市场,造福社会。
3D打印的另一个关键优势在于,它能够实现模具制造无法企及的定制化水平。在模具制造中,即使是轻微的修改,通常也需要制作一个全新的模具,这可能会耗费数万美元甚至更多。相比之下,即使对3D打印设计进行重大修改,也不会产生额外的成本。因此,发明者能够获得创新所需的精确零件,消费者也能够以承受得起的价格购买为他们专门设计的产品。举个例子,制造出与客户脚部尺寸完全匹配的鞋子,可以大大提高鞋子的合脚性和舒适度。FitMyFoot就是一家领先的3D打印鞋类公司,它允许客户使用应用程序拍摄自己脚部的照片,然后将照片自动转换为打印过程所需的测量数据。类似地,家具也可以定制成适合不同人类体形的样子,工具也可以精确地贴合你自己的手形。更重要的是,关键的医疗植入物(见图4-42)将变得更加经济、实惠和有效。
除此之外,3D打印技术还能实现制造业的去中心化,赋予消费者和地方社区更多的权利。这与20世纪发展起来的制造业范式形成了鲜明对比,在传统模式中,制造业主要集中在大城市的大型企业和工厂。在这种模式下,小城镇和发展中国家不得不从遥远的地方购买产品,运输既昂贵又耗时。去中心化的制造模式还将带来显著的环境效益。将产品从工厂运送到数百或数千千米外的消费者手中会产生大量碳排放。根据国际运输论坛的数据,货运占燃料燃烧产生的碳排放总量的约30%。去中心化的3D打印技术可以使这些都变得不再重要。
随着时间的推移,3D打印的分辨率逐年提高,同时成本也在不断降低。随着分辨率的提高,即可实现的最小设计特征尺寸的缩小,以及成本的下降,可以经济地打印的商品种类将会增多。例如,许多常见织物的纤维直径为10~22微米。一些3D打印机已经可以达到1微米甚至更高的分辨率。一旦该技术能够以与普通织物相当的价格生产织物般的纤维直径和材料,打印出我们想要的任何服装在经济方面的可行性都会更高。由于打印速度也在提高,大批量制造将变得更具可行性。
除了制造鞋子、工具等日用品外,最新研究还将3D打印技术应用到了生物学领域。科学家目前正在测试能够打印人体组织,最终打印出完整器官的工具。其基本原理是将非活性生物材料(例如合成聚合物或陶瓷)打印成所需身体结构的三维“支架”。然后在支架上沉积富含干细胞的液体,细胞可以在那里繁殖并填充适当的形状,从而创建出具有患者自身DNA的替代器官。联合治疗公司(United Therapeutics,我是这家公司的董事会成员)正在应用这种方法以及其他方法来最终实现培育完整的肺、肾脏和心脏。与传统的将器官从一个人体内移植到另一个人体内的方法相比,这种方法最终将具有显著优势,因为传统移植在器官可用性和与患者免疫系统的相容性方面存在很大的局限性。
3D打印的一个潜在缺点是,它可能被用于制造“盗版”产品。如果你可以下载文件并自己打印出来,为什么还要花200美元购买一双设计师设计的鞋子呢?我们在音乐、书籍、电影和其他创意形式的知识产权方面已经面临着类似的问题。所有这些都需要新的方法来加以保护。
另一个令人不安的影响是,去中心化制造将允许平民制造他们原本无法轻易获得的武器。网上已经流传着一些文件,人们可以根据这些文件打印零件,然后组装成枪支。这将对枪支管控构成挑战,因为这些自制枪支没有序列号,执法部门将更难追踪罪犯。由高级塑料制成的3D打印枪支甚至可以逃过金属探测器。这需要我们重新审慎评估现行的法规和政策。
3D打印建筑物
3D打印通常被用于制造小物件,如工具或医疗植入物,但它也可以用于创建更大的结构,比如建筑物。这项技术正在快速通过原型阶段,随着3D打印建筑的生产成本降低,它们将成为当前建筑施工方法中的一种具有商业可行性的替代方案。最终,用3D打印制造建筑模块和建筑物内部较小的物品,将大幅降低住宅和办公楼的建造成本。
3D打印建筑物主要有两种方法。第一种是打印出零件或模块,然后再组装起来,就像人们从宜家买回家具组件,自己动手组装一样。在某些情况下,这意味着打印出墙体、屋顶等部件,然后在施工现场将它们拼接起来,就像搭建乐高积木一样。到21世纪20年代后期,这种组装模块的工作在很大程度上可以由机器人完成。
另一种方法是打印整个房间或模块化结构。这些模块通常为方形或矩形平面,可以组合成多种不同的布局。在施工现场,它们可以通过起重机吊装到位,并快速组装。这样可以最大限度地减少施工给周边社区带来的干扰和不便。2014年,中国盈创建筑科技有限公司展示了在24小时内建造10座简易的模块化房屋,每座造价不到5000美元。中国已经成为3D打印建筑的中心,未来几十年内,这项技术的更成熟版本在中国将有广阔的应用前景。
另一种方法是将整个定制设计的建筑物作为一个单一模块打印出来。
工程师需要在建造建筑物的区域周围设置一个大型框架。打印喷嘴在该框架内自行移动,使像混凝土这样的材料层沉积成墙的形状。主体结构施工几乎不需要人力劳动,但在完成后,工人可以进入建筑物内部做后续的工作,如安装窗玻璃和屋顶瓦片。例如,在2016年,华商腾达公司宣布他们打印了一座两层的别墅,该别墅在45天内一次性打印完成。就在我写这篇文章时,这项技术正在扩展到美国。2021年,一家名为Alquist 3D的公司完成了第一个业主自住的3D打印住宅。2023年,我们在休斯敦看到了第一座3D打印的多层住宅建筑。到21世纪20年代后期,将大型和小型物体的3D打印与智能机器人相结合,将提升建筑的个性化水平,同时大幅降低成本。
3D打印建筑模块有几个关键优势,随着技术的发展,这些优势将变得更加明显。首先,它降低了劳动力成本,这将使基本住房变得更加实惠。其次,缩短了施工时间,从而减少了长期施工造成的环境影响,这包括减少诸如废物和垃圾、光污染和噪声污染、有毒灰尘,避免交通中断以及对工人身体的伤害等方面。此外,3D打印使得使用现成的和本地可用的材料建造建筑物变得更加容易,而不是使用距离建设地点数百千米之外的资源,如木材和钢铁。
在未来,3D打印可能会使建造摩天大楼变得更容易和更便宜。建设高层建筑的主要挑战之一是将人和建筑材料运送到高层。3D打印系统,连同可以使用从地面泵送上来的液态建筑材料的自主机器人,将使这一过程变得更加容易和更加便宜。
勤奋的人将在 2030 年左右实现长寿逃逸速度
物质丰富与和平、民主使生活变得更好了,目前人们面临的风险最高的挑战是努力保护生命本身。正如我在第6章中所描述的那样,开发新的疾病治疗方法正在迅速地从线性的试错过程转变为一项指数级的信息技术,利用这种技术,我们系统地重新编程了生命的次优软件。
生物生命是次优的,因为进化是由自然选择优化的一系列随机过程。因此,随着进化“探索”可能的遗传特征的范围,它在很大程度上依赖于偶然性和特定环境因素的影响。此外,这一过程是渐进的,这意味着进化只能实现一种设计,这种设计要在通往所有特定特征的中间步骤都能使生物在其环境中取得成功。因此,肯定有一些潜在的特征是非常有用的,但无法通过进化获得,因为构建这些特征所需的渐进步骤在进化上是不合适的。相比之下,将智能(人类智能或人工智能)应用于生物学,将允许我们系统地探索所有的遗传可能性,以寻找那些最优、最有益的特征。这包括那些通过正常进化过程无法获得的特征。
自2003年人类基因组计划完成以来,我们已经在基因组测序方面经历了大约20年的指数级发展(大概每年翻一番)。就碱基对而言,这种翻倍平均每14个月就会发生一次,涉及多种技术,可以追溯到1971年从DNA中第一次对核苷酸测序。我们终于进入了这个已有50年历史的生物技术指数级发展趋势曲线最陡峭的部分。
我们开始使用AI来发现和设计药物及干预措施。到21世纪20年代末,生物模拟器将足够先进,可以在几个小时内生成一些关键的安全性和有效性数据,而不是像临床试验那样通常需要数年时间。从人体试验向计算机模拟试验的过渡将受到两种相互对立的力量的制约。一方面,人们对安全性的担忧是合理的:我们不希望模拟遗漏相关的医学事实,错误地宣布危险的药物是安全的;另一方面,模拟试验可以使用大量模拟患者,研究各种并发症和人口统计学因素,详细地告诉医生,新治疗方法将如何影响许多不同类型的患者。此外,更快地给患者提供救命药物可能会挽救许多人的生命。向模拟试验的过渡还将面临政治不确定性和官僚主义的阻碍,但最终技术的有效性将会胜出。
这里有两个值得注意的例子,可以说明计算机模拟试验将带来的益处。
- 免疫疗法使许多癌症4期和其他晚期患者的病情缓解,这是癌症治疗中非常有希望的一项进展。CAR-T细胞疗法等技术可以重新编程患者的免疫细胞,使其能识别和破坏癌细胞。到目前为止,由于我们对癌症如何逃避免疫系统的生物分子机制理解不完整,寻找这种方法的尝试仍然受限。但AI模拟将有助于打破这个瓶颈。
- 通过诱导性多能干细胞(iPS细胞),我们正在获得使心脏病发作后的心脏恢复活力的能力,并克服半数心脏病发作幸存者存在的“射血分数较低”(我父亲就是因此去世的)的问题。我们现在正在使用诱导性多能干细胞培养器官,这些细胞是通过引入特定基因将成体细胞转化为干细胞而得到的。
截至2023年,诱导性多能干细胞已用于重新生成气管、颅面骨、视网膜细胞、周围神经和皮肤组织,以及心脏、肝脏和肾脏等主要器官的组织。因为干细胞在某些方面类似于癌细胞,所以未来一个重要的研究方向将是找到将细胞分裂失控的风险降至最低的方法。这些诱导性多能干细胞可以像胚胎干细胞一样,分化成几乎所有类型的人体细胞。该疗法仍处于实验阶段,但已成功用于人类患者。对于那些有心脏问题的人来说,该疗法需要从患者身上创建诱导性多能干细胞,将它们培养成心肌组织,然后移植到受损的心脏上。诱导性多能干细胞通过释放生长因子来刺激现有心脏组织再生,从而发挥作用。实际上,它们可能是在欺骗心脏,使其认为自身处于胎儿期。这个方法正被用于在各种生物组织上展开研究。一旦我们能够用先进的AI分析诱导性多能干细胞的作用机制,再生医学就可以有效地解锁身体自身的愈合蓝图。
由于这些技术的出现,医学进步和长寿领域的旧有线性模型将不再适用。我们的直觉和对历史的回顾都表明,未来20年的进步将与过去20年大致相似,但这忽略了这一过程的指数性质,即进步的速度将是指数级的,而不是线性的。关于即将实现的彻底延长寿命的知识正在传播,但大多数人,包括医生和患者,仍然没有意识到我们在重新编程过时的生物学的这一巨大转变。
迈向奇点的关键进展
正如本章前面提到的,21世纪30年代将发生另一场健康革命,我与特里·格罗斯曼(Terry Grossman)医生合著的健康方面的作品称之为“通向彻底延长寿命的第三座桥梁:医用纳米机器人”。这一干预措施将大大增强我们的免疫系统。我们天然的免疫系统,包括可以智能地摧毁敌对微生物的T细胞,对许多类型的病原体非常有效。如果没有它,我们活不了多久。然而,它是在食物和资源非常有限、大多数人寿命很短的时代进化而来的。如果早期人类在年轻时繁殖,然后在20多岁时死亡,进化就没有理由偏好那些可能增强免疫系统以帮助人类抵抗出现在生命晚期可能造成威胁的突变,如癌症和神经退行性疾病(通常由错误折叠的朊病毒蛋白引起)。同样,由于许多病毒来自牲畜,在动物驯化之前的人类祖先并没有进化出强大的防御能力。
纳米机器人将被编程为不仅能破坏所有类型的病原体,而且能够治疗代谢性疾病。除了心脏和大脑,我们的主要内脏器官的功能都是将物质输入血液或排出血液,而许多疾病都是由它们的功能失调引起的。例如,1型糖尿病是由胰岛细胞无法产生胰岛素引起的。医用纳米机器人将能够监测血液供应,增加或减少各种物质,包括激素、营养物质、氧气、二氧化碳和毒素,从而增强甚至替代器官的功能。利用这些技术,到21世纪30年代末,我们将能够在很大程度上克服疾病和衰老的过程。
21世纪20年代将出现越来越多由先进AI驱动的引人注目的药物和营养学发现,虽然还不足以完全克服衰老,但足以延长许多人的寿命,让他们活到第三座桥梁出现的时候。因此,到2030年左右,最勤奋、最有见识的人将达到“长寿逃逸速度”。这是一个临界点,自此每过一年,我们的剩余预期寿命就会增加一年。换句话说,我们的寿命将不再流逝,而是开始不断延长。通向根本上延长寿命的第四座桥梁将是备份我们自己的能力,就像我们日常处理所有数字信息一样。当用云端逼真的新皮质模型来增强人类生物学上的新皮质时,我们的思维将成为今天习惯的生物思维和数字扩展的混合体。数字部分将呈指数增长并最终占据主导地位。它将变得足够强大,能够完全理解、建模和模拟生物部分,使我们能够备份所有的思维。当我们在21世纪40年代中期接近奇点时,这种情景将变成现实。
我们的最终目标是将命运掌握在自己手中,而不是听天由命,我们想要活多久就可以活多久。但为什么有人会选择死亡呢?研究表明,选择自杀的人通常是因为承受着难以忍受的身体或情感上的痛苦。虽然医学和神经科学的进步不能完全预防这些情况,但它们可能会使这些情况变得更加罕见。
但如果做好了死亡的准备,我们又会如何死去呢?云端已经有了你的大脑所包含的所有信息的多个备份,这个功能将在21世纪40年代得到极大的增强。销毁自己所有的副本几乎是不可能的。如果我们设计思维备份系统的方式是让个人可以轻松选择删除自己的文件(为了最大限度地提高个人自主权),这在本质上会产生安全风险:一个人可能因为被欺骗或胁迫做出删除的选择,并可能导致系统受到网络攻击的可能性增加。另外,限制人们控制他们最私密的数据的能力又侵犯了一项重要的自由。不过我对此持乐观态度,因为我们可以部署适当的保护措施,就像那些几十年来成功保护核武器的措施一样。
如果你在生物学上死亡后恢复了你的“意识文件”,你真的能“复活”自己吗?正如我在第3章中讨论的那样,这不是一个科学问题,而是一个哲学问题,我们必须在有生之年努力解决这个问题。
有些人对公平和不平等有伦理上的担忧。这些预测面临的一个共同的挑战是,只有富人才能负担得起彻底延长寿命的技术。对此我的回应是,让我们回顾一下手机的发展历史。事实上,就在30年前,你必须很富有才能拥有一部手机,而且那时手机的性能也不尽如人意。今天,有数十亿部手机在世界各地被频繁使用,而且它们的功能远不止于打电话。它们现在是我们的记忆扩展器,利用它可以访问所有的人类知识。这样的技术一开始是昂贵的,功能有限;但当它们完善时,几乎每个人都能负担得起,而原因就在于信息技术固有的性价比的指数级提升规律。
更轻松,更安全,更丰富,更美好
正如我在本章中所论证的那样,与许多流行的假设相反,对地球上绝大多数人来说,生活正在从根本上变得更好。更重要的是,这不是一个巧合。过去两个世纪以来,我们在扫盲和教育、卫生、预期寿命、清洁能源、脱贫、减少暴力、民主等领域取得的巨大进步,都是由同一个潜在动力推动的:信息技术促进了自身的进步。这一洞见是加速回报定律的核心,解释了那些已经戏剧性地改变人类生活的良性循环。信息技术关乎思想,它以指数级增长的方式提高了我们分享和创造思想的能力,从更广泛的意义上来说,它赋予了每个人更大的力量来实现人类的潜力,并让我们可以共同解决社会面临的诸多问题。
指数级发展的信息技术就像不断上涨的潮水,推动着人类生活的方方面面不断向上发展。而我们现在即将进入一个前所未有的高潮时期。关键在于AI,它让我们能将许多种线性发展的技术转化为指数级发展的信息技术,从农业、医疗、制造业到土地利用,无一例外。这种力量将使人类未来的生活以指数级的速度变得更加美好。
人类朝着更轻松、更安全、更丰富的生活的旅程已经持续了数年、数十年、数百年,甚至数千年。我们很难想象哪怕是一个世纪之前的人的生活状态。我们在过去几十年里取得的巨大成就和未来几十年的深刻演变将加速人类文明的进步,使我们朝着这个积极的方向前进,远远超出现在的想象。
第5章 工作的未来:是好还是坏
AI 革命将继续以指数级发生
尽管我们并不清楚内德·卢德(Ned Ludd)是否真实存在,但据传说他曾不小心损坏过纺织厂的机器。此后,任何设备的损坏,无论是出于意外还是为了抗议自动化,都被归咎于卢德。1811年,绝望的织工组成了一支城市游击队,宣布卢德为他们的领袖。这些被称为卢德分子(Luddites)的人奋起反抗工厂主。起初,他们采用暴力毁坏机器,但很快就演变成了流血冲突。最终,这场运动以卢德分子的主要领导人被英国政府逮捕和处决而告终。而内德·卢德的下落至今仍是个谜。
纺织工们眼睁睁地看着自己赖以为生的手艺被彻底颠覆。对他们来说,那些为设计、制造和销售新机器而创造的高薪工作与他们无关。政府没有提供任何培训计划来帮助他们,而他们毕生钻研的技能已经过时。许多人至少要在一段时间内被迫从事薪酬较低的工作。但早期自动化浪潮带来的一个积极结果是,普通人现在可以负担得起一个制作精良的衣柜,而不仅仅是一件衬衫。随着时间的推移,自动化催生了许多全新的行业。由此带来的繁荣是化解最初卢德运动的主要因素。虽然卢德分子已经成为历史,但他们仍然是那些抗议被技术进步抛在后面的人的有力象征。
新工作亟待被创造,旧工作注定要毁灭
展望未来,自动化垂直农业的出现可能会促进农业生产力和效率的又一次巨大飞跃。像英国的Hands Free Hectare这样的公司已经在努力用自动化机械取代农业生产各个环节的人工劳动。随着AI和机器人技术的进步以及可再生能源变得更加便宜,许多农产品的价格最终将大幅下降。当粮食价格受到人力和稀缺自然资源的影响减弱时,贫困将不再是人们获得充足、健康、营养、新鲜的食品的障碍。
这一次会有所不同吗
尽管就业净增长是长期以来的总体趋势,但一些著名经济学家预测,这一次的情况将有所不同。斯坦福大学教授埃里克·布林约尔松(Erik Brynjolfsson)是这一观点的主要支持者之一。他认为,即将到来的基于AI的自动化浪潮将成为就业杀手。与以往由技术驱动的转型不同,最新形式的自动化导致的就业岗位流失将超过其创造的就业岗位。持这一观点的经济学家认为,当前的情况是之前几次技术变革浪潮累积效应的结果。
第一次浪潮通常被称为“去技能化”(Deskilling)。举个例子,驾驶马车的车夫需要掌握各种技能来驾驭和驯养难以捉摸的动物,而驾驶汽车的司机则不需要掌握这些能力。去技能化的主要影响之一是,人们无须经过长期培训就可以从事新工作。过去,工匠需要花费数年时间才能掌握制鞋所需的各种技能,但是当流水线机器取代了大部分人类工作后,工人只需要花更短的时间学会操作机器就能得到一份工作。这意味着劳动力成本下降,鞋子变得更加便宜,但同时也意味着高薪工作被低薪工作取代。
第二次浪潮是“技能提升”(Upskilling)。技能提升通常出现在简单重复性工作被机器取代之后,它引入了比之前需要具备更多技能才可以掌握的技术。例如,为司机提供导航,就需要他们学习如何使用电子设备,而这在以前不属于司机所需掌握的技能。有时这意味着引入在制造业中扮演着越来越重要的角色的机器,但操作这些机器需要具备复杂的技能。例如,早期的制鞋机器是手动操作的压机,工匠不需要接受正式培训就可以操作,而今天像FitMyFoot这样的公司则在使用3D打印设备为每个客户定制完美贴合脚形的鞋子。因此,FitMyFoot的生产不再依赖大量低技能工人,而是依赖少数掌握计算机科学和3D打印机操作技能的人才。这样的趋势往往意味着用数量较少但薪酬较高的岗位来取代低薪岗位。
然而,即将到来的第三次浪潮可以称为“无需技能”(Nonskilling)。例如,无人驾驶汽车的AI系统将完全取代人类司机。随着越来越多的任务落入AI和机器人的能力范围,将会出现一系列无需技能的转变。AI驱动的创新之所以与以前的技术创新不同,是因为它在更大范围内可以替代人类。AI通常可以完全接管任务,对人类技能的需求消失了。这种转变不仅是出于成本原因,还因为在许多领域,AI实际上可以比它所取代的人类做得更好。自动驾驶汽车将比人类驾驶员的操作安全得多,而且AI永远不会醉酒、困倦或分心。
然而,区分任务和职业是很重要的。在某些情况下(不是全部),当某些任务被完全自动化时,相应的工作岗位可以被安排完成另一组不同的任务——实质上是所需技能的要求提升了。例如,自动取款机现在可以在许多常规现金交易中代替银行出纳员,但出纳员在营销和与客户建立个人关系方面发挥了更大的作用。类似地,尽管用于法律研究和文档分析的软件已经取代了律师助理的某些职能,但该职业已经随之做出了改变,现在该职位所承担的任务与几十年前相比有了显著的不同。这种效应可能很快就会在艺术界发生。从2022年开始,DALL-E 2、Midjourney和Stable Diffusion等面向公众开放的系统基于AI根据人类给出的文本提示创建高质量的图形艺术。随着这项技术的进步,现在的平面设计师花在亲自绘制艺术作品上的时间可能会减少,他们可能会花更多时间与客户一起头脑风暴,以及筛选或修改AI生成的作品。
从长远来看,自动化带来的经济利益将推动AI接管越来越多的任务。在其他条件不变的情况下,购买机器或AI软件比支付长期的人工成本要便宜得多。当企业主设计运营流程时,他们通常会在资本和劳动力之间的平衡上保有一定的灵活性。在工资相对较低的地区,采用劳动密集型流程更有意义。在工资较高的地区,企业有更强的动力去创造和设计需要更少劳动力的机器。这可能是为什么英国会成为工业革命的摇篮之一,那里的劳动力工资几乎高于世界上任何地方,而且有丰富、廉价的煤炭资源。这推动了技术创新,用廉价的蒸汽动力取代昂贵的人力劳动。当今的发达经济体中也存在着类似的动态。机器可以作为一次性购买的资产,而员工工资意味着长期的成本支出,而且工人还有一系列其他需求是雇主必须满足的。因此,只要有可能提高自动化程度,企业就有动力这样做。随着AI的技能水平接近人类,不久之后甚至可能超越人类,需要未经强化的人类执行的任务将越来越少。在我们与AI更充分地融合之前,这预示着工人群体将面临重大冲击。
然而,这个论点中有一个令人困惑的生产力难题:如果技术变革真的开始导致净失业,古典经济学预测,在给定的经济产出水平下,人们的工作时长会缩短。那么,根据定义,生产力应该会显著提高。然而,自20世纪90年代互联网革命发生以来,传统上衡量生产力增长的指标显示增速已经放缓。生产力通常用每小时的实际产出来衡量,即生产的商品和服务总量(经通货膨胀水平调整后)除以生产它们的总工作时间。从1950年第一季度到1990年第一季度,美国每小时的实际产出平均每季度增长0.55%。随着个人计算机和互联网在20世纪90年代的普及,生产力增长加速。从1990年第一季度到2003年第一季度,季度平均增长率为0.68%。万维网似乎开启了一个快速增长的新时代,截至2003年,人们普遍预期这一增长速度将持续下去。然而,从2004年开始,生产力增长开始显著放缓。从2003年第一季度到2022年第一季度,季度平均增长率仅为0.36%。这是过去10年来最大的经济谜团之一。随着信息技术在如此多的领域改变商业,我们本应看到更强劲的增长势头。关于我们为什么没有看到这种趋势,学界有着各种各样的理论。
如果自动化真的产生了如此巨大的影响,那么似乎有数万亿美元的经济产出“失踪”了。在我看来,这一观点在经济学家中越来越被接受,很大一部分解释是我们没有将信息产品指数级增长的价值计入GDP,其中许多是免费的,代表了直到最近才出现的价值计算类别。当麻省理工学院在1963年以约310万美元的价格购买我在读本科时使用的IBM 7094计算机时,这在经济活动中相当于310万美元(相当于2023年的3000万美元)。今天的智能手机在计算和通信方面的功能比1965年要强大数十万倍,并且具有当时任何价格都无法购买的无数功能,但它在经济活动中只被计算为几百美元,因为这是你为购买它支付的金额。
埃里克·布林约尔松和风险投资家马克·安德森(Marc Andreessen)也提出了对生产率缺失的一般解释。他们的解释简单明了,即GDP通过一个国家的所有最终商品和服务的价格来衡量经济活动。所以,如果你花2万美元买了一辆新车,那一年的GDP就记为增加了2万美元,即使你愿意为同一辆车支付2.5万或3万美元。这种统计方法在20世纪非常有效,因为在整个人口中,人们对一件商品的平均支付意愿会与其实际价格相当接近。一个主要原因是,当商品和服务是用物质材料和人力生产的时,企业生产每一个新单位都需要花费大量资金。例如,制造一辆汽车需要昂贵的金属零件和熟练劳动力的许多小时工作相结合。这就是边际成本的概念。古典经济学理论认为,价格将趋向于商品的平均边际成本。这是因为企业不能亏本销售,但竞争压力会迫使他们尽可能便宜地卖出。此外,由于更有用和更强大的产品在传统上生产成本更高,所以历史上产品的质量与其反映在GDP中的价格之间存在着密切的关系。
1999年,一个约900美元(经通货膨胀水平调整后)的计算机芯片每美元每秒可以执行超过80万次计算。到2023年初,一个900美元的芯片每美元每秒可以进行近580亿次计算。
问题在于,在GDP的计算中,今天售价为900美元的芯片和20多年前生产的芯片被视为等价的,尽管如今相同价格的芯片性能提高了72000多倍。因此,过去几十年里名义上的财富和收入增长并没有正确反映出新技术所带来的生活方式的巨大改善。这扭曲了人们对经济数据的解读,并产生了一些误导性的观点,例如工资增长明显放缓,甚至停滞不前。即使你过去20年的名义工资没有增长,但你现在用同样的工资购买的计算能力将比过去高数千倍以上。政府机构已经做出了一些努力,在一些经济统计数据中考虑性能的持续提升,但这些数据仍然大大低估了真正的性价比收益。
对于数字产品来说,这种趋势更加明显,因为它们的生产成本几乎为零。一旦亚马逊将一本电子书转码完成并上架销售,销售该书的电子版本几乎不需要任何额外的纸张、油墨或人力成本,因此其售价几乎是边际成本的无限倍。其中,边际成本、价格和消费者支付意愿之间的密切关系就被削弱了。对于那些边际成本足够低,以至于可以完全免费提供给消费者的服务而言,这种关系被完全打破了。一旦谷歌设计出其搜索算法并建立服务器集群,为用户提供额外的单次搜索几乎不需要任何成本。Facebook帮你与1000个朋友保持联系的成本并不比让你只与100个朋友保持联系更多。所以它们向公众提供免费访问服务,并通过广告收入来弥补边际成本。
尽管这些服务对用户来说是免费的,但我们可以通过观察人们的选择来估算他们对这些服务的支付意愿。举个例子,如果你可以通过给邻居修剪草坪赚到20美元,但你选择把时间花在刷TikTok上,那么我们可以说TikTok给你带来的价值至少为20美元。
然而,许多信息技术的实用性已经大大提高,而价格却没有变化。2015年,蒂姆·沃斯托尔(Tim Worstall)在《福布斯》杂志上估计称,Facebook在美国的收入约为80亿美元,这应该是其对美国GDP的官方贡献。但是,如果把人们花在Facebook上的时间价值按照最低工资标准计算,那么消费者从中获得的实际收益约为2300亿美元。截至2020年(本书付印时可获得的最近一年的数据),美国使用社交媒体的成年人平均每天会花35分钟在Facebook上。美国大约有2.58亿成年人,其中约72%的人使用社交媒体,按照沃斯托尔的估算方法,这意味着Facebook在2020年创造了2870亿美元的经济价值。2019年的一项全球调查发现,美国互联网用户平均每天花费2小时3分钟浏览各类社交媒体,虽然这给GDP贡献了约361亿美元的广告收入,但据此推算,社交媒体给用户带来的总收益每年超过1万亿美元!
用最低工资来衡量社交媒体的使用价值并非一个完美的指标,因为在某些情况下,比如排队买咖啡的时候浏览Facebook,要比利用这几分钟做远程自由职业工作更符合实际。但作为一个总体近似值,它揭示了人们使用社交媒体的巨大价值,但经济学家可以观察到的收入只占其价值的一小部分。维基百科是一个更极端的例子:它对GDP的官方贡献基本为零。同样的分析也适用于无数基于网络和应用程序提供的服务。
这表明,随着数字技术在经济中占据越来越大的份额,消费者剩余的增长速度比GDP反映的要快得多。因此,就消费者剩余而言,生产率一直在以比传统的每小时产出指标更快的速度增长。由于消费者剩余这个指标能比价格更真实反映繁荣程度,人们可以说,我们真正关心的那种生产率一直增长良好。
这些影响远远超出了与技术显著相关的领域。技术变革带来了无数没有体现在GDP中的好处,包括减少污染、更安全的生活环境以及更多的学习和娱乐的机会等。不过,这些变化并没有均衡地影响经济的所有领域。例如,尽管计算机价格急剧下降,但医疗保健服务的价格上涨速度却比整体通胀还要快。因此,对于需要大量医疗服务的人来说,他们可能不会因为GPU的计算性价比越来越高而感到宽慰。
迈向奇点的关键进展
好消息是,在21世纪20年代和21世纪30年代,AI和技术融合将使越来越多的商品和服务转变为信息技术,它们也能从数字领域已经出现的指数级增长趋势中获益,这种趋势已经给数字领域带来了巨大的通货紧缩。先进的AI导师可以帮助我们在任何主题上进行个性化定制学习,任何可以接入互联网的人都可以广泛访问学习资源。在撰写本书时,AI驱动的增强医学和药物发现仍处于起步阶段,但最终将在降低医疗保健服务成本方面发挥重要作用。
许多传统上不被视为与信息技术相关的其他产品,例如食品、住房和建筑施工,以及其他实物产品,如服装,也将出现类似的变化。例如,AI驱动的材料科学进步将使太阳能光伏发电的成本变得极其低廉,而利用机器人开采资源和自动驾驶电动汽车将大大降低原材料的成本。随着能源和材料成本的降低,以及自动化逐渐完全取代人力劳动,产品或服务价格将大幅下降。随着时间的推移,这种效应将覆盖大部分经济领域,我们将能够消除目前阻碍人们发展的大部分资源的稀缺性。因此,在21世纪30年代,人们将能够以相对低廉的成本过上今天被认为是奢侈的生活。
如果这个分析是正确的,那么在所有这些领域,由技术带来的通货紧缩只会扩大名义生产力(即按当前价格计算的生产力)和人类每小时的工作为社会带来的实际平均效益之间的差距。随着这种影响从数字领域扩展到其他行业,并涵盖整个经济活动更广泛的部分,我们预计全美通胀率会下降,并最终导致整体通货紧缩。换句话说,随着时间的推移,我们可以期待人们将会对“生产力之谜”给出更清晰的解释。
……
然而,所有这些分析都受到一个事实的限制,即劳动参与率这一概念本身的缺陷越来越明显。有两大趋势正在重塑工作的性质,但经济统计数据并没有很好地反映这一点。
第一个趋势是地下经济的存在,它一直都存在,但互联网极大地促进了其发展。地下经济涵盖多种类型的服务,包括付现金的家政服务、替代性治疗方式等。促进地下经济发展的另一个因素是加密技术(如加密货币)的出现,这使得交易可以隐藏在税收、监管和执法部门的监管范围外。
规模最大和最知名的加密货币是比特币。2017年8月6日,比特币在主要交易所的日交易量不到1930万美元。到同年12月7日,比特币日交易量曾飙升至49.5亿美元以上,但很快又下跌。截至2023年中,比特币日均交易量仍在1.8亿美元左右。尽管如此,比特币的交易量仍然增长非常迅速,但与主要的传统货币相比,其规模仍然很小。根据国际清算银行的数据,2022年4月全球外汇日均交易量为7.5万亿美元,而在本书下印时,这一数字可能会更高。
此外,与大多数传统货币相比,大多数加密货币的价值一直非常不稳定。例如,2012年1月4日,比特币的交易价格为13.43美元。4月2日,比特币的交易价格上涨到130美元以上。但是对加密货币感兴趣的仍然主要是一些小范围的技术爱好者。然后,在经历了近5年的相对平静和稳定期之后,比特币在2017年开始飙升到更高的价位。突然之间,普通人听说比特币是一种稳赚不赔的投资,纷纷买入,以期望它们会进一步升值。这形成了一个正向反馈循环,4月29日一枚比特币的价格达到1354美元,12月17日达到18877美元。但随后价格开始下跌,人们在恐慌中抛售他们的比特币,试图在资产进一步贬值之前退出市场。到2018年12月12日,比特币重新回落到3360美元。2021年4月13日,比特币的交易价格达到64899美元,然后在2022年11月20日另一次大崩盘时降至15460美元。
这种波动性对于想要把比特币作为一种货币,即将其作为定期交换商品和服务的媒介的人来说是一个主要问题。如果你相信你手里的美元在半年内会升值10倍,你会尽量不去花它们。反之,如果你手里的美元可能在几个月内贬值近一半,你会不愿意将大部分资产以美元的形式持有,商家也不愿意接受它们作为支付手段。如果加密货币想要被公众更广泛地采用,它们需要找到一种方法使其价值保持稳定。
不过,地下经济的蓬勃发展并不一定需要依赖加密货币。社交媒体和Craigslist等平台为人们建立经济联系提供了大量机会,而政府基本上看不见这种经济联系。
这种影响也促进了第二个主要趋势:新的赚钱方式并不总是被视为传统的就业方式,其中包括使用网站和应用程序创建、购买、销售和交换物理、数字资产与服务,以及在社交媒体上创建应用程序、视频和其他形式的数字内容。
例如,有些人在为YouTube创建内容方面取得了成功,或者受雇在Instagram或TikTok上影响他人。在2007年iPhone发布之前,没有应用经济可言。2008年仅出现了不到10万个iOS应用;到2017年,这一数字飙升至450万左右。安卓平台上的增长也同样惊人。2009年12月,谷歌Play Store中约有1.6万款手机应用,而到2023年3月,这一数字已增至260万款,13年来增长了160多倍。这直接导致了就业增长。从2007年到2012年,应用经济在美国创造了大约50万个就业岗位。根据德勤的数据,到2018年,这一数字已增长到500多万。
2020年的另一项研究估计,包括应用经济间接创造的就业机会在内,美国将有590万个就业机会和1.7万亿美元的经济活动。这些数字在一定程度上取决于人们对应用市场的定义有多宽泛或多狭窄,但关键的结论是,在短短十多年的时间里,手机应用已经从微不足道的东西发展成为更广泛经济活动中的一个主要因素。因此,即使技术变革消除了很多工作岗位,与此同时,技术也在传统的工作模式之外开辟了许多新的机会。尽管它并非没有局限性,但所谓的零工经济通常比以前的选择给予了人们更多的灵活性、自主权和闲暇时间。随着自动化趋势的加速和对传统工作场所的冲击,最大限度地提高这些机会的质量成了帮助工人的一种策略。
那么,我们将走向何方
乍一看,美国劳动力的现状听起来令人担忧。牛津大学的学者弗莱和奥斯本估计,到2033年,2013年存在的工作中将有近一半可以实现自动化,他们的研究假设的AI和其他指数级技术的进步速度比我在本书中概述的更保守。虽然200多年前人们已经认识到自动化对工作的威胁,但当前的情况在速度和广度上是前所未见的。
要预测未来将如何发展,我们需要考虑几个根本问题。就业本身不是目的,而是达到目的的手段。工作的一个目标是满足生活的物质需求。如前所述,两个世纪前,仅种植和分配食物就需要付出几乎所有的人力劳动,而如今在美国和大部分发达国家,食品生产所需的劳动力只需要劳动力总数的不到2%。随着AI在无数领域释放前所未有的潜力,为满足温饱而奋斗的日子将逐渐淡出历史。
工作的另一个目标是赋予生活目的和意义。如果你的工作是砌砖,那么这种劳动提供了两重意义。首先,也最明显的是,你的工资使你能够供养和照顾你所爱的人——这是身份认同的一个重要方面。其次,你同时也是在建造永久性的建筑,为公共利益做出贡献。你实际上是在为比自己更远大的事物做贡献。一些令人满意的工作,如艺术和学术领域的工作,除了工资和公共利益之外,还提供了创造和产生新知识的机会。
即将到来的革命将赋予人类前所未有的能力,使他们能够做出远超以往的贡献。事实上,不断进步的信息技术已经在以一种未受重视的方式增强艺术家的多种文化创造能力。例如,在我的成长过程中只有三家电视台可以收看:ABC、NBC和CBS。由于每个人都在观看如此有限的节目,电视网不得不创造出能吸引尽可能广泛的人群的内容。为了获得成功,电视节目必须成功吸引男性和女性、儿童和父母、蓝领和白领。像荒诞喜剧、超自然戏剧或科幻小说这样具有强烈吸引力但受众较窄的创意,很难找到一条可靠的商业化道路。许多人现在已经忘记了,史上最具影响力的科幻系列剧集《星际迷航》(Star Trek),当初仅播出三季就被取消了。
但有线电视的普及拓宽了电视节目的受众,以至于针对小众市场的节目也能找到观众。探索频道、历史频道、学习频道等关于非寻常主题的深度纪录片也得到了认可。不过,电视节目收视率仍然受到播出时间的限制。硬盘录像机的引入以及后来点播流媒体的出现,让人们可以随时随地观看他们想看的任何内容。这意味着创新的新节目可以从所有人中吸引观众,而不仅仅局限于在特定时段碰巧收看电视的人。因此,一些在我年轻时的电视网络上被认为无法实现的艺术创意,如《怪奇物语》(Stranger Things)和《伦敦生活》(Fleabag),现在找到了忠实的观众,收获了评论界的赞誉。这一趋势对LGBTQ人群、残障人士等相对较小的群体来说是个好消息,因为正面描绘他们特定生活经历的节目有了更大的机会在商业上取得成功。
此外,流媒体给创作者提供了更多不同的创作选择。例如,在广播电视上,半小时的喜剧节目通常情节是非连续性的,因为电视网希望观众能够以任何顺序观看这些节目并沉浸其中。但是点播意味着观众总是可以按照一定的顺序观看。这让像《马男波杰克》(BoJack Horseman)这样的开创性节目制作了一集又一集,并在这种连续性中累积笑料,达成表达。这些艺术形式在以前的广播技术中根本不可能实现。
在接下来的20年里,这种转变将大大加速。想想AI在过去几年里通过DALL-E、Midjourney和Stable Diffusion等系统在视觉图像方面取得的创造性成就。这些功能将变得更加复杂,并扩展到音乐、视频和游戏领域,从根本上使创造性表达民主化。人们将能够向AI描述他们的想法,并用自然语言调整结果,直到它实现他们脑海中的愿景。制作一部动作电影将不再需要成千上万人的努力和数亿美元的投资,最终还有可能制作出一部史诗级的电影,只需要好的创意和相对适度的算力预算来运行AI。
然而,尽管这些畅想即将变成现实,我们也必须从现实层面看待从现在到那时将会发生的破坏性影响。自动化及其间接影响已经消除了位于技能阶梯底部和中部的许多工作,而且这一趋势将在未来10年内扩大并加快速度。大多数新工作都需要更复杂的技能。总的来说,人类社会在技能阶梯上进步了,而且这种趋势还将持续下去。但是,随着AI在一个又一个领域超越普通人,甚至是拥有最娴熟的技能的人,人类如何跟上这一步伐?
迈向奇点的关键进展
在过去的两个世纪里,人类提高技能的主要方法是接受教育。正如我之前描述的那样,美国在教育上的投资在过去的一个世纪里飞速增长。但是我们已经进入了自我提升的下一个阶段,那就是通过与我们正在创造的智能技术相融合来增强自身的能力。我们现在还没有把计算机化的设备植入我们的身体和大脑,但它们实际上已经近在咫尺。如今,如果没有大脑扩展器——智能手机,几乎没有人能完成他们的工作或接受教育,智能手机可以访问几乎所有的人类知识,或者只需点击一下就能利用其强大的计算能力。因此,可以毫不夸张地说,电子设备已经成为我们身体的一部分。就在20年前,情况还不是这样。
在整个21世纪20年代,这些功能将与我们的生活更加紧密地融合在一起。搜索将从熟悉的文本字符串和链接页面的范式转变为无缝衔接、直观易用的问答模式。任何语言之间的双向实时翻译将变得流畅、准确,打破人与人之间的语言隔阂。增强现实将通过我们的框架眼镜和隐形眼镜不断地投射到我们的视网膜上,同时它也会在我们的耳朵里产生共鸣,并最终调动我们其他的感官。我们不需要明确地发出指令或请求,它的大部分功能和信息就能自动激发和呈现,因为AI助手会通过观察和“倾听”我们的活动来预测我们的需求。在21世纪30年代,医疗纳米机器人将开始把这些通过外部设备实现的大脑扩展功能直接整合到我们的神经系统中。
在第2章中,我描述了这项技术将如何把我们的新皮质扩展到云端,扩大容量,实现更多的抽象层次。这项技术的价格最终将变得非常低廉,人人都能使用,就像移动电话最初非常昂贵且功能有限,但如今已无处不在,而且性能还在迅速提高。国际电信联盟估计,截至2020年,全球有58亿部智能手机正在使用中。
但是,在通往这种普遍富足的未来的过程中,我们需要解决由这些转变所引起的社会问题。随着20世纪30年代《社会保障法》通过,美国的社会安全网开始建立起来。尽管特定的表述在政治上有出入(例如“福利”),但总体而言,无论特定政党和政府的政治倾向如何,社会安全网一直在不断扩大。
与福利制度较为完善、水平较高的欧洲国家相比,美国的社会安全网被认为不够完善,但事实上其社会福利公共支出所占GDP的比例——2019年(在新冠疫情之前)预计为18.7%,接近发达国家的中位数水平。加拿大的比例略低,为18.0%。澳大利亚和瑞士相近,均为16.7%。英国略高,为20.6%,相当于其2.8万亿美元GDP中的约5800亿美元,或者说在6600万人口中人均不到8800美元(见图5-7)。但由于美国的人均GDP更高,因此其人均支出也相应更高。2019年,美国GDP超过21.4万亿美元,其中约有4万亿美元用于社会公共支出(见图5-8)。以当年人口约3.3亿计算,人均支出超过12000美元。
……
在温哥华举行的2018年TED大会上,我在与TED策展人克里斯·安德森(Chris Anderson)的台上对话中预测,到21世纪30年代初,发达国家将有效实行全民基本收入制度或与之相当的制度,到21世纪30年代末,大多数国家也将实现这一目标。届时,人们将能够靠这笔收入过上按照今天的标准衡量非常不错的生活。这将涉及定期向所有成年人支付现金,或提供免费商品和服务。资金可能来自对自动化驱动的利润征税和政府对新兴技术的投资。相关项目可能为照顾家人或建设健康社区的人们提供经济支持。这样的改革可以大大缓解失业和就业中断带来的危害。在评估这种进步的可能性时,我们必须考虑到那时经济将发生多么深刻的变革。
随着技术变革的加速发展,社会总体财富大大增加,考虑到社会安全网所需的长期稳定性,无论执政党是哪一方,它都很可能会继续存在,而且水平将大大高于今天。但请记住,技术的丰富并不会自动地立即使每个人受益。例如,2022年的1美元可以购买的计算能力是2000年的50000多倍(经通货膨胀水平调整后)。相比之下,根据官方统计数据,2022年的1美元只能购买2000年医疗保健服务的约81%(经通货膨胀水平调整后)。尽管一些医疗手段,如癌症免疫疗法,在效果上有所改善,但大多数医疗保健支出,如住院和X射线检查,基本没有变化。因此,那些在计算机上花费大量资金的人,如学生和年轻人,从计算机价格下降中获益颇丰。与此同时,那些将大部分收入用于医疗保健的人,如老年人和慢性病患者,总体上的境况可能更加糟糕。
因此,我们需要制定明智的政策,以平缓地完成这一过渡,并确保繁荣成果能够广泛共享。虽然从技术和经济角度来看,每个人都有可能享受到以现在的标准来衡量的高生活水平,但我们是否可以真正向每一个需要帮助的人提供这种支持,将取决于政治决策。相比之下,虽然当今世界偶尔会发生饥荒,但这并不是因为粮食产能不足,也不是因为发展优质农业的秘诀掌握在少数精英手中。相反,饥荒通常是由于治理不善或内战造成的。在这些情况下,人们更难以应对当地的干旱和其他自然灾害,国际援助也更难发挥作用。同样,如社会整体不够谨慎,不良的政治环境就可能对人们生活水平的提高造成阻碍。
正如新冠疫情显示的那样,这在医学领域是一个需要迫切关注的问题。尽管创新将释放出变革性的能力,来提供经济实惠和有效的治疗方法,但这并不能保证产生神奇的结果。我们将需要公众的参与和明智的治理,来实现安全、公平和有序的过渡,以获得更先进的医疗保健服务。例如,人们可以想象这样一个未来,拯救生命的技术普遍难以取得人们的信任。就像今天在网上盛传的关于疫苗的错误信息和阴谋论一样,人们可能会在未来几十年里散布类似的关于决策支持AI、基因治疗或医疗纳米技术的谣言。考虑到对网络安全的合理担忧,不难想象,被夸大的对秘密基因的操纵或政府控制的纳米机器人的恐惧,可能会导致21世纪30年代或50年代的人们拒绝接受关键的治疗。公众对这些问题的科学理解是避免出现非必要的伤亡的最佳办法。
如果我们能正确应对这些政治挑战,人类的生活将彻底改变。历史上,我们不得不为满足生活的物质需求而竞争。但是,当我们进入一个富足的时代,物质必需品的供应不再稀缺,而许多传统工作岗位消失时,我们的主要斗争将是为了目标和意义。实际上,我们正在向马斯洛需求层次的上层移动。这在现在面临职业选择的一代人身上表现得尤为明显。我与8~20岁的年轻人交谈并为他们提供指导,他们的关注点通常是开辟一条有意义的道路,无论是通过艺术追求创造性表达,还是帮助克服人类长期以来一直在努力应对的巨大挑战,包括社会、心理和其他方面的挑战。
思考工作在我们生活中扮演的角色,迫使我们重新审视对生命意义的更广泛的追求。人们常说,短暂的生命和死亡赋予了生命意义。但在我看来,这种观点只是试图把死亡的悲剧合理化为一件好事。现实是,亲人的离世实际上夺走了我们的一部分自我。那些原本用于与亲人互动交流、享受陪伴的新皮质区域,现在只剩下失落、空虚和痛苦。死亡夺走了所有在我看来可以赋予生命意义的事物——技能、经历、记忆和人际关系。它阻碍了我们享受更多能够定义自我的卓越时刻,例如创作和欣赏创造性作品、表达爱意、分享幽默等。
当我们将新皮质扩展到云端时,所有这些能力都将得到极大的增强。试想一下,如果我们试图向那些错过了200万年前因额叶增大而带来的新皮质进化的灵长类动物解释音乐、文学、YouTube视频或笑话,会是什么情景?这个类比让我们能够想象一下,当我们在21世纪30年代的某个时候开始以数字方式增强大脑皮层时,我们将能够创造出现在无法想象或理解的有意义的表达方式。
但仍然存在一个关键问题:在此期间会发生什么?在我与丹尼尔·卡尼曼的一次私人对话中,他对我的观点表示了认同,即信息技术在性价比和容量方面一直在并将继续以指数级速度增长,这最终将涵盖服装和食品等实物产品。他对我所说的观点也表示了同意,即我们正朝着一个物质丰富、能满足我们物质需求的时代迈进,而届时主要的挑战将是满足马斯洛需求层次理论中更高层次的需求。然而,他也预测称,在此期间将会发生一段旷日持久的冲突,甚至是暴力。他指出,随着自动化的影响持续扩大,必然会出现赢家和输家。一个失业的司机不会因为人类整体有望满足更高层次需求的承诺而感到满意,因为作为个人,他可能无法完成这种转变。
适应技术变革的一大挑战在于,它们往往会给广大的群体带来分散的利益,但给小部分群体带来集中的危害。例如,自动驾驶汽车(无人驾驶汽车)将给社会带来巨大的好处,比如挽救生命、减少污染、缓解拥堵、节省时间和降低交通成本。预计到2050年,美国人口将接近4亿,他们将在不同程度上共享这些进步。根据采用假设的不同,潜在总收益的估计值在每年6420亿到70000亿美元。可以说,这是一个天文数字。然而,每个人所享有的好处不太可能彻底改变他们的生活。并且,尽管从统计数据上看,我们知道每年有数万人的生命被挽救,但我们无法具体确定每年究竟是哪些人死里逃生。
相比之下,自动驾驶汽车的危害主要涉及的是那几百万以驾驶为生的人,他们将失去生计。这些人是明确的特定群体,他们的生活遭到变故的可能性相当大。当某人处于这种境地时,仅仅知道整体社会利益大于他们个人的痛苦是不够的。我们需要制定政策来帮助减轻他们的经济困难,并帮助他们平缓地过渡到其他能提供意义、尊严和经济保障的事情上。
与卡尼曼的担忧相符的一个现象是,正如我之前讨论的,大众的恐惧通常远比现实要糟糕得多。当你感觉社会中的一切都在变得更糟时,失业无疑会让你确信确实如此。卡尼曼和我都认为,我们今天在政治中看到的许多两极分化现象是自动化的产物,无论是实际的还是预期的,而不是来自移民等传统政治问题。如果你对自己的经济稳定性极度焦虑,你可能会对任何看起来可能导致你的处境恶化的事情抱有敌意。
然而,历史表明,人类社会比我们预期的更善于适应变化,即使是剧烈的变化。在过去的两个世纪里,我们已经多次用自动化设备取代了大部分的工作岗位。尽管如此,我们并没有遇到过太多长期的社会混乱,更不用说暴力革命了。大众传播和执法在防止或迅速镇压暴力方面非常有效,就像两个世纪前镇压卢德分子那样。诚然,个人可能因各种原因而变得暴力,包括精神疾病。鉴于美国的枪支文化,这种情况往往会演变成致命的悲剧。
但那些引人注目的悲剧性事件并不能改变这一事实:几个世纪以来,人类社会的总体暴力程度一直在快速下降。正如在前一章中讨论的那样,尽管不同国家的暴力程度可能每年和每10年都会有所波动,但发达国家的长期趋势是快速和持续的降低。正如我的朋友史蒂芬·平克在他2011年的著作《人性中的善良天使》中所说,这种下降是深层文明趋势的结果,例如国家的法治化程度提高、文化水平的提高和经济发展等因素。值得注意的是,所有这些因素将因为信息技术的指数级进步得到强化。因此,我们有充分的理由对未来保持乐观。
我们应该记住,伴随着自动化导致的失业的负面影响,新的创新机会也随之而来,这一点不会改变。而且,美国的社会安全网正在不断完善和扩大,正如我指出的那样,它受到政治气候的影响不会太大。它有着超越表面舆论波动的深厚支持。这些社会安全网不仅体现了我们对同胞天然的同理心,同时也是一种政治回应,旨在缓和技术变革带来的社会冲击。
但是社会安全网并不能取代工作赋予人们的目标感,正如卡尼曼所说,劳动力市场将会有许多失败者。虽然美国在没有引发严重社会动荡的情况下经历了几次自动化浪潮,但这一次变革的广度、深度和速度都与之前几次有所不同。卡尼曼认为,人们需要时间来适应变化并抓住新的机会,许多人将无法快速地接受再培训以适应新型就业岗位或其他个人创业机会。
我认为卡尼曼在某些方面是对的,但我们应该记住,在许多技术变革领域,失败者并不存在,或者至少人们不会知道自己是输家。以一种新的疾病治疗方法的普及为例。尽管从治疗该疾病中获利的公司和个人将失去长期的收入来源,但这种治疗方法给社会带来的益处如此巨大,以至于它几乎得到了普遍的赞誉,包括大多数接受过这种治疗的人。他们亲身了解过痛苦缓解的过程,而不会沉湎于失去的工作。无论如何,社会会认识到,与其为了就业和利润而阻止采用这种治疗方法,不如设法减轻对这些人形成的经济冲击。
在整个长达200年的自动化历史中,许多人都曾想象,在一个没有变化的世界里,工作会消失。这种现象也适用于预测未来的各个方面——他们只会设想一种变化,就好像其他事情都不会有所不同。但现实情况是,每种类型的失业都会带来许多积极的变化,而这些积极变化到来的速度将与破坏性变化一样快。
人们实际上适应变化的速度非常快,尤其是向着好的方面的变化。在20世纪80年代末,当互联网还主要服务于大学和政府时,我预测,到20世纪90年代末,一个用于通信和共享信息的庞大全球网络最终将为所有人所用,甚至是小学生。我还预测,到21世纪初,人们将使用移动设备来驾驭这个网络。当时,这些预测看起来令人生畏、具有破坏性,甚至不太可能实现。但它们最终成了现实,这些技术被非常迅速地接受和采用。例如,整个应用经济在15年前几乎不存在,但现在它已经根深蒂固,以至于人们几乎不记得它不存在的时候是什么样子。
相关影响不仅仅局限于经济领域。斯坦福大学的一项研究发现,2017年,美国大约39%的异性恋情侣是在网上相识的,其中很多是通过Tinder和Hinge等移动应用程序认识的。这意味着,现在小学里的许多孩子之所以出生,仅仅是因为一项比他们年龄大不了几岁的技术。当你回过头来审视这些变化时,应用程序影响社会的速度之快,真是令人惊叹。
人们常常想象未经增强的人类与机器竞争的景象,但这是一个误解。想象一个人类在很大程度上要与AI驱动的机器竞争的世界,是一种错误的思考未来的方式。为了说明这一点,你想象一下一个带着2024年的智能手机的时间旅行者回到了1924年。这个人的智力在卡尔文·柯立芝(Calvin Coolidge)时代的人看来简直就是超人。他们可以毫不费力地做高等数学题,可以很好地翻译任何主要语言,下棋比任何国际象棋大师都厉害,并且掌握了相当于整个维基百科的知识量。对1924年的人来说,手机从根本上增强了时间旅行者的能力,这似乎是不言而喻的。但对于生活在2020年的人来说,我们很容易忽略这种视角。我们并不觉得自己的能力得到了增强。同样,我们将利用2030年和2040年的技术进步,无缝地提升自己的能力。随着我们的大脑直接与计算机连接,在感觉上,这种提升将更加自然。在应对未来丰富多样的认知挑战时,在大多数情况下,我们不会与AI竞争,就像我们现在与智能手机的关系一样。人机共生关系并不新鲜:自从石器时代以来,技术的目的就是在身体和智力层面扩展人类的能力。
话虽如此,我确实认为,在过渡期间,对可能产生的令人困扰的社会动荡(包括暴力),我们应该有所准备并努力化解。但我预计,鉴于我所讨论的那些将稳定增长的强大且长期的趋势,不太可能发生暴力过渡。
对于即将到来的社会转型持乐观态度的最重要原因是,日益增长的物质财富将降低暴力的诱因。当人们缺乏基本的生活必需品,或者犯罪率已经很高时,人们可能会觉得付诸暴力也没有什么可失去的。但是,导致社会混乱的技术也将使食品、住房、交通和医疗保健变得更加便宜。而且,通过更好的教育、更明智的治安管理方法以及减少像铅这样毒害人脑的环境毒素的综合作用,犯罪率可能会持续下降。当人们觉得他们未来可以过上更长久、安全的生活时,他们会更倾向于通过政治手段来消除分歧,而不是冒着失去一切的风险诉诸武力。
卡尼曼和我推测,我们对即将到来的转型性质的不同看法可能受到我们截然不同的童年经历的影响。为了逃离纳粹的迫害和家人,他在性格形成期生活在法国。而我出生在第二次世界大战后相对安全的纽约市,尽管作为“战后一代”中的一员,我还是受到了大屠杀的影响。因此,卡尼曼生活在第一次世界大战之后的欧洲,亲身经历了非同寻常的冲突、动荡和仇恨。
要精心策划可持续的、建设性的过渡方案,需要开明的政治战略和政策决定。由于政策和社会组织仍然是其中的关键因素,政治家和公民领袖将继续发挥重要作用。这种技术进步所蕴含的机遇是巨大的,不亚于克服人类长期以来所受的任何苦难。
第6章 未来 30 年的健康和幸福: 从与 AI 融合到完全突破生理局限
21世纪20年代: 与生物技术的结合 AI
当你把汽车送到修理店维修时,技师对其零部件及其工作原理了然于胸。汽车工程学实质上是一门精确的科学。因此,得到精心维护的汽车几乎可以无限期使用下去,即使是损毁最严重的汽车在技术上也有修复的可能。但人体却并非如此。在过去200年里,尽管现代医学取得了许多令人惊叹的进步,但医学仍未成为一门精确的科学。医生仍然在做许多已知有效却并不完全理解其工作原理的事情。很多医学知识建立在粗略的近似的基础之上,这些近似对大多数患者而言通常是有效的,但可能并不适合你。
要让医学成为一门精确的科学,需要将其转变为一种信息技术,使其能够从信息技术的指数级进步中获益。这一深刻的范式转变目前正在稳步进行,它涉及将生物技术与AI和数字模拟相结合。正如我将在本章中所讲的,我们已经看到了直接的收益,涉及药物发现、疾病监测和机器人手术等多个方面。例如,在2023年,第一种采用AI端到端设计的药物进入了Ⅱ期临床试验,用于治疗一种罕见的肺部疾病。但AI与生物技术融合最根本的好处最为显著。
在过去,医学完全依赖于艰苦的实验室实验和人类医生将专业知识传授给下一代,医学新进展是缓慢而线性的研究过程的结果。但是,AI可以从比人类医生掌握多得多的数据中学习,并且可以从数十亿次医疗手术中积累经验,而不是像人类医生一样,在整个职业生涯中最多只能做数千台手术。
此外,由于AI受益于其以指数级速度改进的底层硬件,随着AI在医学领域发挥越来越重要的作用,医疗保健行业也将获得指数级的收益。通过使用这些工具,我们已经开始通过数字方式搜索每一个可能的方案,并在几小时内而不是几年内找到生物化学问题的解决方案。
目前,最重要的一类问题可能是为新出现的病毒威胁设计治疗方法。这个挑战就像从一堆足以填满游泳池的钥匙中找出能够打开特定病毒“化学锁”的那一把钥匙。人类研究员利用自身知识和认知技能也许可以确定几十种可用于治疗该疾病的分子,但实际上可能相关的分子数量通常在万亿级别。在对这些分子进行筛选时,大多数显然是不合适的,不值得进行完整的模拟,但仍有数十亿种可能性需要进行更强大的计算检查。据估计,在极端情况下,物理上可能存在的潜在药物分子包含大约1060种可能性!无论确切的数字是多少,AI现在可以让科学家对浩瀚的分子海洋进行分类,以专注于那些最有可能适配特定病毒的“钥匙”。
想想这种穷举搜索方法的优势吧。在我们当前的研发模式下,一旦有了一种潜在可行的治疗药物,我们就可以组织几十个或几百个人类受试者,然后在数月或数年的时间内花费数千万或数亿美元成本对他们进行临床试验。然而,很多时候,这第一个选择并不是理想的治疗方法,因为它需要探索其他替代方案,而这些替代方案也需要几年的时间来测试。在这些结果出来之前,人们很难取得更多的进展。美国的监管程序涉及三个主要的临床试验阶段,根据麻省理工学院最近的一项研究,只有13.8%的候选药物能够通过美国食品和药物管理局的批准。最终,将一种新药推向市场通常需要10年的时间,平均成本估计在13亿~26亿美元。
在过去几年中,医学研究在AI辅助下取得突破的速度明显加快。2019年,澳大利亚弗林德斯大学的研究人员利用生物模拟器发现了激活人体免疫系统的物质,创造了一种“涡轮增压”流感疫苗。该模拟器以数字方式生成了数万亿种化学物质,研究人员为了寻找理想的配方,使用了另一个模拟器来确定每一种物质是否可以作为增强免疫力的药物来对抗病毒。
2020年,麻省理工学院的一个团队利用AI开发出一种强大的抗生素,可以杀死一些现存最危险的耐药性细菌。它不是仅评估几种类型的抗生素,而是在短短几个小时内分析了1.07亿种抗生素,并选出了23种潜在的候选药物,其中有两种似乎是最有效的。匹兹堡大学药物设计研究员雅各布·杜兰特(Jacob Durrant)表示:“这项工作真的很了不起。这种方法凸显了计算机辅助药物发现的力量。要对超过1亿种化合物进行抗菌活性的物理测试是不可能的。”之后,麻省理工学院的研究人员开始应用这种方法从头设计有效的新型抗生素。
但到目前为止,2020年AI在医学领域最重要的应用是在创纪录的时间内设计出安全有效的新冠病毒疫苗。2020年1月12日,中国分享了该病毒的基因序列。莫德纳公司(Moderna)的科学家开始使用强大的机器学习工具分析哪种疫苗最有效,仅仅两天后,他们就创建了mRNA疫苗的序列。2月7日,第一批临床试验疫苗生产出来,经过初步测试后,于2月24日发送到美国国家卫生研究院。3月16日,也就是序列选定后的第63天,第一剂疫苗被注射进试验受试者体内。在新冠疫情之前,疫苗的开发通常需要5~10年的时间。在如此短的时间内取得这一突破性进展,无疑挽救了数百万人的生命。
然而,这场战斗尚未结束。2021年,在新冠病毒变种的威胁下,南加州大学的研究人员开发了一种创新的AI工具,以加速开发可能需要的疫苗,因为病毒还会继续变异。通过模拟,候选疫苗可以在不到一分钟的时间内设计出来,并在一小时内完成数字验证。当你读到这篇文章时,可能已经有了更加先进的方法。
我所描述的所有应用都是生物学中一个更基本的挑战的实例:预测蛋白质如何折叠。我们基因组中的DNA指令负责产生氨基酸序列,氨基酸序列折叠成一个蛋白质,其三维特征在很大程度上决定了蛋白质的实际工作方式。我们的身体主要由蛋白质构成,因此了解蛋白质的组成和功能之间的关系是开发新药与治疗疾病的关键。
遗憾的是,人类在预测蛋白质的折叠方面的准确率一直不高,因为其所涉及的复杂性无法用任何简单易懂的规则来概括。因此,新发现仍然依赖于运气和艰苦的努力,而最佳解决方案仍未被发现。这一直是实现新药突破的主要障碍之一。
AI强大的模式识别能力在这方面提供了巨大的优势。2018年,Alphabet旗下的DeepMind创建了一个名为AlphaFold的程序,旨在与领先的蛋白质折叠预测方法展开竞争,包括人类科学家和早期的软件驱动方法。DeepMind没有采用惯用的方法,即从现有的蛋白质结构目录中提取模型。与AlphaGo Zero类似,它摒弃了已有的人类知识。AlphaFold在98个竞争程序中脱颖而出,在43种蛋白质中准确预测了25种,而排名第二的竞争者只预测对了3种。
然而,AI预测的准确性仍不如实验室实验,因此DeepMind重新设计了算法,并融入了Transformers(驱动GPT-3的深度学习技术)。2021年,DeepMind公开发布了AlphaFold 2,取得了真正惊人的突破。该AI现在几乎能够对任何给定的蛋白质的结构进行预测,准确性接近实验水平。这一突破迅速将生物学家可用的蛋白质结构数量从18万个扩展到数亿个,并将很快达到数十亿个。这将大大加速生物医学发现的步伐。
迈向奇点的关键进展
目前,AI药物发现仍是一个由人类引导的过程。科学家必须识别和确定他们试图解决的问题,用化学术语表述问题,并设置模拟的参数。不过,在未来几十年,AI将获得更有创造性地搜索的能力。例如,它可能会发现临床医生没有注意到的问题,例如患有某种特定疾病的特定人群对标准治疗反应不佳,并提出复杂和新颖的疗法。
同时,AI将扩展到模拟越来越大的系统,从蛋白质到蛋白质复合物、细胞器、细胞、组织和整个器官。这样做将使我们能够治愈那些复杂性超出当今医学能力范围的疾病。例如,过去10年出现了许多有前景的癌症治疗方法,包括CAR-T、BiTEs和免疫检查点抑制剂等免疫疗法。这些疗法已经拯救了成千上万人的生命,但它们仍然经常失败,因为癌细胞会产生耐药性。肿瘤通常会以一种我们用当前技术无法完全理解的方式改变其微环境,从而导致耐药性。然而,当AI能够可靠地模拟肿瘤及其微环境时,我们将能够定制疗法以克服这种耐药性。
同样,阿尔茨海默病和帕金森病等神经退行性疾病涉及微妙而复杂的过程,会导致错误折叠的蛋白质在大脑中积累,从而造成损害。由于无法在活体大脑中全面研究这些疾病的影响,相关研究一直进展缓慢且困难重重。借助AI模拟,我们将能够在患者变得虚弱之前就给予有效治疗。同样的大脑模拟工具还可以让我们在治疗精神健康障碍方面取得突破性进展,据估计,美国有超过一半的人在人生的某个阶段会受到精神问题的影响。迄今为止,医生一直依赖像选择性5-羟色胺再摄取抑制剂(SSRIs)和5-羟色胺与去甲肾上腺素再摄取抑制剂(SNRIs)这样的直接治疗药物,它们可以暂时调节化学失衡,但效果往往不尽如人意,对某些患者完全无效,而且会带来一大堆副作用。一旦AI可以帮助我们全面了解人脑这种宇宙中已知最复杂的结构,我们就能够从源头上解决许多心理健康问题。
除了AI在发现新疗法方面的前景,我们还将在用于验证这些新疗法的试验中掀起一场革命。美国食品和药物管理局现在已经开始将模拟结果纳入其监管审批流程。在未来几年,这一点在应对类似新冠疫情这样的情况时将尤为重要。当一种新的病毒威胁突然出现时,通过加速疫苗研发,可以挽救数百万人的生命。
但假设我们可以将试验过程完全数字化,使用AI来评估药物对成千上万(模拟)患者在数年时间内的(模拟)作用,所有这些工作都可以在几小时或几天内完成。这将使试验结果比我们今天采用的相对缓慢、低效的人体试验更丰富、更快速、更准确。人体试验的一个主要缺点(取决于药物的类型和试验阶段),是它们只涉及大约十几到几千个受试者。这意味着在任何给定的受试者群体中,很少有人(如果有的话)可能以与其他患者身体完全相同的方式对药物产生反应。许多因素都会影响药物对个人的疗效,如遗传、饮食、生活方式、激素平衡、微生物组、疾病亚型、正在服用的其他药物以及可能患有的其他疾病。如果临床试验中没有人在所有这些维度上与你相符,那么即使一种药物对普通人有好处,对你而言疗效也是不确定的。
如今,一项试验可能显示,3000名受试者在某种情况下平均改善了15%。而模拟试验可以揭示其中隐藏的细节。例如,该组250人中的某一部分(例如,那些有特定基因的人)实际上会受到药物的伤害,病情会恶化50%,而另外500人中的某一部分人(例如,那些同时患有肾病的人)病情会改善70%。模拟将能够找到许多这样的相关性,为每位患者提供非常具体的风险与疗效告知。
这项技术的引入将是渐进的,因为生物模拟的计算需求在不同的应用中会有所不同。主要由单一分子组成的药物处于光谱相对简单的一端,将首先被模拟。同时,像CRISPR这样的技术和旨在影响基因表达的疗法,因为涉及多种生物分子和结构之间极其复杂的相互作用,所以需要更长的时间才能在计算机上进行令人满意的模拟。为了取代人体试验成为主要的测试方法,AI模拟不仅需要模拟给定治疗剂的直接作用,还需要模拟它如何在很长一段时间内适应整个人体的复杂系统。
目前尚不清楚这种模拟涉及多少细节。例如,拇指上的皮肤细胞不太可能与测试肝癌药物相关。但为了验证这些工具的安全性,我们可能需要以分子级别的分辨率对整个人体进行数字化。只有这样,研究人员才能可靠地确定对于特定的应用,哪些因素可以有把握地忽略不计。这是一个长期目标,同时也是AI最重要的挽救生命的目标之一,我们将在21世纪20年代末取得有意义的进展。
由于各种原因,医学界可能会对越来越依赖模拟药物试验产生实质性的抵触。谨慎对待风险是非常明智的。医生不会希望以可能危及患者生命的方式改变审批程序,因此模拟需要有非常可靠的记录,表明其效果与当前的试验方法一样好,甚至更好。另一个因素是责任。没有人愿意批准一种可能会演变成一场灾难的治疗方法,尽管它看上去很新颖、很有希望。因此,监管机构需要预见这些新兴方法,并积极主动地确保激励措施在适当的谨慎和挽救生命的创新之间保持平衡。
尽管我们还没有强大的生物模拟技术,但AI已经开始在遗传生物学领域产生影响。98%不编码蛋白质的基因曾一度被认为是垃圾“DNA”,现在我们知道它们对基因表达(即哪些基因被积极使用以及在多大程度上被积极使用)至关重要,但是很难从非编码DNA本身确定这些关系。而由于AI可以检测到非常细微的模式,它已经被用于打破这个僵局,就像2019年纽约科学家发现非编码DNA与孤独症之间存在联系一样。该项目的首席研究员奥尔佳·特罗扬斯卡娅(Olga Troyanskaya)表示,这是“首次明确证明非遗传、非编码突变会导致复杂的人类疾病或失调”。
在新冠疫情之后,监测传染病的挑战也变得更加紧迫。过去,流行病学家在试图预测美国各地的病毒暴发情况时,不得不从几种不完善的数据类型中进行选择。而一个名为ARGONet的新AI系统可以实时整合不同类型的数据,并根据它们的预测能力对其进行加权。ARGONet结合了电子医疗记录、历史数据、公众在谷歌上的实时搜索,以及流感在不同地区传播的时空模式。哈佛大学的首席研究员毛里西奥·桑蒂拉纳(Mauricio Santillana)解释说:“该系统会不断评估每种独立方法的预测能力,并重新校准如何使用这些信息来改进流感预测。”事实上,2019年的研究表明,ARGONet优于之前的所有方法。在研究取样的75%的州中,它的表现优于谷歌流感趋势(Google Flu Trends)。此外,它还能够比美国疾病控制和预防中心采用的常规方法提前一周预测全州范围内的流感活动。目前,更多新的由AI驱动的方法正在开发中,以帮助阻止下一次重大疫情的暴发。
除了科学应用,AI在临床医学方面也正在获得超越人类医生的能力。在2018年的一次演讲中,我预测在一到两年内,神经网络将能够像人类医生一样分析放射学图像。仅仅两周后,斯坦福大学的研究人员就发布了CheXNet,它使用100000张X射线图像训练一个121层的卷积神经网络来诊断14种不同的疾病。它的表现优于参与对比的人类医生,提供了些浅层次的、令人鼓舞的证据,证明它在诊断方面具有巨大的潜力。其他神经网络也表现出了类似的能力。2019年的一项研究表明,分析自然语言临床指标的神经网络能够比接触相同数据的8位初级医生更好地诊断儿科疾病,并在某些领域超过了所有20位人类医生。2021年,约翰斯·霍普金斯大学的一个团队开发了一个名为DELFI的AI系统,它能够识别人体血液中DNA片段的微妙模式,通过简单的实验室测试检测出94%的肺癌病例,即使是专业人士也无法仅靠自己做到这一点。
这些临床工具正在迅速从概念验证阶段(即验证技术可行性)跃升到大规模部署阶段。2022年7月,《自然医学》(Nature Medicine)杂志发表了一项涉及590000多名住院患者的大型研究结果,这项研究采用了名为“针对性的实时预警系统”(Targeted Real-Time Early Warning System,TREWS)的AI驱动系统进行监测,主要用于检测败血症——一种危及生命的感染反应,每年导致大约270000名美国人死亡。TREWS为医生提供了开始治疗的早期预警,使败血症患者的死亡率降低了18.7%,这表明随着应用的扩大,医生每年有可能挽救数万人的生命。这些模型将越来越多地纳入更丰富的信息形式,如来自我们的可穿戴健康设备的数据,并将能够在人们意识到自己生病之前提出治疗建议。
随着21世纪20年代的发展,AI驱动的工具将在几乎所有诊断任务中达到超越人类的性能水平。解读医学影像是一项能让神经网络有力发挥其天然优势的任务。临床上有意义的信息可能隐藏在图像中,其细微程度无法被人眼检测到,但对AI系统来说却很明显。与其他需要整合许多不同定性信息的诊断形式不同,图像中的像素模式完全可以还原为可量化的数据,而这正是AI的强项。这就是为什么医学影像成为最早见证AI达到如此卓越性能的领域之一。出于同样的原因,将类似CheXNet及其“表亲”CheXpert这样的系统推广到其他类型的医学图像分析也相对容易。最终,AI很可能在医学影像识别中释放巨大的未开发潜力。它或许能在表面看似健康的器官中识别出隐藏的风险因素,从而在身体出现损伤之前采取预防措施。
手术也将从这场革命中受益,因为与手术相关的高质量数据和可用计算资源都在快速增长。多年来,机器人一直被用来辅助人类医生,但现在它们已经展示出了无须人类参与就能完成手术的能力。2016年,在美国,智能组织自主机器人(Smart Tissue Autonomous Robot,STAR)在动物实验完成肠道缝合任务中取得了优于人类外科医生的成绩。2017年,中国的一台机器人独立完成了全套高精度的牙齿种植手术。2020年,Neuralink推出了一款外科手术机器人,它可以自动完成大部分植入脑机接口的过程,该公司正在努力实现由机器人完成的全自主手术。
一位普通外科医生每年可能要做几百例手术,整个职业生涯最多做几万例。在许多情况下,例如那些需要更长时间和做更复杂手术的专科医生,这个数字可能更少。相比之下,有AI驱动的机器人外科医生将能够从该系统在世界各地执行的任何手术中学习经验。这将涵盖比任何人类所能遇到的都更多样的临床情况——可能多达数百万例手术。此外,AI还能够执行数十亿次模拟手术,调整在临床环境中不可能或因不符合伦理无法训练的异常变量。例如,模拟手术可以训练机器人外科医生处理罕见的多种疾病同时出现的情况,或者通过模拟大多数外科医生在职业生涯中从未见过的复杂创伤,来突破创伤医学的极限。这将使手术比现在更安全、更有效。
21世纪30年代和21世纪40年代:开发和完善纳米技术
生物学创造出了像人类这样精巧的生物,智力具有很强的灵活性,同时身体又具有协调性(例如,对生拇指),从而实现了技术的发展,这一点很了不起。然而,我们远没有达到最佳状态,尤其是在思考方面。正如汉斯·莫拉维克在1988年思考技术进步的影响时所说,无论我们如何微调自己基于DNA的生物结构,相对于我们专门设计的创造物,我们的血肉之躯都将处于劣势。正如作家彼得·维贝尔(Peter Weibel)所说,莫拉维克明白,人类在这方面只能是“二等机器人”。这意味着即使我们致力于优化和完善人类的生物大脑的能力,它们的运行速度也将比完全改造过的身体慢得多,能力也差得多。
AI与纳米技术革命的结合,将使我们能够在分子层面上重新设计和重构我们的身体、大脑以及与我们交互的世界。人类的神经元每秒最多能够触发约200次,理论上的绝对最大值为1000次,而实际上大多数神经元每秒的平均触发次数可能还不到1次。相比之下,晶体管现在每秒可以循环超过1万亿次,市面上的计算机芯片每秒可以循环超过50亿个周期。之所以存在如此巨大的差异,是因为我们大脑中的神经元计算使用了比数字计算中的精密工程所能实现的更慢、更笨拙的架构。随着纳米技术的进步,数字领域将能够更领先。
此外,根据我在《奇点临近》一书中的估计——这与汉斯·莫拉维克基于不同分析得出的预测在数量级上相当,人脑的大小决定了其总处理能力的上限,即每秒1014次操作。美国超级计算机“前沿”(Frontier)在与AI相关的性能基准测试中运算速度已经可以达到每秒1018次操作。由于计算机中晶体管的组装方式可以比大脑的神经元更密集、更有效,而且它们在物理上可以比大脑更大,还可以远程联网,因此它们将把未经增强的生物大脑远远甩在后面。未来的前景是明朗的:仅基于生物大脑这种有机基质的心智,将无法与通过纳米精密工程增强的心智相提并论。
物理学家理查德·费曼在他1959年的一次重要演讲《底下的空间还大得很》(There’s Plenty of Room at the Bottom)中首次提到了纳米技术,他在演讲中描述了在单个原子尺度上制造机器的必然性和深远影响。正如费曼所说:“据我所见,物理学原理并不排斥在原子层面上操纵事物的可能性……理论上,物理学家可以合成化学家写下的任何化学物质……如何做到?把原子放在化学家指定的位置,这样你就制造出了物质。”费曼很乐观:“如果我们最终能够在原子层面上观察和操作,解决相关化学和生物学的问题就会得到极大的助力,我认为这种发展是必然的。”
为了让纳米技术影响大型物体,它需要有一个自我复制系统。杰出数学家约翰·冯·诺伊曼在20世纪40年代后期的一系列讲座和1955年发表在《科学美国人》(Scientific American)杂志上的一篇文章中,正式提出了如何创建自我复制模块的想法。但他的全部想法直到1966年,也就是他去世近10年后,才被收集并广泛发表。冯·诺伊曼的方法是高度抽象和数学化的,主要集中在逻辑基础上,而不是构建自我复制机器的详细物理方法和用处。在他的概念中,自我复制器包括一个“通用计算机”和一个“通用构造器”。计算机主要运行控制构造器的程序,构造器可以复制整个自我复制器和程序,这样副本就可以无限期地进行同样的复制过程。
在20世纪80年代中期,工程师埃里克·德雷克斯勒在冯·诺伊曼的概念基础上建立了现代纳米技术领域。德雷克斯勒设计了一台抽象机器,它利用普通物质中发现的原子和分子片段来为他的冯·诺伊曼式构造器提供材料,该构造器具有一台能够指导原子摆放的计算机。德雷克斯勒的“装配机”基本上可以制造世界上的任何东西,只要其结构在原子层面上是稳定的。正是这种灵活性和通用性使得德雷克斯勒开创的分子机械合成方法与基于生物学的方法区分开来,后者虽然也能在纳米尺度组装物体,但在设计和可用的材料方面受到更多限制。
德雷克斯勒概述了一种使用分子“互锁”而不是晶体管门的极简计算机。(这些都是概念性的设计,实际上还没有构建出来。)每个互锁结构只需要6立方纳米的空间,并且可以在十亿分之一秒内切换其状态,其计算速度可以达到每秒大约10亿次。人们提出了这种计算机的多种改进方案,越来越完善。2018年,拉夫·默克尔(Ralph Merkle)和几位合作者设计了一个可以在纳米尺度实现的全机械计算系统。他们的详细设计(仍然是概念性的)每升可容纳大约1020个逻辑门,并以100 MHz的频率运行,计算机每升体积每秒最多可进行1028次计算操作(尽管散热需要该体积具有较大的表面积)。[1]这种设计的功率约为100瓦。[2]考虑到世界上大约有80亿人,如果要模拟所有人类大脑的计算总量,那么所需的计算能力只需不到每秒1024次运算(每人1014次乘以1010人)。
迈向奇点的关键进展
正如第2章中所讨论的,我估计要模拟每个神经元需要1014次运算。然而,大脑采用了大规模并行的方式工作。因为我们头骨内部潮湿的生物环境(至少在分子层面上是这样),可以说这是一个非常混乱的地方,任何单个神经元都可能会死亡或者在需要的时刻无法正确触发。如果人类的认知严重依赖于任何单个神经元的表现,那么整个系统将是非常不可靠的。但当许多神经元并行工作时,这种“干扰”就会被抵消,我们就能正常思考。
在构建非生物计算机时,我们可以更精确地控制其内部环境。计算机芯片的内部环境比大脑组织更加干净和稳定,所以并不需要大脑那样的并行性工作方式。更稳定的环境可以实现更高效的计算,因此我们有理由相信,也许可以用每秒少于1014次的运算来模拟思维。但由于目前还不清楚大脑的并行性有多高,保守起见,我仍然选择采用更大的估计值。理论上,一个容量为1升、效率极高的纳米计算机,其计算能力相当于100亿人(或约100万亿人)的大脑的能力。需要澄清的是,我并不是说这在实践中一定能实现。我想表达的是,纳米工程为未来的进步提供了惊人的发展空间。即使我们只能达到理论最大值的一小部分,也足以开创一个全新的革命性计算范式,使纳米级机器获得强大的计算能力。
如果有了自我复制纳米机器人,这种机制将使实现宏观结果所需的大规模协调成为可能。控制系统类似于一种被称为单指令多数据(Single Instruction,Multiple Data,SIMD)的计算机指令架构。这意味着单个计算单元将读取程序指令,然后同时将它们传输给数万亿个分子大小的汇编器,每个汇编器都有自己的简单计算机。
使用这种“广播”架构还可以解决一个关键的安全问题。如果自我复制过程失控,或者出现错误或安全漏洞,复制指令的源可以立即关闭,从而阻止纳米机器人的任何进一步活动。正如第7章将进一步讨论的那样,纳米技术应用中最坏的情况是形成所谓的“灰色黏液”(gray goo)——自我复制的纳米机器人形成不可控的连锁反应。理论上,这可能消耗地球上的大部分生物量,并将其转化为更多的纳米机器人。拉夫·默克尔提出的“广播”架构可以对这种情况进行有力防御。如果指令都必须来自中央源,在紧急情况下关闭广播将使纳米机器人失去活动能力,在物理上无法继续自我复制。
真正执行这些指令的构建机器将是一个简单的分子机器人,只有一只手臂,类似于冯·诺依曼的通用构造器,只是规模很小。制造分子尺度的机械手臂、齿轮、转子和电机的可行性已经被多次验证过了。
在物理学上,分子尺度的机械臂无法像人手那样移动原子,抓取并携带它们。这使得纳米技术的未来充满争议。2001年,美国物理学家和化学家理查德·斯莫利(Richard Smalley)与埃里克·德雷克斯勒就使用“分子组装器”进行原子层面的精密制造是否可行展开了一场公开辩论。斯莫利和德雷克斯勒都对纳米技术领域做出了重要贡献,但他们采用的方法不同。德雷克斯勒认为,“自上而下”的方法是纳米技术的最终目标,允许制造机器从头开始构建纳米机器人。斯莫利认为,这在物理学上是不可能的,只有“自下而上”的生物学式自组装方法才是合理明智的目标。斯莫利的反对有两个依据:一是“肥手指问题”,即移动反应原子所需的操纵臂在纳米尺度上工作会太笨重而无法有效工作;二是“黏手指问题”,被移动的原子会黏附在操纵器手臂上。
德雷克斯勒回应说,设计使用单个操纵臂的技术不会面临“肥手指问题”,而像酶和核糖体这样的生物机器已经证明“黏手指问题”是可以解决的。2003年辩论愈演愈烈时,我提出了自己的观点,主要站在德雷克斯勒一方的立场上。回顾近20年的发展,我很高兴地说,纳米技术的最新进展使“自上而下”的观点看起来越来越可信,尽管在AI技术进步的帮助下,该领域至少还需要10年才能开始成熟。科学家们已经在原子的精确控制方面取得了重大进展,21世纪20年代将见证更多关键突破。
德雷克斯勒设计的纳米级构造臂看起来仍然是最有前景的。它没有笨拙而复杂的抓握爪,而是有一个尖端,通过机械和电子功能拾取一个原子或小分子,然后在不同的位置释放它。德雷克斯勒在其1992年出版的著作《纳米系统》(Nanosystems)中提出,有许多不同的化学方法可以实现这一点。一种方法是移动碳原子,用一种叫作金刚石的纳米尺寸的金刚石物质构建物体。
类金刚石是由(少至10个)碳原子组成的微小笼子,排列成最基本的金刚石晶体类型,氢原子键合在笼子的外面。这些可能能够形成极轻、极强的纳米工程结构的基石。德雷克斯勒在他1986年的著作《创造引擎和纳米系统》(Engines of Creation and in Nanosystems)中探索了纳米技术和金刚石制造的想法,这启发了科幻小说家尼尔·史蒂芬森(Neal Stephenson)创作了《钻石年代》(The Diamond Age),这部小说还获得了1995年的雨果奖。他在小说中想象了一个未来,以钻石为基础的纳米技术定义了文明,就像青铜定义了青铜时代,铁定义了铁器时代。在小说发布后的25年甚至更长的时间里,金刚石研究取得了巨大进展,科学家们开始在实验室研究中看到实际应用。不过,在未来10年,AI将通过详细的化学模拟,推动这一领域取得更快的进展。
许多学者提出的纳米技术设计都采用了这种方法。我们从化学气相沉积技术中了解到,可以通过这种方式制造人造钻石。金刚石不仅非常坚固,而且可以通过掺杂工艺精确添加杂质以改变热导率等物理性质,或者制造晶体管等电子元件。[3]过去10年的研究表明,在纳米尺度上利用碳原子的各种排列方式设计电子和机械系统的方法很有前景。纳米技术这一领域现在在全世界受到了高度关注,但一些最有趣的提议来自拉夫·默克尔和他的合著者。早在1997年,默克尔就设计了一种装配机的“新陈代谢”系统,可以从丁二烯的“原料溶液”中制造出金刚石等碳氢化合物。
自2005年以来,在石墨烯(一种单原子厚度的六边形碳晶格)、碳纳米管(本质上是石墨烯的轧制管)和碳纳米线(被氢包围的近一维碳链)方面也取得了令人兴奋的新突破,未来20年里,我们将看到所有这些材料各种各样的实际应用。
学界目前正在探索许多实现这种机械合成和其他纳米技术的途径。其中包括DNA折纸(DNA Crigami)、DNA纳米机器人(DNA Nanorobotics)、仿生分子机器(Bio-Inspired Molecular Machines)、分子乐高(Molecular Lego)、用于量子计算的单原子量子比特(Single-Atom Qubits)、基于电子束的原子放置(Electron Beam-Based Atom Placement)、氢去钝化光刻(Hydrogen Depassivation Lithography)和基于扫描隧道显微镜的制造(Scanning Tunneling Microscope-Based Manufacturing)。这些领域中有几个隐蔽的项目正在稳步进展。考虑到21世纪20年代末将会出现超人的工程AI来解决剩余的问题,我们有望在21世纪30年代的某个时候实现逐个放置原子的纳米技术概念的目标。
在实践中,这将意味着通过一个指数级的过程将信息传递给“无知”的原材料。中央计算机将同时向启动纳米机器人的核心发送指令,这些纳米机器人被放置在它们所需原子或基本分子的原料中。这些纳米机器人将按照指示自我复制,迭代创建自身的级联副本,很快就会造出数万亿个装配机。随后,计算机将向这些分子机器人发出如何构建所需结构的指令。
当这项技术成熟时,分子装配机可能是像一个桌面大小的设备,只要有必要的原子,它几乎能够制造任何物理产品。这将需要克服纳米尺度制造的巨大挑战之一:通用性。设计一个可以制造特定物质(如类金刚石)的装配机是一回事,设计一个能够装配非常多种化学物质的装配机则是另一回事。解锁后一种能力将需要极其先进的AI。因此,我们可以期待看到,化学成分相对均一的物体(如宝石、家具或衣服)将比那些化学成分差异很大、微观结构高度复杂的物体(如烹饪好的饭菜、仿生器官或比所有未经增强的人脑加起来更强大的计算机)更早由装配机制造出来。
一旦我们拥有先进的纳米制造技术,任何物理物体(包括分子装配机本身)的边际成本将仅为每磅几美分,基本上只是原子原材料的成本。根据德雷克斯勒在2013年的估计,无论制造的是钻石还是食物,分子制造过程的总成本约为每千克2美元。而且,由于纳米工程材料比钢或塑料强得多,大多数结构可以用大约为之前物体总质量的十分之一来建造。即使在成品中使用的原材料很昂贵,比如电子产品中的金、铜和稀土金属,这在未来通常也可以用更便宜、更丰富的元素(如碳)来代替其零部件。
因此,产品的真正价值将体现在它们所包含的信息上。从本质上说,是投入其中的所有创新,从创意到控制其制造过程的软件代码。这种情况已经发生在可以数字化的商品上。以电子书为例,当书籍最初被发明时,它们必须手工复制,所以人力是构成其价值的重要组成部分。随着印刷机的出现,纸张、装订材料和油墨等物理材料构成了其成本的主要部分。但有了电子书之后,复制、存储和传输一本书的能源和计算成本实际上为零。你花钱是为了将信息创造性地组合成值得阅读的内容(通常还有一些辅助因素,如市场营销)。你可以通过在亚马逊上搜索空白笔记本,然后搜索装帧大致相似的精装小说,来亲自感受这种差异。如果只看价格,你无法立即百分之百无误地分辨出哪个是哪个。小说电子书通常定价在几美元,而为一本空白的电子书支付任何费用的想法都很可笑。这就是一个产品的价值完全由信息决定的意义所在。
纳米技术革命将把这种变革性的转变带入物理世界。2023年,实物产品的价值取决于多种因素,特别是原材料、制造业劳动力、工厂机器运行时间、能源成本和运输。但在未来几十年,各种创新的融合将大大降低其中大部分成本。通过自动化,原材料的开采或合成成本降低;机器人将取代昂贵的人力劳动;昂贵的工厂机器本身将变得更便宜;太阳能光伏和储能技术(最终是核聚变)技术更强,能源价格将下降;自动驾驶电动汽车将导致运输成本降低。随着所有这些价值组成部分变得更便宜,产品所包含信息的价值比将提高。事实上,我们已经在朝着这个方向发展了,因为大多数产品的信息内容正在迅速增加,最终将非常接近其价值的100%。
在许多情况下,纳米制造技术将使产品变得足够便宜,可以免费提供给消费者。同样,我们可以看看数字经济是如何发挥作用的。正如第5章所讨论的那样,像谷歌和Facebook这样的平台在其基础设施上花费了数十亿美元,但每次搜索或每次点击“Like”的平均成本如此之低,以至于让它们对用户完全免费更有意义,而广告等其他收入来源则是主要的盈利方式。可以想见,未来人们可能会通过观看政治广告或共享个人数据来获得免费的纳米产品。政府也可能将此类产品作为提供志愿服务、接受继续教育或保持健康习惯的奖励。
物质资源稀缺性的显著降低将最终使我们能够轻松满足每个人的需求。需要注意的是,这是关于技术能力的预测,但文化和政治将在决定经济变化速度方面发挥重要作用。确保这些利益能够广泛、公平地被所有人共享,将是一个挑战。尽管如此,我对此还是持乐观态度。有人认为富有的精英会简单地囤积这种新财富的想法是基于一种误解。当商品真正丰富时,囤积它们是毫无意义的。没有人会为自己囤积空气,因为空气很容易获得,而且每个人都有足够的空气可以呼吸。类似地,当其他人使用维基百科时,这并不会导致你获取信息的机会减少。下一步只是将这种丰富性扩展到物质世界。
尽管纳米技术能够缓解多种物资匮乏的状况,但对经济匮乏状况的作用还有待观察,在一定程度上也受文化的驱动,尤其是在奢侈品方面。例如,肉眼已经无法区分人造钻石与天然钻石,但人造钻石的售价低了30%~40%。这部分价格与钻石作为装饰品的美感无关,与我们认为天然形成的钻石价值更高的观念有关。同样,大师的画作在装点起居室方面并不比高质量的复制品好多少。但由于人们更看重原作的地位,它们的售价可能会比复制品高出大约100万倍。因此,纳米技术制造革命不会消除所有的经济稀缺性。具有历史意义的钻石和伦勃朗的画作仍将稀缺。但是,在几代人的时间尺度上,文化价值观确实会发生变化。谁能断言现在的孩子们长大成人后会有怎样的价值取向?他们的后代又会如何?
将纳米技术应用于健康和长寿
正如我在关于延长寿命的书《超越》(Transcend)中所讨论的,我们现在正处于延长寿命第一阶段的后期。这一阶段涉及运用当前的药物和营养学知识来应对健康挑战。这是一个不断吸收新想法的发展过程,也是我近几十年来为自身健康所遵循的养生法的基础。
21世纪20年代,我们正在开启延长寿命的第二个阶段,即生物技术与AI的融合。这将涉及在数字生物模拟器中开发和测试突破性的治疗方法。这一阶段的早期工作已经开始,通过这些技术,我们将能够在几天而非几年的时间内发现非常强大的新疗法。
21世纪30年代将迎来延长寿命的第三个阶段,届时我们将使用纳米技术来完全克服生物器官的局限性。当进入这一阶段时,我们的寿命将大幅延长,人们将能够超越120岁这一正常人类寿命的极限。
迄今为止,有记录表明只有一个人的寿命超过了120岁,她就是活到122岁的法国女性珍妮·卡尔芒(Jeanne Calment)。那么,为什么120岁是人类寿命如此难以逾越的极限呢?有人可能会猜测,人们活不过这个年龄是因为统计学原因,即老年人每年都面临着患阿尔茨海默病、中风、心脏病或癌症的某种风险,经过多年暴露于这些风险之中,每个人最终都会因某种原因而死。但事实并非如此。精算数据显示,从90岁到110岁,一个人在接下来一年内死亡的概率每年增加约2%。例如,一名97岁的美国男性在98岁之前死亡的概率约为30%,如果他活到了98岁,那么他在99岁之前死亡的概率将为32%。但从110岁开始,死亡风险每年上升约3.5%。
医生给出了一个解释:在110岁左右,老年人的身体开始以不同于更年轻一些的老年人衰老的方式出现衰竭。超级百岁老人(110岁以上)的衰老不仅仅是晚年统计风险的延续或恶化。虽然这个年龄段的人每年也面临患上普通疾病的风险(尽管这些风险在非常老的人群中恶化的速度可能会放缓),但他们还面临着新的挑战,如肾衰竭和呼吸衰竭。这些往往是突发的,并非由生活方式或任何疾病引起。很明显,这是身体开始出现了衰竭。
在过去的10年里,科学家和投资者开始更加认真地关注究竟是什么原因导致了这种现象。这一领域的主要研究人员之一是生物老年学家奥布里·德格雷(Aubrey de Grey),他是长寿逃逸速度(Longevity Escape Velocity,LEV)基金会的创始人。正如德格雷解释的那样,衰老就像汽车发动机的磨损,它是由于系统的正常运行而累积起来的损坏。
就人体而言,这种损害主要来自细胞代谢(利用能量维持生命)和细胞复制(自我复制机制)的组合。新陈代谢会在细胞内部和周围产生废物,并通过氧化损坏结构,就像汽车生锈一样!
在年轻的时候,我们的身体能够有效地清除这些废物并修复损伤。但随着年龄的增长,我们体内的大多数细胞会不停地复制,错误也会不断积累。最终,损伤堆积的速度超过了身体修复的速度。
对于七八十岁甚至90多岁的老年人来说,衰老造成的身体损伤可能会在导致多种致命问题之前,就先引发一个致命问题。因此,如果科学家开发出一种药物,成功治愈了一位80岁老人的致命癌症,这个人可能会再多活近10年,直到其他原因夺去他的生命。但最终,身体的各个部位会同时开始衰竭,仅仅治疗衰老造成的症状也不再有效。长寿研究人员认为,唯一的解决方案是治愈衰老本身。可忽略衰老的工程策略(Strategies for Engineered Negligible Senescence,SENS)研究基金会已经提出了一个详细的研究议程,用于说明如何实现这一目标,尽管这需要数十年的时间才能完全实现。
我们需要在单个细胞和局部组织层面修复衰老造成的损伤。目前人们正在探索许多可能的方法来实现这一目标,但我认为最有前途的终极解决方案是纳米机器人,它们能够进入人体并直接进行修复。这并不意味着人类将永生不死。我们仍然可能死于意外和灾难,但随着年龄的增长,死亡风险将不再逐年上升。这样一来,许多人就可以健康地活到120岁以上。
我们不需要等到这些技术完全成熟才能从中受益。如果你可以活得足够久,抗衰老研究每年至少可以帮你延长一年的预期寿命,这将为纳米医学治愈任何遗留的衰老问题争取足够的时间。这就是所谓的“长寿逃逸速度”。
这就是为什么奥布里·德格雷惊世骇俗的声明背后有着合理的逻辑:第一个可以活到1000岁的人可能已经出生了。如果2050年的纳米技术能解决足够多的衰老问题,让100岁的人开始活到150岁,那么到2100年,我们将有时间来解决在那个年龄可能出现的任何新问题。届时,AI将在研究中发挥关键作用,在那段时间里,人们取得的进展将是指数级的。因此,尽管这些预测令人吃惊,甚至对我们直观的线性思维来说听起来很荒诞,但我们有充分的理由将其视为可能的未来。
多年来,我多次与人讨论延长寿命的问题,但我的想法经常遇到否定。当人们听到某个人因疾病而英年早逝时,他们会感到悲伤和惋惜。然而,当面对可以延长所有人类寿命的可能性时,他们也没有给出积极的反馈。“生活太难了,不能无限期地延续下去”是一种常见的反应。但人们通常不想在任何时候结束自己的生命,除非他们正承受着巨大的痛苦,无论是在身体、精神还是心灵上。如果他们能够因为生活各个方面的持续改善而受益,正如第4章中详细阐述的那样,大多数这样的痛苦都会得到缓解。也就是说,延长人类寿命也意味着大大提高人类的生活质量。
要想象延长寿命会如何提高生活质量,回想一个世纪前的情况会有所帮助。1924年,美国人的平均预期寿命约为58.5岁,因此那一年出生的婴儿在统计学上预计会在1982年去世。但在这期间,医学取得了如此多的进步,以至于其中许多人活到了2000年或2010年。得益于寿命的延长,他们能够享受退休生活,生活在一个可以乘坐廉价航空旅行、乘坐更安全的汽车、看有线电视和浏览互联网的时代。对于2024年出生的婴儿来说,在他们生命中增加的几年里,技术进步的速度将比20世纪快得多。除了这些巨大的物质优势之外,他们还将享受更丰富的文化。他们将能欣赏到人类在这些额外延长的岁月中创造的所有艺术、音乐、文学、电视和电子游戏。也许最重要的是,他们将有更多的时间与家人和朋友在一起,去享受爱和被爱。在我看来,所有这些都赋予了生命最大的意义。
迈向奇点的关键进展
但纳米技术究竟将如何使这成为可能呢?在我看来,长远目标是创造医用纳米机器人。这些纳米机器人将由带有机载传感器、操纵器、计算机、通信器甚至电源的金刚石部件制成。直观上,我们可以将纳米机器人想象成在血液中穿梭的微型金属潜水艇,但纳米尺度下的物理学采用的是一种完全不同的方法。在这个尺度下,水是一种强大的溶剂,氧化分子具有较高的活性,因此需要金刚石等高强度的材料。
宏观尺度的潜艇可以在液体中平稳地推进,但对于纳米尺度的物体,其流体动力学主要受黏性摩擦力的影响。这就好像在花生酱中游泳一样困难!因此,纳米机器人需要利用不同的推进原理设计。同样,纳米机器人可能无法储存足够的机载能量或计算能力来独立完成所有任务,所以它们需要被设计成能够从周围环境中获取能量,要么服从外部控制信号,要么相互协作进行计算。
为了维持我们的身体健康并解决其他健康问题,每个人都需要大量的纳米机器人,每个机器人的大小与细胞相当。可靠估计表明,人体由数十万亿个生物细胞组成。如果我们要在每100个细胞中增加一个纳米机器人,这将需要数千亿个纳米机器人。不过,我们目前还不清楚什么样的比例是最佳的。例如,我们可能会发现,即使细胞与纳米机器人的数量之比高出几个数量级,先进的纳米机器人也能发挥作用。
衰老的主要影响之一是器官功能衰退,因此这些纳米机器人的一个关键作用将是修复和增强器官的功能。除了扩大我们的新皮质,正如第2章所讨论的那样,这主要涉及帮助我们的非感觉器官有效地将物质输入血液供应系统(或淋巴系统)或将其移除。例如,肺部吸入氧气并排出二氧化碳,肝脏和肾脏排出毒素,整个消化道将营养物质输送到我们的血液中,胰腺等各种器官负责产生控制新陈代谢的激素。激素水平的变化可导致糖尿病等疾病。已经有设备可以测量血液中的胰岛素水平并将胰岛素转移到血液中,就像真正的胰腺一样。通过监测这些重要物质的供应情况,根据需要调整它们的水平,并维持器官结构,纳米机器人可以无限期地使人体保持在健康状态。最终,如果需要或我们希望的话,纳米机器人将能够完全替代生物器官。
纳米机器人的作用不仅限于维持身体的正常机能。它们还可以用于调节血液中各种物质的浓度,使其达到比一般状态更优的状态。调整激素水平可以让我们更有能量、更专注,或可以加速身体自然愈合和修复的过程。如果调整激素可以使我们的睡眠更有效率,那实际上就是一种“后门延寿”(Backdoor Life Extension)的方式。如果你只是从每晚需要8小时睡眠变为7小时,那就相当于寿命延长了5年,清醒的时间大大延长!
最终,使用纳米机器人维护与优化身体机能应该可以预防重大疾病的发生。当然,纳米机器人可能会在一段时间已经可以应用,但并非所有人都会将其用于这个目的。因此,一旦诊断出癌症等疾病,就需要立即治疗。
癌症之所以如此难以消除,部分原因是每个癌细胞都具有自我复制的能力,因此必须清除每一个细胞。尽管免疫系统通常能够控制癌细胞最早期的分裂,但一旦肿瘤真正形成,它就可能对身体的免疫细胞产生抗性。此时,即使治疗消灭了大部分癌细胞,遗留的细胞也可能继续复制。被称为癌症干细胞的一个亚群尤其可能成为危险的脱靶者。
在过去10年里,尽管癌症医学取得了惊人的进步,并且在这个10年里将在AI的帮助下取得更大的突破,但我们目前治疗癌症的手段仍然相对迟钝。化疗常常不能完全根除癌细胞,还会对身体各处其他非癌细胞造成严重的伤害。这不仅会给许多癌症患者带来严重的副作用,而且会削弱他们的免疫系统,使他们更容易受到其他健康风险的影响。即使是先进的免疫疗法和靶向药物,其疗效和精准程度也远远不够。
相比之下,医用纳米机器人将能够检查每个细胞,确定它是否发生了癌变,然后摧毁所有的恶性细胞。回想一下本章开头提到的汽车修理工的类比。一旦纳米机器人可以选择性地修复或破坏单个细胞,我们就能完全掌控自己的生物学身体,医学也将成为长期以来人们一直期望它成为的精确科学。
要实现这一点,还需要完全控制我们的基因。在自然状态下,细胞通过复制每个细胞核中的DNA来繁殖。如果一组细胞的DNA序列出现问题,除非在每个细胞中都进行修复,否则我们无法解决这个问题。对于未经增强的生物有机体来说,这是一个优势。因为单个细胞内的随机突变不太可能对整个身体造成致命损害。如果我们身体中任何一个细胞发生的任何突变都能立即复制到其他每个细胞上,我们就无法生存。与此同时,生物学去中心化的稳健性对于像人类这样的物种来说也是一个巨大的挑战。我们目前可以很好地编辑单个细胞的DNA,但还没有掌握有效编辑整个身体内的DNA所需的纳米技术。
如果每个细胞的DNA代码都由中央服务器统一控制,就像许多电子系统一样,那么我们只需从“中央服务器”中更新一次,就可以轻松改变DNA代码。为了实现这一点,我们将用纳米工程的对应系统来强化每个细胞的细胞核。该系统将接收中央服务器的DNA代码,然后以这个代码为基础生成氨基酸序列。这里用“中央服务器”这个词,是将其作为更集中的广播架构的简称,但这并不一定意味着每个纳米机器人都可以从字面意义上的计算机那里直接获取指令。纳米尺度工程所面临的物理挑战,最终可能使相关研究转向寻求更本地化的“广播”系统。但即使我们在身体各处放置数百或数千个微尺度(而非纳米尺度)的控制单元,这些控制单元足够大,足以与一台整体控制计算机进行更复杂的通信,那么与目前数万亿个细胞独立运作的状况相比,这仍然比目前的集中化程度高出数个数量级。
蛋白质合成系统的其他部分,如核糖体,也可以用同样的方法得到强化。通过这种方式,我们可以简单关闭故障DNA的活动,无论这些DNA是会导致癌症还是会导致遗传障碍。维护这一过程的纳米计算机还将通过生物算法——基因如何表达和激活,实现对表观遗传学的控制。截至21世纪20年代初,对于基因表达,我们还有很多需要学习的地方。但是,当纳米技术足够成熟时,在AI技术的助力下,我们将可以对基因表达进行足够详细的模拟,使纳米机器人能够精确地调节基因表达。借助这项技术,我们还将能够防止和逆转DNA转录错误的积累,而DNA转录错误是衰老的主要原因。
纳米机器人在消除身体面临的紧急威胁方面也将发挥重要作用,如消灭细菌和病毒、抑制自身免疫反应或疏通堵塞的动脉。事实上,斯坦福大学和密歇根州立大学在最近的研究中已经创造出一种纳米粒子。这种粒子能够找到并消除引起动脉粥样硬化斑块的单核细胞和巨噬细胞。智能纳米机器人的效率将远胜于此。起初,这种治疗需要由人类发起,但最终将可以由机器人自主进行;纳米机器人将自行执行任务,并通过控制的AI界面向监控它们的人类报告其活动。
随着AI对人类生物学方面的理解能力不断提高,纳米机器人将能够在问题被医生检测到之前,就在细胞层面率先“出手”。在很多情况下,这将有助于预防那些在2023年仍无法解释的病症。例如,今天有约25%的缺血性中风是“隐源性”的,即没有可检测到的病因。但我们知道,它们的发生一定是有原因的。在血液中巡逻的纳米机器人可以检测到有可能引发中风的小斑块或结构缺陷,分解正在形成的血栓,或者在中风悄然发生时发出警报。
不过,就像优化激素水平一样,纳米材料不仅能够使身体机能恢复正常,还能够让我们的身体机能得到增强,甚至超越生物学所能及的范围。生物系统在强度和速度上是有限的,因为它们必须由蛋白质构成。尽管这些蛋白质是三维的,但它们必须由一维的氨基酸链折叠而成。而纳米工程材料则不会有此限制。由金刚石齿轮和转子构成的纳米机器人,其速度和强度将比生物材料高出数千倍,并且可以从零开始设计,以达到最佳性能。
得益于这些优势,即使是我们的血液供应系统也可能被纳米机器人取代。由奇点大学纳米技术联合主席罗伯特·弗雷塔斯(Robert Freitas)设计的一种叫作呼吸细胞(Respirocyte)的人工红细胞就是一个例子。根据弗雷塔斯的计算,如果一个人的血液中有呼吸细胞,他可以憋气长达约4小时。除了人造血细胞,我们最终还能够设计出人工肺,使它们比生物学赋予我们的呼吸系统更有效地输送氧气。最终,甚至由纳米材料制成的心脏也会使人们免于心脏病发作,并使因创伤导致的心脏骤停变得更加罕见。
由金刚石齿轮和转子制成的纳米机器人将比以前快几千倍,纳米机器人还可以让人们以前所未有的方式改变自己的外表。人们已经可以在聊天室和在线角色扮演游戏等数字环境中自由定制自己的头像。大家经常把这作为一种表达创造力和个性的方式。除了个人的外表选择和时尚表达外,用户还可以扮演与自己的年龄、性别甚至物种不同的虚拟角色。当纳米技术赋予人们从根本上改变自己的物理身体的能力时,这种情况将以何种状态延展到现实生活中还有待观察。在现实世界中,人们是否也会像在游戏中那样,对外表做出根本性的改变?抑或心理和文化因素会使人们在这些选择上更加保守?
纳米技术在我们身体中最重要的作用将是增强大脑,最终我们的大脑将有99.9%的构成部分都是非生物性的。实现这一目标有两种截然不同的途径:一种是逐渐将纳米机器人引入大脑组织本身。这些纳米机器人可用于修复受损的神经元或替代已经停止工作的神经元;另一种是将大脑连接到计算机,这不仅能让我们直接用思维控制机器,还能让我们在云端整合新皮质的数字层。正如第2章中更详细描述的那样,这将远远超越我们获得更好的记忆力或更快的思考速度的期待。
一个更深层次的虚拟新皮质将赋予我们思考比目前更加复杂和抽象的想法的能力。举个简单的例子,想象一下,你将能够清晰直观地对10维的形状进行可视化处理和推理。这种能力将在许多认知领域都成为现实。作为比较,大脑皮层(主要由新皮质组成)在大约半升的体积中平均包含160亿个神经元。拉夫·默克尔设计的纳米级机械计算系统理论上可以在同样大小的空间中容纳超过80万万亿个逻辑门,其速度优势将是巨大的:哺乳动物神经元的电化学转换速度可能平均在每秒一次,而纳米工程计算的速度可能在每秒1亿到10亿次。即使实践中只能实现这些数值中的极小部分,这种技术也将使我们大脑的数字部分(存储在非生物计算基质上)在数量和性能上大大超过生物部分。
回想一下,我估计人脑内部(在神经元层面)的计算大约是每秒1014次。截至2023年,1000美元可以购买的计算能力每秒最多可以执行130万亿次计算。根据2000年到2023年的发展趋势预测,到2053年,1000美元可以购买(以2023年的美元购买力水平计算)的计算能力将足以执行700万倍于未经增强的人脑的计算量。正如我所怀疑的那样,如果事实证明仅仅需要一小部分大脑神经元来实现意识思维的数字化,例如,我们不必模拟控制身体其他器官的许多细胞的活动,这一目标可能会提前几年实现。即使事实证明,数字化我们的意识需要模拟每个神经元中的每个蛋白质(我认为这不太可能),达到这种可承受水平可能还需要几十年时间,但这仍然是现在许多人有生之年可能会发生的事情。因为这个未来取决于基本的指数趋势,即使我们大幅改变对数字化自身的难易程度的假设,这也不会显著改变实现这一里程碑所需的时间。
在21世纪40年代和21世纪50年代,我们将“重建”自己的身体和大脑,使其性能大大超越生物学的极限,包括实现数字化备份和延长寿命。随着纳米技术的发展,我们将能够随心所欲地打造一个优化的身体:我们将能够跑得更快、更远,像鱼一样在海洋中游泳和呼吸。如果我们想要,甚至可以安装能够帮助飞翔的翅膀。我们的思考速度将提高数百万倍,但最重要的是,我们的生存将不再依赖于任何特定的生物学身体。
结 语 我们将会面临的四个巨大危机
繁荣的背面
到目前为止,本书探讨了在奇点到来前的最后几年里,人类将以多种方式迎来快速增长的繁荣时期。但正如这种进步将改善数十亿人的生活一样,它也将加剧我们这个物种所面临的危机。新的、不稳定的核武器,合成生物学的突破以及新兴的纳米技术,都将带来我们必须应对的威胁。而且,随着AI本身达到并超越人类的能力,我们需要谨慎地将其用于有益的目标,并专门设计出防范事故和防止滥用的方案。我们有充分的理由相信,人类文明将克服这些危机,不是因为这些威胁不真实,而恰恰是因为风险非常高。危机不仅能激发人类智慧的最大潜力,而且催生危机的那些技术领域,也在创造强大的新工具来防范危机。
核武器:急需更智能的指挥与控制系统
人类有史以来第一次创造出可以毁灭人类文明的技术,正是在我这一代人出生之时。我还记得小学期间,我们在民防演习时必须躲在课桌下面,双手抱头,以保护自己免受热核爆炸的伤害。我们安然无恙地度过了那段时期,所以这种安全措施一定是奏效了。
人类目前拥有约12700枚核弹头,其中约9440枚随时可用于核战争。美国和俄罗斯各自拥有约1000枚大型核弹头,可在不到半小时的时间内发射。一场大规模的核交火可能会在短时间内迅速导致数亿人丧生,但这还不包括可能导致数十亿人死亡的次生效应。
由于世界人口分布如此分散,即使是全面的核交火也无法在核弹爆炸后立即杀死所有人。但核沉降物可能导致放射性物质扩散到全球大部分地区,而城市燃烧产生的大火会将大量烟尘抛入大气,导致严重的全球变冷和大规模饥荒。再加上对医疗和卫生等技术的灾难性破坏,将导致死亡人数远远超过最初的伤亡人数。未来的核武库可能包括掺入钴或其他元素的弹头,可能会极大地加剧残留放射性的危害。2008年,安德斯·桑德伯格和尼克·博斯特罗姆在牛津大学人类未来研究所(Future of Humanity Institute)举办的全球灾难性风险会议上搜集了专家们的意见。专家们的回答中值估计,在2100年之前,至少有100万人在核战争中丧生的可能性为30%,至少有10亿人丧生的可能性为10%,导致人类灭绝的可能性为1%。
截至2023年,已知有多个国家拥有完整的“三位一体”核武器(即洲际弹道导弹、空投核弹和潜射弹道导弹),其中美国(5244枚)、俄罗斯(5889枚)、巴基斯坦(170枚)和印度(164枚)。另外有的国家拥有更有限的运载系统:法国(290枚)、英国(225枚)和朝鲜(约30枚)。以色列尚未正式承认拥有核武器,但外界普遍认为其有约90枚核弹头。
国际社会通过谈判达成了一些国际条约,成功地将现役核弹头总数从1986年的峰值64449枚减少到不足9500枚,停止了危害环境的地面核试验,并保持外太空无核化。但现役武器的数量仍然足以终结我们的文明。而且,即使核战争的年度风险很低,几十年或一个世纪累积起来的风险也会变得很高。只要高度戒备的核武库维持在目前的状态,这些武器在世界某个地方被使用可能只是时间问题,无论是由政府、恐怖分子或流氓军官蓄意使用,还是被意外使用。
相互确保毁灭(Mutually Assured Destruction,MAD),是冷战时期美国和苏联最著名的降低核风险的策略。它包括向潜在敌人发出可靠的信息,如果他们使用核武器,将遭到同等程度的毁灭性报复。这种方法的基础是博弈论。如果一个国家意识到使用哪怕一件核武器都会导致对手发动全面报复,那么它就没有动机使用这些武器,因为这样做无异于自杀。为了让MAD发挥作用,双方都必须有能力在不被反导系统阻止的情况下对对方使用核武器。原因是,如果一个国家能够拦截来袭的核弹头,那么先发制人地使用自己的核弹头攻击就不再是自杀行为。不过,一些理论家也提出,核爆产生的放射性尘埃仍会摧毁进攻国,导致自我确保毁灭(Self-Assured Destruction,SAD)。
部分由于破坏稳定的MAD平衡的风险,世界各国军队在开发导弹防御系统方面投入的努力相当有限,截至2023年,没有一个国家拥有足够强大的防御能力,能够自信地经受住大规模核打击。但近年来,新的运载技术开始打破目前的平衡状态。俄罗斯正在努力建造水下无人潜航器来携带核武器,以及核动力巡航导弹。这些活动的目的是在目标国家外围长期徘徊,并从不可预测的角度发动攻击。俄罗斯和美国等国都在竞相开发能够规避高超音速飞行器,以在它们发射弹头时及时阻止的防御系统。由于这些系统非常新,如果敌对军队对对方武器潜在效力得出不同的结论,误判的风险就会增大。
即使有像MAD这样令人信服的威慑力量,由于误判或误解而导致灾难的可能性仍然存在。然而,我们已经习惯了这种情况,以至于很少讨论它。
不过,我们还是有理由对核风险的发展轨迹持谨慎乐观态度。70多年来,MAD一直很成功,核国家的武器库也在不断缩小。核恐怖主义或脏弹(含放射性物质的常规炸弹)的风险仍然是一个主要问题,但AI的进步正在带来更有效的工具来检测和应对这些威胁。虽然AI无法消除核战争的风险,但更智能的指挥与控制系统可以显著降低因传感器故障而引发的意外使用这些可怕武器的风险。
生物技术:呼唤AI驱动的对策
我们现在有了另一项可以威胁全人类的技术。有许多天然存在的病原体会让我们生病,但大多数人都能幸存下来。相反,有少数病原体更有可能导致人类死亡,但传播效率不高。像“黑死病”这样的恶性瘟疫集合了传播速度快和死亡率高两大特点,杀死了欧洲约1/3的人口,并使世界人口从约4.5亿减少到14世纪末的约3.5亿。然而,由于DNA的变异,一些人的免疫系统在抵抗瘟疫方面表现更好。有性生殖的一个好处是我们每个人都有不同的基因组成。
但是基因工程技术的进步(可以通过操纵病毒的基因来编辑病毒)可能在有意或无意中创造出一种具有极端致死性和高传染性的超级病毒。也许它甚至会通过隐形途径传播,人们在意识到自己感染之前就会感染和传播。没有人会预先发展出先天的全面免疫力,其结果是,我们会受到一场遍及所有人的病毒大流行的影响。2019年至2023年的新冠疫情让我们可以预见这样一场灾难可能是什么样子的。
这种可怕的可能性是1975年举办第一届阿西洛马重组DNA会议的推动力,这个会议比“人类基因组计划”的启动早15年。会议制定了一套标准来防止意外以及防范在故意的情况下可能发生的问题。这些“阿西洛马原则”一直在不断更新,其中一些原则现在已经被纳入管理生物技术行业的法律法规中。
此外,人们还在努力建立一个快速反应系统,以应对突然出现的生物病毒,无论是意外释放还是有意释放的。COVID-19出现之前,在人类为缩短快速反应时间所做的努力中,最值得注意的是美国政府在2015年6月在疾病控制与预防中心建立了全球快速反应小组(Global Rapid Response Team,GRRT)。GRRT是为了应对2014年到2016年西非的埃博拉病毒暴发而成立的。该团队能够在世界任何地方迅速部署,并提供高水平的专业知识,以协助当地有关部门识别、遏制和治疗具有威胁性的疾病暴发。
至于故意释放的病毒,美国联邦生物恐怖主义防御工作整体上是通过美国国家生物研究机构联合会(National Interagency Confederation for Biological Research,NICBR)进行协调的。这项工作中最重要的机构之一是美国陆军传染病医学研究所(United States Army Medical Research Institute of Infectious Diseases,USAMRIID)。我曾通过陆军科学委员会与他们合作,就在此类疫情暴发时提高快速反应能力提供建议。
当这样的疫情发生时,数百万人的生命取决于相关机构分析病毒、制定遏制和治疗策略的速度。幸运的是,病毒测序的速度呈现出长期加速的趋势。在1996年发现HIV后,人们花了13年的时间来对其全基因组进行测序,而2003年对SARS病毒进行测序只用了31天,现在我们可以在一天内对许多种生物病毒进行测序。快速反应系统主要的功能是捕获新出现的病毒,在大约一天内对其进行测序,然后迅速设计医学对策。
一种治疗策略是应用核糖核酸(RNA)干扰,即利用小的RNA片段,破坏表达基因的信使RNA,这主要是基于病毒与致病基因相似的观察。另一种策略是以抗原为基础的疫苗,其以病毒表面上独特的蛋白质结构为目标。正如上一章所讨论的,经过AI增强的药物发现研究已经能够在几天或几周内识别出针对新出现的病毒的潜在疫苗或治疗方法,从而缩短漫长的临床试验过程开始的时间。然而,在21世纪20年代后期,我们将拥有通过模拟生物学来加速越来越多的临床试验管线的技术。
2020年5月,我为《连线》(Wired)杂志撰写了一篇文章,主张我们应该充分利用AI来开发和生产疫苗,例如,针对引起COVID-19的SARS-CoV-2病毒。事实证明,这正是Moderna等疫苗在创纪录的时间内成功研制出来所采用的方式。该公司使用了一系列先进的AI工具来设计和优化mRNA序列,加快了制造和测试过程。因此,在收到病毒的基因序列后65天内,莫德纳公司就给第一个人体受试者接种了疫苗,并在277天后获得了美国食品和药物管理局的紧急授权。这一进步令人惊叹,要知道在此之前,人们开发疫苗的最短时间大约是4年。
在撰写本书时,相关人员正在对新冠病毒在实验室进行基因工程研究后意外泄露的可能性进行调查。围绕不成熟的理论存在大量错误的信息,因此我们的推论必须基于高质量的科学来源。然而,这种可能性本身凸显了一种真正的危险:真实情况可能会糟糕得多。这种病毒可能具有极强的传染性,同时也具有很强的致命性,因此不太可能是出于恶意而制造的。但是,因为创造比COVID-19更致命的东西的技术已经存在,AI驱动的对策对于降低人类文明面临的风险至关重要。
纳米技术:设计“广播”架构与“免疫系统”
生物技术中的大多数风险都与自我复制有关。任何一个细胞出现缺陷都不太可能构成威胁。纳米技术也是如此:无论单个纳米机器人的破坏力有多大,它都必须能够自我复制,才能造成真正的全球性灾难。纳米技术将使制造各种攻击性武器成为可能,其中许多可能具有极大的破坏力。此外,一旦纳米技术成熟,这些武器就可以以低廉的成本制造出来,而不像今天的核武库一样,需要大量资源来构建。(要粗略了解一些国家制造核武器的成本,可以考虑朝鲜的例子。据韩国政府估计,2016年朝鲜的核武器计划耗资11亿~32亿美元,这一年它成功开发了核导弹。)
相比之下,生产生物武器的成本可能非常低。根据1996年北约的一份报告,这种武器可以在几周内由5名生物学家组成的团队开发出来,费用为10万美元(2023年约为19万美元),而且不需要任何特殊的设备。就影响而言,1969年的一个专家小组向联合国报告称,以平民为目标的生物武器的成本效益大约是核武器的800倍,而且自那以后的50年里,生物技术的进步几乎可以肯定大大提高了这一比例。虽然我们无法确定未来纳米技术发展至成熟阶段将耗资多少,但由于它将采用与生物学类似的自我复制原理,我们可以将生物武器的成本作为初步的参考。由于纳米技术将利用AI优化制造过程,成本可能会更低。
纳米武器可能包括在不被发现的情况下向目标投放毒药的微型无人机,以水或气溶胶的形式进入人体并从内部撕裂的纳米机器人,或者有选择地针对任何特定群体的系统。正如纳米技术先驱埃里克·德雷克斯勒在1986年所写的那样,“长着‘叶子’的‘植物’并不比今天的太阳能电池更高效,它们可能会与真正的植物竞争,用不可食用的叶子挤占生物圈。顽强的杂食性‘细菌’可能会与真正的细菌竞争:它们可以像被吹散的花粉一样传播,迅速复制,并在几天内使生物圈化为尘土。危险的复制器很容易变得过于顽强、微小和传播速度太快,以至于无法阻止,至少是在我们没有做好准备的情况下。我们在控制病毒和果蝇方面已经面临着足够多的挑战”。
最常被讨论的最坏情况是可能产生的“灰色黏液”,这是一种自我复制的机器,消耗碳基物质并将其转化为更多的自我复制机器。这样的过程可能导致失控的连锁反应,有可能将地球上的所有生物都转变为这样的机器。
让我们来估算一下,地球上的所有生物被摧毁可能需要多长时间。可利用的生物量大约有1040个碳原子。[1]而单个正在复制的纳米机器人体内的碳原子数量可能在107个数量级左右。因此,纳米机器人需要创造出1033个自己的副本——我在这里必须强调,不是直接创造,而是通过不断复制。每“一代”的纳米机器人可能只会创造自己的两个副本,或者更少。数量如此惊人的原因在于这个过程,这个过程会通过副本和副本的副本一次又一次地重复。所以这大约是110代纳米机器人(因为2110约等于1033),如果之前几代的纳米机器人保持活跃,那就是109代。纳米技术专家罗伯特·弗雷塔斯估计,复制时间大约为100秒,所以在理想条件下,多碳的“灰色黏液”的清除时间大约为3小时。
然而,实际的破坏速度会慢得多,因为地球上的生物量并不是连续分布的。破坏速度的决定性因素将是破坏锋面的实际推进速度。由于纳米机器人体积很小,它们的移动速度不会很快,因此这种破坏过程可能需要数周时间才能蔓延到全球。
不过,分两个阶段攻击可以绕过这一限制。在一段时间内,一个隐蔽的过程可能会改变世界上的少部分碳原子,使得每1000万亿(1015)个碳原子中就有一个成为“休眠”的“灰色黏液”纳米机器人。这些纳米机器人的浓度很低,因此不会引起注意。然而,正因为它们无处不在,一旦攻击开始,它们就不必长距离移动。然后,在某种预定信号的触发下,也许是由少数纳米机器人自行组装成足够长的天线来接收远程无线电波,这些预先部署的纳米机器人就会在原地迅速自我复制。每个纳米机器人将自身复制1000万亿倍,只需要50次一分为二的复制,这只需要不到90分钟。此时,破坏锋面的推进速度将不再是限制因素。
有时,人们会想象这种情况是人类恶意行为导致的结果,比如一种旨在摧毁地球生命的恐怖主义武器。然而,这种情况的发生并不一定是出于恶意。我们可以设想这样的情况:由于编程错误,纳米机器人意外地开启了失控的自我复制过程。例如,如果设计不当,原本只能消耗特定类型物质或在有限区域内运行的纳米机器人可能会发生故障,导致全球性灾难。因此,与其试图在危险系统中添加安全功能,还不如限制只能构建在故障情况下也具有安全性的纳米机器人。
防止意外复制的一个有力的保护措施是将任何可以自我复制的纳米机器人设计成“广播”架构。这意味着它们不再携带自己的程序,而是依赖于外部信号来获取所有指令,这种信号可能是通过无线电波来传输的。这样,在紧急情况下就可以关闭或修改该信号,停止自我复制的连锁反应。
然而,即使负责任的人设计出了安全的纳米机器人,有恶意的人也有可能设计出危险的纳米机器人。因此,在这些场景成为可能之前,我们需要建立一个纳米技术“免疫系统”。这个免疫系统必须能够应对各种情况,不仅包括那些将导致明显破坏的情况,还包括任何存在潜在危险性的隐蔽复制,即使是在浓度非常低的情况下。
令人鼓舞的是,该领域已经在认真对待安全问题。纳米技术安全指南的存在已有约20年之久,最初源于1999年分子纳米技术研究政策指南研讨会(1999 Workshop on Molecular Nanotechnology Research Policy Guidelines,我参加了该研讨会),之后经过多次修订和更新。看来,免疫系统对抗“灰色黏液”的主要防御工具将是“蓝色黏液”(Blue Goo),这是一种能够中和“灰色黏液”的纳米机器人。
根据弗雷塔斯的计算,如果以最优方式在全世界范围内进行部署,88000吨防御性“蓝色黏液”纳米机器人足以在24小时内横扫整个大气层。但这一重量还不及一艘大型航空母舰的排水量,虽然数量庞大,但与整个地球的质量相比仍然非常小。不过,这些数字是建立在理想的效率和部署条件的假设之上的,而在实践中可能难以实现。截至2023年,由于纳米技术的发展还有很长的路要走,我们很难判断实际所需的“蓝色黏液”数量会与这一理论估计相差多少。
不过,有一点是明确的:蓝色黏液不能只使用丰富的天然成分(“灰色黏液”就是由天然成分组成的)来制造。这些纳米机器人必须由特殊材料制成,这样“蓝色黏液”就不会变成“灰色黏液”。要让这种方法稳健、可靠地发挥作用,我们还需要解决许多棘手的问题,以及一些理论难题,以确保“蓝色黏液”的安全性和可靠性,但我相信这终将被证明是一种可行的方法。从根本上说,我们没有任何理由认为有害的纳米机器人相对于设计精良的防御系统会占据绝对优势。关键是要确保在有害纳米机器人出现之前,在全世界范围内部署好有益的纳米机器人,这样就可以在自我复制链式反应失控之前及时发现并将其中和。
我的朋友比尔·乔伊(Bill Joy)在2000年发表的文章《为什么未来不需要我们》(Why the Future Doesn’t Need Us)中,对纳米技术的风险进行了精彩的讨论,包括“灰色黏液”灾难的场景。大多数纳米技术专家认为“灰色黏液”灾难不太可能发生,我也持同样的观点。然而,由于它可能导致物种灭绝级别的事件,所以随着未来几十年纳米技术的发展,我们必须牢记这些风险。我希望通过采取适当的预防措施,并借助AI设计安全系统,人类可以使这样的场景仅留存在科幻小说中。
人工智能:安全对齐,构建负责任的AI
由于生物技术的风险,我们仍然可能遭受如新冠疫情这样的大流行的影响。截至2023年,这场大流行已经在全世界造成了近700万人死亡。但我们正在开发快速对新病毒进行测序和开发药物的方法,以避免威胁人类文明的灾难。对于纳米技术,虽然“灰色黏液”还不是一个现实威胁,但我们已经有了总体防御策略,应该可以抵御其攻击,甚至是最终的两阶段攻击。
然而,超级智能AI带来了与“灰色黏液”有着本质区别的危险,事实上,这也是我们未来要面对的主要危险。如果AI比人类创造者更聪明,它可能会找到绕过现有的预防措施的方法。对于这种情况,没有任何通用策略可以完全防范。
超级AI带来的危险主要可以分为三大类,通过针对每一类进行重点研究,我们至少可以降低风险。第一类是误用,即AI按照人类操作者的意图运行,但这些操作者故意利用它来伤害他人。例如,恐怖分子可能利用AI在生物化学方面的能力设计出导致致命大流行的新病毒。
第二类是外部失准(Outer Misalignment),指的是程序员的真实意图与他们为实现这些意图而教给AI的目标之间存在不匹配的情况。这是关于精灵(Genies)的故事中描述的经典问题,即很难向那些按字面意思理解你命令的人准确说明你想要什么。设想一下,程序员想要治愈癌症,所以他们指示AI设计一种病毒,可以杀死所有携带某种致癌DNA突变的细胞。AI成功地做到了这一点,但程序员没有意识到这种突变也存在于许多健康细胞中,因此这种病毒会杀死接受治疗的患者。
第三类是内部失准(Inner Misalignment),它发生在AI为实现特定目标而学习的方法导致不良行为时。例如,训练AI识别癌细胞独有的基因变化可能会揭示一种在样本数据上有效但在现实中行不通的错误模式。也许在分析之前,训练数据中的癌细胞比健康细胞储存的时间更长,AI学会了识别由此产生的细微遗传改变。如果AI根据这些信息设计出一种能杀死癌症的病毒,它在活着的患者身上就不会起作用。这些例子相对简单,但随着AI模型被赋予越来越复杂的任务,检测失准将变得更具挑战性。
有一个技术研究领域正在积极寻求方法来防御后两种AI失准的情况。尽管还有大量工作要做,但已经出现了许多有前景的理论方法。“模仿泛化”(Imitative Generalization)是指训练AI模仿人类如何进行推理,以便在不熟悉的情况下应用其知识时更安全、更可靠。“通过辩论来保证AI的安全”(AI Safety Via Debate)是指利用互为对手的AI指出彼此想法中的缺陷,帮助人类判断过于复杂而无法在没有帮助的情况下进行适当评估的问题。“迭代放大”(Iterated Amplification)是指使用较弱的AI来帮助人类创建定位良好的更强大的AI,并重复此过程,最终形成比没有帮助的人类所能调教的更强大的AI。
因此,尽管AI对齐问题非常难解决,但我们不必独自面对它,通过利用正确的技术,我们可以借助AI本身来显著增强自己的对齐能力。这一点也适用于设计能够抵御滥用的AI。在前文描述的生物化学示例中,一个经过安全对齐的AI必须能够识别危险的请求并拒绝遵从。除此之外,我们还需要设立防止滥用的道德防线,即支持安全、负责地部署AI的强有力的国际规范。
随着过去10年AI系统能力的显著提升,限制因滥用而带来的危害已经成为全球更大的优先事项。过去几年里,我们看到了世界各国为AI制定道德准则的一致努力。2017年,我参加了阿西洛马有益AI(Benefical AI)会议,该会议的灵感来自40年前在类似会议上制定的生物技术指南。会上确立了一些有用的原则,我已签署遵守。然而,我们仍然不难发现,即使世界上大多数国家都遵循阿西洛马会议的建议,那些持有反民主、反对言论自由观点的国家、地区或群体仍然可以利用先进的AI来实现自己的目标。值得注意的是,主要军事大国尚未签署这些指南。而历史上,它们一直是推动先进技术发展的强大力量之一。例如,互联网就源自美国国防部高级研究计划局。
尽管如此,阿西洛马AI原则为发展负责任的AI奠定了基础,并正在推动该领域向积极的方向发展。该文件的23条原则中有6条旨在倡导“人类”价值观或“人性”。例如,原则10“价值观对齐”(Value Alignment)指出,“高度自主的AI系统的设计应确保其目标与行为在整个运行过程中与人类价值观保持一致”。
另一份文件《致命性自主武器宣言》(Lethal Autonomous Weapons Pledge)提出了相同的概念:“签署人一致认为,绝不应该把夺取人类性命的决定权交给机器。这个立场有一个道德层面,即我们不应该允许机器做出他人或者没有人为此负责的决定。”虽然史蒂芬·霍金、埃隆·马斯克、马丁·里斯和诺姆·乔姆斯基等有影响力的人物已经签署了这一宣言,但包括美国、俄罗斯、英国、法国和以色列在内的多个国家都拒绝了。
尽管美国军方不赞同这些原则,但它有自己的“人类控制”(Human Directive)政策,规定针对人类的系统必须由人类控制。2012年,五角大楼的一项指令规定:“自主和半自主武器系统的设计应允许指挥官和操作员对使用武力行使适当程度的人类判断。”2016年,美国国防部副部长罗伯特·沃克(Robert Work)表示,美国军方“不会把是否使用夺取人类性命的武力的权力交给机器”。不过,他也没有排除这样的可能性:如果有必要与一个“比我们更愿意将权力下放给机器的”对手国竞争,这项政策可能会在未来某个时候被推翻。我曾参与了制定这项政策的讨论,就像我在政策委员会指导实施以对抗生物危害的使用一样。
2023年初,在一次国际会议之后,美国发布了《关于在军事领域负责任地使用AI和自主技术的政治宣言》(Political Declaration on Responsible Military Use of Artificial Intelligence and Autonomy),敦促各国采取明智的政策,包括确保人类对核武器的最终掌控权。然而,正如其字面意义给人的感觉,“人类掌控”这个概念本身非常模糊。如果人类授权未来的AI系统“阻止即将到来的核攻击”,它应该拥有多大的自主权来决定如何做到这一点?值得注意的是,一个具有较高通用性、能够成功阻止此类攻击的AI系统,也可以被用于进攻。
因此,我们需要认识到AI技术本质上具有双重用途,既可以用于民用目的,也可以用于军事目的。即使是已经部署的系统也是如此。同一架无人机,在雨季道路不通无法抵达医院时,可以将药物运送到医院,但随后也可以向该医院投送爆炸物。十多年来,很多军事行动一直在使用无人机,其精确度高到可以将导弹发送到地球另一端的特定窗口。
我们还必须考虑,如果敌对军事力量不遵守《致命性自主武器宣言》,那么我们是否希望我方真的遵守。如果一个敌对国家派遣了一支由AI控制的先进战争机器组成的特遣部队,对你的安全造成了威胁,你难道不希望你方拥有更智能的能力来击退它们并保证你的安全吗?这就是“禁止致命性自主武器运动”(Campaign to Stop Killer Robots)未能获得关注的主要原因。截至2023年,除了中国在2018年表示支持该运动,所有主要军事大国都拒绝支持该运动。我自己的观点是,如果我们受到此类武器的攻击,我们肯定希望拥有反制武器,而这必然意味着违反禁令。
此外,随着我们在21世纪30年代开始使用脑机接口,在自己的决策中引入非生物学的辅助工具,在人类控制的背景下,“人类”最终意味着什么?非生物学部分的能力将呈指数级增长,而我们的生物学智能将保持不变。因此,到21世纪30年代后期,我们的思维本身将在很大程度上是非生物学的。那么,当我们自己的思维主要依赖非生物系统时,人类决策的作用何在?
阿西洛马AI原则中的其他一些原则也存在疑问。例如,原则7“失败透明性”(Failure Transparency):“如果AI系统造成伤害,应该能够确定原因。”原则8“司法透明性”(Judicial Transparency):“任何自主系统参与司法决策时,都应提供令人信服的解释,并由主管部门进行审核。”
努力提高AI决策的可理解性固然有价值,但核心问题在于,无论它们提供何种解释,我们都无法完全理解超智能AI做出的大多数决策。假设一个远超人类水平的围棋程序要解释其战略决策,即使是世界顶尖的围棋选手(在没有辅助系统的情况下)也难以完全理解。旨在降低不透明AI系统的风险的一个有前景的研究方向是“挖掘潜在知识”(Eliciting Latent Knowledge)。该项目旨在开发相关技术,确保当我们向AI提问时,它会告诉我们它所知的所有相关信息,而不是仅告诉我们它认为我们想听的内容。随着机器学习系统日益强大,这种只告诉我们想听的内容的倾向将成为日益严重的风险。
这些原则值得称赞的一点是,它们促进了围绕AI发展的非竞争性动态,特别是原则18“AI军备竞赛”(AI Arms Race):“应当避免致命自主武器的军备竞赛”,以及原则23“共同利益”(Common Good):“超级智能只应在广泛共享的伦理理想的指导下开发,并且要造福全人类,而不是为了某个国家或组织的利益。”然而,由于超智能AI可能在战争中起到决定性作用,并带来巨大的经济利益,军事大国将有强烈的动机参与军备竞赛。这不仅加剧了AI被滥用的风险,而且还可能导致人们忽视围绕AI对齐所需采取的安全预防措施。
回想一下原则10中提到的价值对齐问题。下一条原则“人类价值”(Human Value)进一步阐明了AI要遵循的价值观:“AI系统的设计和运行应与人类尊严、权利、自由和文化多样性的理想相兼容。”然而,仅仅设定这个目标并不能保证实现它,这恰恰说明了AI的危险所在。一个具有有害目标的AI可以轻而易举地辩称它的行为对于某些更广泛的目的是有意义的,它甚至可以用人们普遍认同的价值观来证明其行为的合理性。
限制任何AI基本能力的发展是非常困难的,特别是因为通用智能背后的基本思想是如此广泛。本书英文版付印时,有令人鼓舞的迹象表明,一些重要国家的政府正在认真对待这一挑战,例如2023年英国AI安全峰会之后发布的《布莱切利宣言》(Bletchley Declaration),但其成效将在很大程度上取决于此类举措的实际实施。一个基于自由市场原则的乐观论点是,迈向超级智能的每一步都要经受市场的检验。通用人工智能将由人类创造,以解决真正的人类问题,并且人们有很强的动机对其进行优化以实现有益的目的。由于AI是从深度整合的经济系统中出现的,它将反映我们的价值观,因为从重要的意义上讲,它就是我们自己。我们已经进入人机共生的文明发展阶段。最终,我们可以采取的确保AI安全的重要方法是,改善人类的治理水平,保护我们的社会制度。避免未来发生破坏性冲突的最佳方式是继续推进我们的道德理想。人类的道德理想在最近几个世纪和几十年已经极大地减少了暴力。
我认为我们还需要认真对待那些被误导的、越来越尖锐的卢德分子的观点,他们主张放弃追求技术进步以避免遗传学、纳米技术和机器人技术可能带来的真正危险。然而,面对人类的苦难,选择延迟克服仍然会造成严重的后果。例如,由于反对任何可能含有转基因物质的粮食援助,非洲的饥荒正在加剧。
随着技术开始改变我们的身体和大脑,另一种反对进步的声音出现了,那就是“原教旨主义人文主义”:反对可能改变人类本质的任何尝试。这将包括修改我们的基因和蛋白质折叠方式,以及采取其他延长寿命的根本性措施。然而,这种反对最终一定会失败,因为人们对能够克服我们1.0版的身体固有的痛苦、疾病和短暂寿命的治疗方法的需求,最终将被证明是不可抗拒的。
当人们看到可以大幅延长寿命的前景时,很快就会提出两种反对意见。第一种是担心不断扩大的生物种群可能会耗尽物质资源。我们经常听到,人类正在耗尽能源、清洁水、住房、土地以及其他支持不断增长的人口所需的资源。而当死亡率开始急剧下降时,这个问题只会更加严重。但正如我在第4章中所阐述的,当我们开始优化利用地球资源的方式时,我们会发现实际上它们比我们所需的要多出数千倍。举个例子,我们拥有的太阳能,几乎可以达到满足人类当前所有能源需求的一万倍。
对大幅延长寿命的第二种反对意见是,我们会因为几个世纪以来一遍又一遍地重复同样的事情而感到无聊。但在21世纪20年代,我们将通过非常小巧的外部设备来体验VR和AR,而在21世纪30年代,纳米机器人将直接连接到我们的神经系统,向我们的感官传递VR和AR信号。由此,除了极大地延长寿命,我们的生活体验也将得到极大的拓展。我们将生活在多样化的VR和AR中,唯一的限制将是我们的想象力,而我们的想象力本身也将得到拓展。即使我们能活几百年,也不会穷尽所有可以学习的知识和可以消费的文化。
AI是一项至关重要的技术,它将使我们能够应对当前面临的紧迫挑战,包括克服疾病、贫困、环境退化以及人类的种种弱点。我们有道德责任去实现这些新技术的潜力,同时降低其风险。但这不会是我们首次成功应对此类挑战。本章开头,我提到了儿时为应对潜在的核战争而经历的民防演习。在成长的过程中,我周围的大多数人都认为核战争几乎不可避免。然而,人类找到了克制地使用这些可怕武器的智慧,这一事实表明,我们同样有能力以负责任的方式使用生物技术、纳米技术和超级智能AI。在控制这些风险方面,我们并非注定失败。
总的来说,我们应该持谨慎乐观的态度。虽然AI正在带来新的技术威胁,但它也将从根本上提升人类应对这些威胁的能力。至于AI被滥用的问题,由于这些技术将提高人类的智力,不管我们的价值取向如何,所以它们既可用于造福人类,也可能带来危害。因此,我们应该努力创造一个AI的力量广泛分布的世界,这样AI的影响就能反映全人类的价值观。
附录一 卡珊德拉与库兹韦尔的对话: 2029 年之前, AI 将全面超越人类
附录一 卡珊德拉与库兹韦尔的对话:2029年之前,AI将全面超越人类 卡珊德拉:你预测,具有较强处理能力的神经网络能够在2029年之前在所有能力方面超越人类。
库兹韦尔:没错。它们已经在一项又一项能力上超越了人类。
卡珊德拉:当它们做到这一点时,它们将在人类掌握的每一项技能上都远胜于人类。
库兹韦尔:是的。它们将在2029年之前全面超越人类。
卡珊德拉:为了通过图灵测试,AI必须被设计得没你想象的那么智能。
库兹韦尔:是的,否则我们就会发现它们不是能力未经强化的人类。
卡珊德拉:你还预测,在21世纪30年代早期,脑机接口技术将有办法进入大脑内部并连接到新皮质的顶层,既可以知道大脑中正在发生什么,也可以触发连接。
库兹韦尔:没错。
卡珊德拉:好吧,但是这两项进展,一是使神经网络掌握人类都能做的事情,二是通过有效的双向连接与大脑内部相连,分属于完全不同的领域。
库兹韦尔:嗯,你说得对。
卡珊德拉:其中一个领域涉及计算机实验,这在很大程度上是不受管制的。实验可以在几天内完成,突破可能接踵而至,进展非常迅速。但是,像在大脑中植入涉及数百万个连接的附件完全是另一回事。它需要各种各样的监督和管理。这不仅是要将异物放入人体,而且是要放入大脑本身,这可能是身体上最敏感的部位。而且在监管者看来,这种做法是否有必要尚不明确。如果我们能够借此预防某种严重的脑部疾病,可能会带来显著的益处,但要实现与外部计算机的连接将是非常困难的。
库兹韦尔:但这终究是会实现的,部分原因是要去治疗你提到的严重脑部疾病。
卡珊德拉:是的,我也认为这是可能的,但在时间上可能会大大推迟。
库兹韦尔:这就是为什么我预测它会在21世纪30年代实现。
卡珊德拉:但是,任何关于将异物植入大脑的监管规定都可能会使其推迟,比如推迟10年,到21世纪40年代。这将极大地延后你的超级智能机器与人类交互的时间表。其中一件事是,机器可能会接管所有的工作,而不仅仅是成为人类智能的延伸。
库兹韦尔:嗯,直接在我们大脑中植入思维扩展装置会很方便,这样你就不会像丢失手机一样弄丢它。但是,即使这些设备还没有直接与大脑相连,它们仍然可以作为人类智能的延伸发挥作用。如今,孩子们可以通过移动设备获取全人类的知识。而且AI所能增加的工作岗位仍远多于它所取代的。尽管目前的脑部扩展装置在体外,但如果没有这些装置,我们现在所从事的工作将无法完成,即使它们尚未在物理层面连接到我们的大脑。
卡珊德拉:是的,但你预测我们需要数百万个电路才能连接到新皮质的顶层。相比之下,通过外部设备扩展我们的智能需要从键盘输入,速度要慢几个数量级。这肯定会大大影响人机交互的效率。而且,AI为什么会愿意与沟通速度如此之慢的人类打交道呢?它完全可以自己做所有的事情。
库兹韦尔:到21世纪20年代中期,我们将拥有一种比键盘输入快数千倍的与计算机交互的方式:完全沉浸式的VR,带有全屏视频和音频。我们将看到和听到现实世界,但它将与我们的计算机进行双向交流。这几乎与直接连接大脑新皮质的顶层一样快。VR最终将取代键盘交互。
卡珊德拉:我们与计算机通信的能力会有所提升,但这仍然不能等同于真正扩展我们的新皮质。
库兹韦尔:但人们仍然需要完成工作以满足食物、住所和其他需求。即使在大脑内部扩展器让我们能够进行更抽象的思考之前,配备先进AI的外部大脑扩展器,也能让我们完成困难的任务并解决难题。
卡珊德拉:但人们需要更深层次的目标。如果AI能在每个智力领域做到人类能做的一切,而且做得比最优秀的人类好得多,速度也快得多,那么人类还要做什么才能获得意义感呢?
库兹韦尔:嗯,这就是为什么我们想要与我们正在创造的智能融合。AI将成为我们的一部分,所以这些事情实际上都是我们来完成的。
卡珊德拉:考虑到在我们的头骨内植入一个具有数百万个连接的设备所面临的非凡挑战,我仍然担心获得一个大脑扩展器可能会延迟10年之久。我可以接受我们身体外部发生的各种变化,包括VR,但这与真正扩展大脑的新皮质是不同的。
库兹韦尔:这正是丹尼尔·卡尼曼表达的担忧,他还担心失业人员和其他方面之间可能会爆发暴力冲突。
卡珊德拉:你说的“其他方面”是指计算机吗?因为计算机将在各方面的技能上都超过人类。
库兹韦尔:不是计算机,因为我们的福祉将依赖于计算机,而是那些可能被认为利用AI来增加自己的财富、扩大自己的权力、牺牲失业工人利益的人类。
卡珊德拉:是的,我怀疑卡尼曼考虑到的是中间阶段,在这个时期,一些人类仍握有权力,而AI还没有创造足够丰富的物质来消解冲突。
库兹韦尔:但是当人们有目标感时,冲突就可以最小化。将我们的新皮质扩展到云端对于人类保持目标感至关重要。就像几十万年前,人类的灵长类祖先的大脑皮层越来越多,可以从思考生存本能提升到思考哲学一样,“进化”的人类将拥有更强的同理心和道德感。
卡珊德拉:我同意,但是与更好的大脑外部扩展器相比,将新皮质扩展到云端是一种完全不同的进步。
库兹韦尔:是的,你的观点是正确的,但我确实认为我们将在21世纪30年代初实现新皮质的扩展,所以中间阶段可能不会很长。
卡珊德拉:但是连接到新皮质的时间点是一个关键问题。如果延迟,可能会带来巨大的问题。
库兹韦尔:嗯,是的,这是事实。
卡珊德拉:另外,如果一个AI要模拟你,我们用模拟者取代了生物学上的你,它可能看起来就是你,在其他人看来也是你,但实际上你已经消失了。
库兹韦尔:好吧,但我们不是在讨论这个。我们不是在模拟你的生物大脑,而是在给它添加东西。你的生物大脑会保持原样,只是智力会变得更高超。
卡珊德拉:但是非生物智能最终将比你的生物大脑强大许多倍,甚至达到数千到数百万倍。
库兹韦尔:是的,但是你的大脑中没有任何部分被拿走,相反将会有很多东西被添加进来。
卡珊德拉:不过,你曾说过,几年内我们的大脑实际上将成为云端的延伸。
库兹韦尔:实际上我们已经在这样做了。无论你认为我们的生物大脑在哲学上有什么重要性,我们都不会剥夺它。
卡珊德拉:但是在那时,生物大脑将变得微不足道。
库兹韦尔:但它仍然存在,还将保留所有的基本特质。
卡珊德拉:嗯,我在很短的时间内看到了非常深刻的变化。
库兹韦尔:在这一点上我们是一致的。
附录二 价格 - 计算性能的未来走向
致谢
附录导读
01 人,比我们想象的要强大
作者:韦青,微软(中国)公司首席技术官
库兹韦尔用了两本书,一本是出版于约20年前的《奇点临近》,一本是放在我们面前的这本《奇点更近》,洋洋几十万言,无非想告诉我们一件事:讨论了这么多年的奇点时刻,真的快要到了!它的来临速度与冲击力,远比原来预想的还要迅猛与激烈!
奇点将至,重在行动
十几年前,当我头一次读到《奇点临近》时,就被作者的知识广度和作品中表达出来的深刻哲思与想象力所折服。库兹韦尔所阐述的宇宙进化六大阶段以及相关的数学、物理学、化学、计算科学、生物学、认知科学等领域的前沿成果,促使我开始重新思考一些时常挂在嘴边,但似乎从未认真深究过的概念,比如何为物质、能量与信息?再比如何为意识、何为智慧?最后还会不可避免地回归到那个全人类的母题:何以为人,也就是“我是谁?”“我从哪里来?”“我将要到哪里去?”
如果站在今日人类的视角回顾当初,作者当时提出的事关人类文明形态下一步跃迁的GNR技术,即结合了信息与生物的基因技术(Genetics)、结合了信息与物理世界的纳米技术(Nanotechnology)和结合了人类知识与机器能力的智能机器(Robotics),在经历了20多年发展之后,被证明的确产生了远远超越大多数人想象的进步。其发展的速度,也暗合了作者始终强调的“加速回报定律”。那么,继续站在今天人类的视角,如果我们想要展望未来,本书中关于“人类迈向奇点的千年征程已经步入冲刺阶段”的所有阐述,不仅可以让我们学习与了解到更多前沿知识与技术可能性,还可以借助库兹韦尔的视角,重新检视我们本以为的与每个人和我们的后代都息息相关的未来到底会有哪些不同的可能性,在这些可能性中,我们又会扮演一种什么样的角色。
但是,正如人们常说的“知道并不等于做到,做到并不等于做好,做好并不等于做对”,对于每一个人而言,就算我们通读本书,吸收并掌握了书中介绍的所有知识与观念,我们还有一个终极的挑战,那就是:如何采取下一步行动!
与时俱进的思想引领与时俱进的行动
人类的行动由人类的思想指引,而思想又是通过分析判断人类大脑接收到的信号而形成观点和下一步的行动方案的。作为一个复杂的适应性系统,人类还会随时根据外部信号的实时变化而调整相应的目标与动作。这一切,都是运行良好的思想体系在发挥它的作用。正如库兹韦尔在前一本《奇点临近》“影响的盛装”一章引用的丘吉尔所述——“未来的帝国是思想的帝国”,在本书中,作者在第1章就开宗明义地声明“我将意识的基础归纳为信息……宇宙诞生起的六个发展时代或阶段,每一阶段都是基于前一阶段的信息处理而创造出来的”,而在第2章,作者又在第一句话中就指出“如果将宇宙的历史看作信息处理方式不断进化的故事,那么人类的篇章就是在这个故事的后半段展开的”。这里的关键词就是思想、意识与信息。
因此,大家不必局限于库兹韦尔提出的“奇点”这个名词,其本质,自始至终都有关于信息、思想、意识、智慧,都是人类如何利用机器的能力实现“身–心–灵”的升华。根据库兹韦尔的观点,在奇点来临时刻,是人类借助机器能力突破生物学上的弱点,实现自身的升华的时刻;当宇宙进化到第六阶段,则是人类智慧在全宇宙的体现。当然,在这个层面中涉及太多有关人类认知、意识、精神以及诸多尚未形成定论的有关科学、哲学与宗教领域的思考与判断,虽然至关重要,但是不可轻信盲从,读者们需要基于自身的信仰辩证地理解与吸收库兹韦尔的观点。
需要强调的是,从书中所描绘的奇点来临的第五阶段开始,一切都是作者基于自身视角对未来的预判,重要的是我们作为读者,在看完此书后,会如何根据我们自身的情况形成自己的观点,指引我们的行动。计算机领域有一个著名的说法:预测未来的最佳方式就是创造未来。我们要认识到,世界的变化是复杂的,现象的产生是概率性的,未来是无法完美预测的,而巨变的时代就在眼前,我们能否学会在不断试错过程中纠偏前行,是在这样一个变革时代生存与发展的前提条件。
这种不断纠偏前行的行动能力,需要的不仅仅是新知识的学习,比如阅读本书,还需要被称为成长型思维习惯的培养。所谓成长型思维,概念很简单,就是一种与时俱进的思维方式,不僵化,不教条,一切本着因人、因时、因地制宜的方法应对变化。只是人类这个物种并不擅长改变习惯,“勿意,勿必,勿固,勿我”,说得容易,能做到很难。但为什么还要强调这一点呢?因为我们面临的是一种僵化思维无法应对的挑战。
有些人可能以为,所谓的灵活机动就是随意改变,恰恰相反,真要做到灵活应变,反而先要明确什么是不能变的。在这个变动不居的时代,各种流派的思潮汹涌澎湃,如果没有坚定的信仰与人生观,很容易被各种似是而非、此消彼长的观点搞得精神错乱、信仰崩塌,最后搞得一生随波逐流、一无是处。在混乱的环境里,真正能够指导我们稳步前行的是我们发自内心真正相信的东西,可惜的是,正如本文接下来将要阐述的,在信息发达的社会形态里,认知上的随波逐流成为常态,真知灼见反而成了稀缺之物。
人类通过数十年的努力建立起覆盖全球的通信网络和数字化媒介,在网络中随时随地流动着的表征人类社会各种现象的数据流。这些数据流中承载了各种信息,其中的知识内容本应该用来帮助人类提升认知、坚定信仰、获取幸福和增长智慧。但是这种过于便利的信息生成与传播能力的负面效果就是随之而来的信息爆炸,而人类自身处理信息的能力尚未进化至与当前信息爆炸相适应的阶段,表现为我们的大脑还是处于因为信息稀缺而形成的“贪吃”信息状态,常常不加分辨地无节制摄取信息。就像人体无节制地摄取食物会引发诸如肥胖症、糖尿病和高血压等富贵病一样,人类的大脑也会因为无尽地摄取海量的信息,其中不乏虚假、错误或者缺乏知识养分的垃圾信息,而引发各种精神疾病。
机器的进步本来是要帮助人类的,信息机器的进步本来是要帮助人类增长智慧的。“知其雄,守其雌”,本书介绍了许多因科技进步,尤其是因基因技术、纳米技术和智能机器的进步而带来的诸多好处,但是每一个人类个体是否有能力和机会获得这些益处,同时避免这些益处的负面效果,已经不仅仅是机器的能力问题,还需要人类继续进化自身的信息处理能力。
能够进入思想宝库并不等于能够习得宝藏级的思想
《奇点更近》是一本知识面覆盖广泛的作品,要想完全理解并掌握本书的要义,除了阅读本书,还可以根据书中所涉及的各类学术概念与技术领域,把机器学习原理、心–脑研究与认知神经科学、人类意识研究与现象学等相关领域做进一步的深入探讨,当然最好把本书的前身,即库兹韦尔约20年前写就的《奇点临近》再重温一遍,比较一下作者总结的GNR技术的变化,会对我们理解当下和展望未来有莫大的帮助。
库兹韦尔以其作为未来学家、科学家与企业家的独特视角、阅历与学术背景,在他的作品中将诸多与人类命运密切相关的前沿技术做了清晰的分类、整理与介绍,有助于我们高效、迅速地掌握技术发展的最新成果与未来趋势。但是即便如此,如前面谈及的有关复杂性与概率性的观念,在这样一个文明范式转变的时代,真相常常以多维度的角度展现在不同人的面前,因此我们每一个人其实都是在“盲人摸象”,仅仅靠一家之言很难描绘出正在变化的世界全貌。我们每个人无论学识多么渊博,也有必要借鉴“小马过河”寓言的启发,不盲从权威,以实证的精神走出适合自己的道路。
因此,基于本书的知识体系,我还想提出几点注意事项作为本书内容的注脚,希望我们共同以先哲们提出的“博学之,审问之,慎思之,明辨之,笃行之”的学习之法与“好学近乎知,力行近乎仁,知耻近乎勇”的修身之法,融会贯通,不仅获得新的知识,更重要的是获得新的思维能力。我们即将或正在进入的是一个被称为信息时代的人类社会发展阶段,奇点虽然即将到来,这是一个信息时代的现象,但如果我们没有针对信息时代的特点提升人类理解与利用信息的能力,还在用工业文明的思想考虑信息文明的问题,那么就算奇点来临,也与我们关系不大。要知道,在人类文明从农业文明进入工业文明时,有太多的文明形态,不是因为不具备工业文明的能力,而是不具备工业文明的思想,而被淘汰于人类的历史长河之中。
真-假-虚-实:信息爆炸的代价
库兹韦尔在两本有关“奇点”的作品中,都在强调我们所面临的其实都是有关信息的问题。无论我们探讨的是“数字化”、“智能化”还是“信息化”,最终都是人类文明形态从农业文明、工业文明再到信息文明后所面临的挑战与机遇,其本质是在理解、掌握和利用“物质–能量–信息”宇宙三要素之间的关系与转化。在这个通信发达和信息爆炸的时代,我们每时每刻都在受到无穷无尽的信息的冲击。大家不缺各类“标准”答案,缺的是适合我们自身情况与条件的问题和针对这种问题的“合适”答案。对于每一个群体与个体,只有确定了真正的问题和目标,对群体而言还要对发展方向达成共识,才能够找到适合各自条件的解决方案,并依此指导和评估下一步的行动与结果。因此,我们每一个人都需要建立起与信息时代相匹配的辩证思维、批判精神与实践能力。
在信息化高度发达的社会形态下,我们除了面临寻找到正确问题与合适答案的挑战,还面临虚假信息与错误信息的干扰。根据通信与传播原理,在充斥了信号与噪声的媒体环境里,如何确保一条消息能够无损与保真地从发送方传播到接收方面前,并能够被接收方无歧义地理解,几乎成为一个不可能完成的任务。
诺贝尔经济学奖与图灵奖双料得主赫伯特·西蒙(中文名为司马贺)曾经强调,“信息过载的时代也是注意力稀缺的时代”。由于数字化媒体的普及和发达的通信技术,再加上因为生成式AI技术的进步而导致的机器生成内容泛滥,人类为了高效沟通而建设的通信网络已经被远超全体人类所能够处理和理解的海量信息所淹没。其中“真–假–虚–实”内容交相纠缠在一起,每一条讯息在每时每刻都在试图争夺人类的关注度,而获得关注度的捷径就是对于现象的夸大其词,直至无视真相的无中生有。
在这种信息传播的逻辑下,信息本身所承载的内容是否真实已不重要,信息传播的使命从传播世界的真相变成传播需要人类看到的“真相”以及人类想看到或自以为看到的“真相”,这种“真相”大多成为虚假陈述真相的幻象和假象。从人类利益角度而言,我们需要的不是海量信息,而是能够真实与正确表征世界的信息。这种信息还需要以高效和准确的方式承载能够被人类接受、消化与理解的有益知识,这样人类才有可能通过知识与实践引导自身智慧的增长,从而进一步升华人类的精神境界。从社会发展角度而言,为了保障人类社会能够进化至以信息健康流通为代表的下一个文明发展阶段,人类社会需要提升对于“真–假–虚–实”信息的鉴别能力,建立起覆盖信息全生命周期的验证与确认机制,保证人类社会中流通的信息在生成、传播与接收过程中的真实性与及时性。否则,如果任凭机器生成信息的泛滥,人类社会极易陷入谣言横行、真相缺失的混乱窘境。
重构信息时代的文明
在一个信息技术普及的社会中,信息的力量是一个与物质与能量相等同、对人类的思想和行为范式造成重大影响的社会力量。人们时常以“新一轮工业革命”或者“第四次工业革命”来指称这一轮的技术进步,这种定义方式虽然能够描述这一轮信息技术进步对于农业与工业产生的巨大影响和促进作用,但是这种定义方式不足以表明这一轮信息技术进步对于人类思想、文明传承以及国家、民族、企业与个体生存和发展基本范式产生的巨大冲击。与其将这一轮的技术进步称为一场工业革命,更加符合其本意的说法或许应该是一场文明的重构。
这种重构的缘起与上一轮文艺复兴以及古登堡印刷机所起到的作用有相似之处,都有关因为信息的自由流通与知识平权而造成的社会与文明重构,但是其力度和广度,尤其是因为电子和量子计算机器的引入而形成的指数增长效应和生成式智能信息机器能力,都将是人类有史以来所发明的最强大同时也是最有可能发生不可控制的结果的变革源泉。上一轮文艺复兴之后,人类社会经过五六百年完成了宗教改革、科学革命、启蒙运动与工业革命,这一轮信息文明的重构力量又将使目前各种先进的、落后的、相关的、不相关的文明重新置于同一条新的起跑线上,借用库兹韦尔的技术进化“加速回报定律”的思路,人类将因为智能计算机器的参与而面临一个双倍指数增长的变革时代,其变化的速度与彻底性,是人类在其发展历史中首次遇到的如此巨大的挑战与机遇。
在这里补充一个题外话,库兹韦尔在《奇点临近》一书中专门留出一个附录解释何为双倍指数增长,并推导出的公式,其中t表示时间,W表示世界知识。但也有学者认为,人类所能够了解的世界是一个“人择世界”,是一个以人类能够观察与理解的现象为基础的世界。这个世界的增长规律,在一个狭窄的时空域内,可以表现为增长曲线无限加速上扬的指数级增长,但放到一个更宏观的时空域来看,则是一个S形的逻辑回归函数,在急速增长阶段之后,马上会出现停滞的增长平台期,其简化版本的公式就是机器学习中常见的Sigmoid激活函数。虽然这两种矛盾的观点孰是孰非尚无定论,但是它们都有其适用的前提条件,核心问题不是增长是否有极限,而是支持无限加速增长的前提条件是否存在。依据这种思维逻辑,只要能够遵循合理的论证流程,一旦把支持某种结论为真的前提条件论证清楚,其结果也就自然明了。这虽然是题外话,由于人类技术越往前发展,越会接近无人区,都是一些前人没有走过的路,也越来越难以就下一步该向何处去而达成共识。以上这种理性推理方式,就可以帮助大家基于各自观察与掌握的信息,形成自己的观点。
理解信息的真正力量
除了本书中所预言的各种奇点临近的可能性以外,这一轮技术的进步对于人类思维范式的转变也带来了巨大的挑战。众所周知,拥有与时俱进的思想能力远比拥有先进的技术能力更加难以实现。人类先天的各种思维偏差会误导我们倾向于应用过去的成见来理解全新的未来。我们的固有经验越完备,越会成为我们主动理解与掌握新生事物的障碍。
信息时代的核心挑战是人类对于信息力量的认知。信息可以通过改变人类的思想而改变人类利用物质与能量的方式。但是就像农业时代的人类很难理解工业时代以蒸汽机和电动机为代表的动力源泉,大多数信息时代的人类还是以物质或能量的角度理解信息,而低估了信息本身就是一种改变物质和能量的力量,也是改变社会的力量。
信息时代的一大特征是任何实体,无论是文明形态,还是群体或个体,都需要通过建模的过程表征为数字化的信息,这类信息以数据的形式被机器所学习。在发展完备的信息社会中,具备学习能力的智能信息机器充当了人类知识的继承者与传播者,所有新人类都会通过具备人类全部知识的智能机器完成学习任务。能够被智能机器学习到的知识就是未来人类社会主流的知识。所有有关人类文明与人类群体和个体的记忆,都将以知识的方式传承下去。如果智能信息机器没有学习到表征某种文明或群体和个体的数据,这种文明或群体和个体就会在数字空间中慢慢式微,而在数字空间的式微,又会使得这种文明或群体和个体在数字时代原住民日益占据主流的社会中慢慢消失于人类的视野。在指数级进步的数字化技术推动下,各种文明和其中的国家或族群,要么能够得以重构与复兴,继续在人类文明舞台上占有一席之地;要么如同上一轮文明范式变革所发生的一样,又会有若干种文明由于代表其文明内涵的信息没有被遍布世界各地、具备学习能力的机器所学习,而在数字空间慢慢式微,进而慢慢消失于人类社会的发展历史中。
数据产生价值的前提
作为信息社会的一员,除了理解文明传承与信息之间的关系,还要理解信息与承载信息的数据作为一种生产要素能够产生价值的前提。信息与物质和能量最大的不同在于,信息需要流通之后方能通过信息接收方思想与意识的改变而产生现实的作用。根据DIKW[即Data(数据),Information(信息),knowledge(知识),Wisdom(智慧)]信息金字塔理论,承载信息的数据只有在转化为知识后才能够对人类社会产生影响。
没有意义的数据是没用的数据:数据十分重要,被喻为“数字经济的石油”。这种比喻的本义指的是石油的确很重要,但是其本身并没有太多直接用处,石油需要提炼为柴油、汽油方能为机器使用;只有建立起化工产业才能让石油提炼后的副产品继续发挥它的作用。同样的道理,数据看似重要,但是数据本身的“含油量”,也就是数据中所蕴含的信息量更为重要。这就需要在生成和收集数据之前,对数据进行有效建模,使得数据能够表征物理世界中的某种现象,产生相关的意义,而这种意义就是信息的价值。因此,如果仅仅是拥有和存储大量数据,而不考虑数据中可能表征的信息,就有可能陷入拥有大量“贫油量”数据的陷阱。对人类社会“人–事–物”的统一建模以及建模标准遵循“书同文,车同轨,行同伦”原则,是拥有信息文明建设所需数据的根本保证;积极参与全人类数字化文明建设和全人类知识的数字化标准建设是任一文明得以弘扬及存续的必要条件。
未经流通应用的数据是没有价值的数据:富含意义的多维度数据经过综合处理后才能够产生有效的知识。如同精确的天气预测不能只依靠时序的温度、湿度、风向、风速与云况的数据,还需要大量的横向比对数据。在实际应用中,任何一个群体与个体都无法具备足够多富含意义的多维度数据以实现数据转化为知识后的高效应用,这就需要全社会,尤其是跨行业、跨部门之间形成顺畅的数据流转机制。数据在未经流通之前没有价值,一经流通并被利用之后也会贬值,真正能对社会产生贡献的是从含有意义的数据在实时处理中得到的知识。诺伯特·维纳在《人有人的作用》中指出,“在变动不居的世界中,能把信息储藏起来而不使其严重地贬值,这种想法是荒诞的……信息,更重要的是流通”,这是一种信息文明社会中对于数据与信息价值的理解与判断,有异于农业与工业文明社会中依靠占有物质与能源而形成生存与发展优势的思维范式。
坚守和发扬人性的光辉
谈及人类终极命运的作品常常引用狄兰·托马斯的著名诗篇:“不要温和地走进那个良夜……怒斥,怒斥光明的消逝。”诺兰的《星际穿越》如此,库兹韦尔的奇点系列亦如此。作为最后的总结,奇点理论涉及而没有充分展开的话题,即库兹韦尔所说的奇点来临后的第五与第六阶段,其实是我们每一个人都需要认真思考的话题。
按照当前认知科学的主流观点,人类是依据“眼、耳、鼻、舌、身”的五感,或者被科学家更加细分的30多种人类能够察觉到的感受而形成的电化学信号,通过神经的传导至大脑进行相应的信号加工与处理,从而产生意识的;人类的行动能力则来源于大脑通过神经发出的电化学信号驱动肌纤维形成的收缩与舒张作用。这两种意识生成能力和人体行动能力都正在被同样具备环境感知、信号传输与处理和行动能力的机器所赶超,只不过对于机器而言,传感器代替了人类的感觉器官,通信网络代替了人类的神经,人造神经网络代替了脑神经,电机代替了人类的肌纤维,电子的流动代替了三磷酸腺苷的生成与转化。按照这条路做下去,很难想象机器不会最终全面超越人类,也因此产生很多有关人类未来的悲观论调。但是,人类真的就只是这么简单的构成吗?
当人们开口闭口都是图灵之时,有没有想过维纳、罗素、哥德尔、王浩所思考的问题?当人们开口闭口谈论大脑机制的同时,是否也会思考一下久未提及的心脑连接和肠脑连接?我们有没有思考过科学理论,从本质而言是一种归纳逻辑,只提供“是什么”(What)与“如何做”(How),并不承诺提供“为什么”(Why),那么在这样一个事关全体人类未来的重大问题上,是否只能由计算机科学家推动?哲学家呢?如果哲学家因为不具备最先进的科学知识而无法提供有科学依据的观点,我们有没有思考过为什么哲学家不可以同时也是科学家、计算机学家呢?要知道,上一轮人类科学革命的先锋人物,大都同时是哲学家、艺术家或神学家,从何时开始,人类自以为科学、哲学、艺术与神学是分裂的呢?为什么非要非此即彼,而不可以互相借鉴呢?这种种的问题,其实都指向了人类生存与发展的根本问题,即“何以为人”以及“何以益于人”。
到目前为止,人类并未就此问题达成共识,也因此,我们每一个人,作为人类群体的一分子,都有必要,也有责任参与这个事关人类未来,直接影响到我们将为下一代人留下一个什么样的地球的探索与实践。这个责任已经无法推卸给别人或者下一代,我们这一代人就是当事人和“始作俑者”。如果我们这一代人甘心“温和地走进那个良夜”,而不是以自身的微薄之力,努力学习,努力实践,为自己,为旁人,也为了人类的未来探索出一条属于人类的未来之路,那么我们将如何回答库兹韦尔在本书中提出的灵魂之问:这场变革如何影响人类的身份和使命感?
“机器知能,能所之辨;如影随形,虽有非实”
相比于《奇点临近》,《奇点更近》的最大不同在于对于超级AI与人类融合的分析与判断,由于我的工作关系,我花费了大量精力与时间学习和实践有关AI在人类工作、学习与生活领域的应用。越是研究深入,越认识到人工智能这个名称本身所带来的歧义性与误导性,就像库兹韦尔在本书中第2章所介绍的,尽管近70年前约翰·麦卡锡将这个新兴科学领域命名为“Artificial Intelligence”(人工智能,简称AI),他本人对于“Artificial”这个词不是很满意,他的理由是使用“Artificial”似乎意味着这种智能并不是真实的。其实前文提到的赫伯特·西蒙曾经专门写过一本洋洋大作,书名居然是“The Sciences Of The Artificial”(人工科学),Artificial(“人工”)这个概念本身就值得写一本专著!而“Intelligence”更是一个充满歧义的名词,单就Artificial Intelligence的中文翻译而言,就起码同时存在“人工知能”、“人工智能”和“人工智慧”三种译法,那么我们真的已经对人类大脑表现出的能力达成共识了吗?
在我看来,起码在目前阶段,机器通过对数据的计算所表现出来的,更多是DIKW信息金字塔的理论所定义的知识的层面。知识是分立的、专业的、深入的、形而下的;智慧是综合的、融汇的、深刻的、形而上的。正是对于知识能力与智慧能力的混淆,再加上工业文明下的教育体系本就倾向于将人类培养为机器,重视培养人类的知识获取与记忆能力高过重视培养人类的智慧涌现与升华能力,因此当机器根据其计算和存储的优势而体现出远超人类的知识能力以后,人类就完全丧失了自信。当然,如果人类自我约束为一个知识机器,仅依靠博闻强记、精确执行的机械力来体现自身的价值,而不是通过创新试错、天真烂漫的本性发挥人类的特长,人类的世界迟早会被具备同类而又更为优秀能力的机器所吞噬。
但是从人类社会发展历程来看,人类这种物种具备顽强的生存能力与适应性,只是由于人类天性的懒惰,或者更精确地说是基于无尽追求能量节约的物种生存机制而造成的懒惰,人类在没有遭遇重大生存危机的情况下倾向于保守等待。好处是一旦生存风险超越某种阈值,人类通常会爆发出顽强的生命力,出现“山重水复疑无路,柳暗花明又一村”的人生风景。
这种转机不会凭空降临,需要人类理解人机融合历史潮流中所面临的真正问题,其实就是人机关系问题。考虑到未来的智能学习机器大都会学习到人类的整体知识,人类需要充分理解知识与智慧的关系,才有可能分清人与机器的关系。可惜的是,这个领域是人类还未充分研究、理解与掌握的领域。但是有一点是确定的,它与语言能力有关,与符号学有关,与实体–表象–精神有关,也与波普尔的世界三元组或皮尔斯的符号表征三元组有关,即与物理世界、精神世界和符号世界相关。一旦进入这个领域,我们或许可以尝试借鉴一下古人的智慧做一个总结,如本节标题所述,理解机器的潜能和未来的趋势,首先需要理解人类智慧的来源,才有可能定义机器具备的到底是智能还是知能,其本质是对于“能指”与“所指”的辨析。当然,古人给出了那个时代的答案,那就是所有的符号,包括通过符号表征的知识,也包括当前智能学习机器通过符号学习到的知识,这些都属于“能指”的范畴,它们都像影子一样追随着代表“所指”的形体,我的理解是,这种形体在概念上也应该包括广义的各种实体与现象。虽然这些能指符号看似与所指的现象一致,但可能都是虽有实空的假象。那么,对于机器而言,它到底学到了什么?对于人类而言,何为智慧?何为真相?何为真实?
打开这条思路之后,感兴趣的读者就可以在现象学与唯识论领域继续探索。依据这条路径的探索得到的不会是唯一解,也可能不会是最优解,但是以我自己的体会,这种跨界思路的开阔,可以促使我们在智慧的海洋面前更加谦卑,更加坚定继续在无尽宇宙内探索真相的决心与信心,可以让我们认识到在人类技术发展到这么初级的阶段就尝试下这么多断言,可能操之过急。人类在发展的过程中被逼入一个墙角,有可能是绝境,也有可能在墙角深处有一个小门正等待我们努力地推开,或许在这个即将被我们打开的小门背后,隐藏着人类继续探索宇宙奥秘的星辰大海。这种理解,也是本书中所提及的宇宙进化第六阶段的另一种解读,当然这是我的解读,如统计学家乔治·博克斯所言,“所有的模型都是错误的,只不过有一些是有用的”,重要的不是我的解读,也不是库兹韦尔的解读,重要的是你自己的解读,那么,你自己的观点是什么呢?
03 通向超人类未来的路线图
作者:芦义(Brilliant Phoenix合伙人,前微博平台负责人)
就在前不久,埃隆·马斯克的脑机接口公司Neuralink成功在第二名患者的大脑中植入了N1芯片。在知名科技播客节目Lex Fridman对其团队最新的采访中我们得知,N1植入物约为一枚25美分硬币大小,厚度仅9毫米,包含64根柔性的比人类头发丝还细很多的电极线,它们可以深入大脑内部的指定区域;这些细线每根上有16个电极,这次植入了1024个电极,比上一代多了4倍。
Neuralink被定义为一个可读取和生成生物电信号的通用通信平台。长远来看,它的目标是通过增加人类和机器之间的通信带宽,来改善AI与人类的共生关系,缩小双方沟通带宽的差距。当AI之间的交流带宽达到兆级别的时候,人类目前的交流速度就像对着树木说话一样缓慢。预计5年内,Neuralink电极数量和信号处理能力将大幅提升,可能达到每秒1兆比特的速度,远超人类目前的交流速度。高带宽的人机交互可能会改变人类的思维和交流方式,创造全新的交互模式。
这一突破性进展让我们看到了人类大脑与机器直接连接的曙光。不远的将来,我们可能通过思维来控制设备、提升认知能力,甚至直接下载知识到大脑。
试想一下,随着计算机不断自我进化,人类找到了与机器融合的方法。我们的大脑连接到了一个存储容量达百万PB (Petabyte)的神经网络。通过这个不断扩展的信息通道,我们经历了前所未有的提升,仿佛戴上了上帝的面具,成了机器中的灵魂。我们超越了人类的局限,成了能感知一切,甚至能感受到物质如何弯曲空间结构的存在。人与人之间的隔阂消失了,自我意识和灵魂融为一体。孤独和悲伤成了过去式。
这听起来像是科幻电影,但实际上正在成为现实。就像未来学家雷·库兹韦尔在其20年前的经典著作《奇点临近》中的预言:2029年左右,AI将达到人类水平,而在2045年左右,人类将迎来“奇点”——技术进步如此之快,以至于让库兹韦尔的预言都显得过于保守了……
在2022年11月底ChatGPT发布之后,我们目睹了生成式AI在接下来一年多内爆发式的发展。除了OpenAI之外,来自Anthropic、谷歌还有Meta公司的大语言模型都展现出惊人的能力,它们不仅能进行自然对话,还能创作文章、写代码、解决复杂问题,这让我们看到了AGI的雏形。库兹韦尔预言AI会在2029年通过图灵测试,但现在用过最先进的大语言模型的人都会相信这些AI已经能够完全骗过人类了。由于AI革命发生得始料不及,而且来得太快,库兹韦尔与时俱进地带来了他的新作《奇点更近》。这本书不仅是对前作的更新,更是对人类未来的全新展望。库兹韦尔认为,我们正处在人类历史上最重要的转折点,即将迈入一个全新的时代。
在这本新书中,库兹韦尔从更大尺度上描绘了宇宙与人类发展的六个阶段:
- 第一阶段(非生物):宇宙大爆炸后,基本粒子和原子形成,并演化了百亿年,为复杂生命的出现奠定了物理与化学基础,这是宇宙的奇点;
- 第二阶段(生物信息):RNA/DNA这样编码遗传信息的结构导致了可以自我复制的生命出现并进化,这个阶段持续了数十亿年,这是有机生物的奇点;
- 第三阶段(大脑):动物经历了数亿年进化出神经系统和大脑,能够存储和处理信息,最终演化出了智人这样具有复杂皮质层的高级智慧,这是智能生物的奇点;
- 第四阶段(工具):人类利用大脑创造工具和技术,例如电脑和AI,它们扩展了我们的能力,这个阶段只有几万年历史,这是智人的奇点;
- 第五阶段(人脑与AI的融合):我们正处于这个阶段的早期,通过脑机接口等技术将大脑与计算机连接,也许每隔几年我们的能力将会有一些阶梯性提升,这是下一个奇点;
- 第六阶段(宇宙觉醒):智能将扩展到整个宇宙,将普通物质转变为能进行高密度计算的“计算介质”(Computronium),进化将会以“秒”来计算。
库兹韦尔认为,我们正处于从第四阶段向第五阶段过渡的关键时期。在未来几十年里,技术进步将加速到前所未有的程度,彻底改变人类的生存状态。
AI的突飞猛进我们已经有目共睹,几乎所有的从事AI研究的专家还有处于这一领域前沿的公司,都乐观地预计,在21世纪30年代,AI将在所有领域全面超越人类。这将带来科技创新的爆炸式增长,改进医疗,加速科研,推进生物技术、纳米技术、新材料以及核聚变技术的解锁和进步。
到21世纪30年代,我们将能够重新编程人体,逆转衰老过程;纳米机器人将在体内修复损伤,维持健康。还有脑机接口的普及,就像Neuralink展示的那样,我们将能够直接连接大脑与计算机,这不仅能治疗各种神经系统疾病,还能极大提升我们的认知能力;随着VR和AR的成熟,我们将生活在物理和数字世界的融合之中,现实与虚拟的界限将变得模糊。库兹韦尔甚至大胆预测,到21世纪30年代后期,我们将能够上传思维,实现数字永生。所有这些技术的融合,将带来人类历史上前所未有的变革。这很科幻,也非常赛博朋克,但人类在科技加持之下,极有可能向碳基混合硅基的方向演化,我们将超越生物学的局限,成为后人类或超人类。我们的智能将呈指数级增长,最终达到“奇点”。
当然,这样的未来也伴随着巨大的风险和挑战。AI可能失控,纳米技术可能会导致无限复制的灾难,基因编辑也可能被滥用,让人类陷入进化的歧途。我们必须谨慎地发展这些技术,确保它们造福人类。库兹韦尔在书中也深入探讨了如何应对这些风险。《奇点更近》是一本令人着迷的未来学著作,库兹韦尔以其深厚的科技洞察力和大胆的想象力,为我们描绘了一幅激动人心的未来图景。无论你是否认同他的所有观点,这本书都会让你对人类的未来有全新的认识。
关于接下来会发生什么,我们无从得知。也许我们会像希腊神话中的泰坦巨人阿特拉斯一样,跨越每个星系,在浩瀚宇宙中孕育和照料新的生命。又或者,这种宏大的愿景只是源于我们内心的某种缺失,而这种缺失已经被无限连接所填补,使我们不再有探索宇宙的冲动。无论如何,这是一个非凡而令人欣喜的未来,一个“人类”似乎已经胜利的未来。但人类的本质已经被彻底改变。现在存在的生物,与曾经在非洲大草原上漫游或生活在纽约和孟买这样现代城市中的人类已经完全不同。也许这就是整个人类历史的终极目标:通过不间断的文明进程,最终使人类成为一个奇妙机器的一部分。也许这是人类心智与超级智能达成一致的唯一方式。尽管如此,我们仍然无法确定,在这场变革中,最终是人类赢了,还是机器赢了。