近年来,以大模型为代表的AI技术发展迅猛,掀起一波席卷全球的AI发展热潮。关注AI发展状况的人不限于AI的研发者、推广者和AI发展的评论者、人文社科研究者,更包括深感生活将被AI深刻影响的普通公众。AI发展的问题不再是纯粹技术问题,而是成为某一种意义上的公共议题。在最近OpenAI发布Sora、马斯克开源Grok等一系列相关事件中,这一点表现得很清楚。在各种相关公共讨论中,AI发展现状尤其受到关注,其中的基本问题是:当前AI发展的大方向是否有问题,未来应该朝什么方向前进。为此,组织计算机、经济学、马克思主义理论和哲学等领域的八位学者,对AI发展现在的状况进行跨学科反思以期抛砖引玉,求教于方家。
本系列文章共8篇,转载自《科学·经济·社会》2024年第2期,本文《理性看待AI的短期和长期影响》为第5篇。在文中,陈永伟认为AI是一种新的通用目的技术,能预见长此以往AI将对社会经济发展产生显著影响,但目前AI发展还处于“播种阶段”。
自2022年11月OpenAI发布ChatGPT之后,AI领域迎来了新一轮的发展热潮。在短短的一年多中,各种AI大模型如雨后春笋般涌现,其能力也实现了迅速升级和迭代。根据微软发布的评测报告,OpenAI开发的GPT-4模型已经在很多领域表现出了与人类似,甚至高于人类的智能水平,因而表现出了“通用AI的火花”。最近,由Anthropic开发的Claude-3模型更是在评测中展示出了比GPT-4更优的性能,并在智商测试中达到了101分,超过了人类的中等水准。此外,在创意工作方面,AI也表现得很出色。比如OpenAI新发布的Sora模型已能根据简单的提示,生成一分钟画质足以媲美CG动画的视频。
面对AI技术的快速地发展,关于AI将会对经济和社会持续健康发展产生多大的影响,就成了一个非常关注的问题。目前,关于这一个问题存在着两种截然不同的观点。一种观点认为,AI的影响将是颠覆性的,它不仅会让生产率实现革命性的提升,还会彻底改变社会经济的组织形态。当然,作为一股“创造性毁灭”的力量,它还会带来很多负面的影响,比如,AI对劳动力的大规模替代就可能引发严重的技术性失业问题。另一种观点则认为,AI的影响可能并不会如想象当中的那么大。持这种观点的人指出,历史上已经出现过几轮AI发展热潮,在每一轮热潮中,人们都对AI的影响作出了很高的估计,但事后的结果证明,这些预期最终都没有实现。在最近这一轮AI热潮中,虽然很多AI模型都表现出了卓越的性能,但它们形成的冲击则似乎仅局限在某几个狭小的领域。从全社会的范围看,它们的正面影响和负面影响都相对有限。
那么,在上述两种观点中,究竟哪一种才是正确的呢?要回答这样的一个问题,就需要先对AI技术的性质有一个清晰的认识。
研究技术对经济发展影响的经济学家经常将技术分为两类:“专用目的技术”(specific purpose technologies)和“通用目的技术”(general purpose technologies)前一类技术仅可以被应用于某个特定的领域,在这样的领域产生价值;后一类技术则可以在很多领域使用,并在这些不同的领域都产生价值。
历史经验表明,相比于专用目的技术,通用目的技术对经济发展的影响往往是更为本质的。比如,李普赛等人在《经济转型:通用目的技术和长期经济稳步的增长》一书中,就曾对通用目的技术在历史上发挥的作用进行过考察。他们总共分析了包括印刷术、蒸汽机、电力、内燃机在内的24种通用目的技术,根据结果得出,所有这些技术都对长期的经济发展以及经济结构的变迁产生了巨大的影响。由此能够得到一个推论:如果AI也属于通用目的技术,那么它就很可能在长期内对整个经济和社会产生十分显著的影响。
布雷斯纳罕和特雷顿伯格曾提出过一个判定通用目的技术的标准,根据这个标准,一项技术只有当满足“普遍适用性”(pervasiveness)、“进步性”(improvement)和“创新孕育性”(innovation spawning)这三项特征时,才可以被称为通用目的技术。普遍适用性指的是这种技术能被用作投入品被应用到很多不同的部门;进步性指的是这种技术的性能会跟着时间的推移不断地改进;创新孕育性指的是这种技术能在多个不同部门激发出相关的创新,从而带动这些部门的技术发展。应用这个判定标准,就可以对AI是否属于通用目的技术进行检测验证。下面,我们逐一对标准中的三个特征进行验证。
(1)普遍适用性。作为一种技术AI显然满足这一标准。在“深度学习革命”之后,AI技术进入到了很多行业。无论是工厂、商店,还是金融机构,人们广泛地使用AI来进行辅助决策。尤其是在以GPT为代表的生成式AI兴起之后,人们学习和使用AI的门槛逐步降低,这使得AI的应用有了更大的想象空间。在现实中,很多个人和企业已经将生成式AI应用到了自己的工作和生活当中。2023年8月,麦肯锡曾对企业的AI使用率进行过一次调查,结果显示被访企业中的55%已经使用了AI。由此可见,AI确实是一项普遍适用的技术。
(2)进步性。AI技术的进步性,表现在三个不同的方面。第一是AI模型任务解决能力迅速提升。以GPT模型为例:在2018年GPT-1推出时,其能力非常有限,对文字的逻辑分析能力非常弱,但仅仅五年之后,GPT-4就已经在语义识别、逻辑分析、问题解决等方面表现出了强大的能力。微软的研究人员曾让GPT-4做美国律师资格考试的试题,结果它获得了298分的高分,超过了90%的人类考生。第二是AI模型多模态能力的突破。在一年多前,AI模型通常仅能处理单模态的信息,比如GPT-3.5就仅能处理文本信息,但在短短的一年多内,多模态就慢慢的变成了AI模型的标配,像GPT-4、Claude-3、Gemini等主流的AI模型都已经具有了处理文本、图像、视频等多模态信息的能力。第三是AI模型成本的下降。随着AI模型的一直在优化,训练和使用模型的单位成本也出现了大幅度地下降。以调用GPT模型的API为例,现在的每Token成本已经比过去下降了90%。由此可见,在过去的一段时间内,AI模型的技术进步是十分明显的。能预见,只要有充足的算力予以支持,这种进步将会继续持续下去。
(3)创新孕育性。现在,AI慢慢的变成了一些领域的重要工作工具,在优化这些领域的工作流程、推进这些领域的技术进步方面发挥了显著的作用。反过来,这些领域的技术进步也促进了AI的进步,从而形成了一个良性的循环。目前,最能体现这种良性循环的案例是AI芯片的设计。由于AI芯片需要将数以亿计的电子元件排布到很小的硅晶片上,其设计精度要求已经远远超出了传统人力设计的能力范围,因此包括谷歌、英伟达在内的很多企业都已经用AI来辅助芯片的设计,并已经取得了不少的成果。反过来,这些用AI设计的芯片又能提供更为强大的算力,为AI模型的训练和应用提供了良好的基础。
综上所述,作为一项技术,AI完全满足了普遍适用性、进步性和创新孕育性这三项特征,因此它确实可以被认定为一种通用目的技术。根据历史的经验可以推测,它在长期内对整个经济社会所产生的影响将会十分巨大。
现在的问题是:既然从理论上讲,AI所产生的影响将十分巨大,那为什么到现在为止,它的影响似乎仍十分有限?要理解此现状,需要从通用目的技术的特性入手。
通用目的技术之所以可能对整个经济社会产生巨大的影响,是由于它可以渗透到各个不同的领域。因而,它的影响究竟能发挥到什么程度,将取决于它与各具体领域的结合程度,而这一切常常要相关基础设施的支持,以及将通用技术与专业应用相结合的努力。赫尔普曼和特雷顿伯格在研究中,曾把通用目的作用的影响力发挥分为“播种”和“收获”两个阶段。在“播种阶段”,支撑通用目的技术的相关基础设施尚未普及,它和相关行业的结合程度也相对较浅。在此阶段,通用目的技术并不会立即引发生产力的显著提升,其对社会的影响也比较小。到了“收获阶段”,随着相关基础设施的建成,和技术与相关行业的深层次地融合,通用目的技术的力量就会迸发出来。
由于通用目的技术影响的发挥具有这样的阶段性,因此从一种新的通用目的技术的出现到它的影响真正反映出来,通常会有一段较长的时间间隔。这一点,在历史上已经多次得到了证明。瓦特在1765年完成了对蒸汽机的改良,但到1830年左右,英国的蒸汽机动力总量仍只有16.6万马力,仅占当时全国总动力的1.5%。直到1850年,涡轮式蒸汽机的出现,才让蒸汽机真正成为一种既高效又廉价的动力来源,从而得到了广泛的使用。类似的,19世纪末人们就掌握了交流电的发电和传输原理,然而,在很长一段时间内,这对于其发明国美国的影响都微乎其微,直到1915年之后,全国性的电网陆续建成,各种电器被陆续开发出来,电力对美国经济的影响力才得以体现。
通过将目前AI的发展阶段与历史的经验作对比,我们显而易见:作为一种新的通用目的技术,当前AI的发展总体上依然处于“播种阶段”。尽管从表面上看,AI已经渗透到了各行各业,但总体上看,它们依然和行业本身的结合程度实际上并不深。比如,虽然一些工业公司宣称已经在工作中使用了AI模型,但其实这些AI模型只是用来帮助解决诸如客服等边缘性的工作,对其核心业务并没有产生实质性的影响。与此同时,与AI相关的基础设施,如算力中心、向量数据库等的建设现在依然十分不足,这在相当程度上制约了AI影响的发挥。正是在上面这一些因素的综合作用之下,才出现了AI对经济社会影响远低于人们预期的现象。
基于AI的通用目的技术属性,要让其对经济社会的潜在影响力得到充分地发挥,需要通过政策的手段,帮助这种技术迅速实现从“播种阶段”向“收获阶段”的转移。具体来说,如下几方面的工作是最值得重视的。
第一类基础设施是算力。无论是训练还是使用AI模型,都需要调用庞大的算力。在深度学习中,即使在算法层面没有进步,模型的性能也会随着参数量和训练数据的增长而大幅度改善,这一切都需要算力作为底层的支持。OpenAI在训练GPT-3模型的时候,就动用了上万块英伟达A-100GPU。正是在这种巨量的算力投入之下,才让GPT模型的性能产生了质的飞跃,甚至会出现了智能“涌现”的现象。不过,在市场上,能和OpenAI这样调动巨量算力资源的企业非常少见,大部分企业和个人开发者都只能依靠云端的算力资源来训练AI模型。虽然现在已有很多云服务商能够给大家提供AI算力,但在GPU等基础硬件总体缺乏的情况下,AI算力的可及性依然较低,使用成本仍然很高。在这种情况下,加强GPU等硬件的研发、增加云端的AI算力供给依然是亟待解决的问题。
第二类基础设施是存储设施。AI的大发展会带动巨大的存储需求。在需要存储的数据中,有相当一部分是非结构化数据。为了能更好地对这一些数据进行存储、整理和检索,就需要有新型的存储设施,如向量数据库的支持。从目前看,该类存储设施的供给依然存在着很大的不足,因而为推进AI的发展,仍需要对它们的建设予以某些特定的程度的扶持。
在通用目的技术的研发和推广过程中,通常会涉及许多不同的子系统。然而,这些子系统之间的行业标准通常会存在不一致,其发展速度也会存在不协调,而这很有可能会对技术的扩散造成负面的影响。在这种情况下,用政策协调相关的子系统,就可能对技术的扩散起到显著的助推作用。
具体到目前的AI发展,模型的基础原理都各不相同,它们彼此之间缺乏互操作性,这在相当程度上限制了不同模型之间的协同发展。在这种情况下,应当积极培育开源氛围,鼓励开发者对一些具有基础性的技术进行开源。同时,应当利用政策的手段,确保一些关键技术标准和数据交互标准之间的统一。这样,当开发者在某项AI技术领域取得突破后,这种技术突破就可以很快地实现扩散。
阿格拉沃尔等人在分析AI与行业的融合问题时,曾提出过两个概念:“单点解决方案”和“系统解决方案”。其中,“单点解决方案”指的是用AI来解决某个具体的问题,但保持总体的工作流程不变。比如,现实中用AI来替代一部分客服或文字处理工作,就属于对问题的单点解决方案。相比之下,“系统解决方案”指的则是用AI来重新设计整一个流程。例如,一些物流公司开始摒弃原来的以人为中心的调度,转而采用AI作为调度中枢,并据此对相关的岗位重新进行安排,这就是一种系统解决的表现。
容易看到,在“单点解决方案”,AI与行业的融合程度是较浅的,它虽能带来一些效率的提升,但幅度通常不会太大;而“系统解决方案”则要求AI与行业之间的深层次地融合,它能轻松实现生产效率的大幅度的提高。因此,要让AI的作用得到充分地发挥,就需要积极促进AI与行业的融合从“点解决方案”向“系统解决方案”的转变。
需要注意的是,当企业用AI对生产流程进行系统性变革时,不仅需要投入大量的成本,还可能面临不小的转型风险。在这种状况下,可优先考虑用政策进行一定的扶持,对公司的AI转型提供一定的补贴和帮助,让它们的转型变得更加顺利。
如果能做到以上几点,那么AI这种通用目的技术就可以更快地完成从“播种阶段”到“收获阶段”的跨越,其潜力也能更好地被激发出来。
值得注意的是,从历史上看,任何一种通用目的技术的发展在促进社会生产力的发展,给人类带来很多收益的同时,也会带来很多相关的问题。这一点,对于AI也不例外。事实上,现在此阶段,很多和AI有关的问题已开始显现了出来,而这样一些问题中,“技术性失业”无疑是最需要我们来关注的。
早在2013年,牛津大学的学者曾做过一个估算,认为在二十年内,美国的就业岗位中将会有47%可能被AI替代,其涉及的就业人口将达到数千万。在ChatGPT爆火之后,OpenAI的研究人员又做了一个类似的估算,认为美国80%劳动力的工作任务中的10%可能会被ChatGPT影响,其中19%的劳动力的工作任务可能有一半会被ChatGPT影响。这些研究结论在社会上引发了很大的关注,并引发了某些特定的程度的AI恐慌。
在笔者看来,对于上述的研究,我们应当理性地予以看待。历史经验告诉我们,技术虽然可能消灭一定的就业岗位,但与此同时,它通常会创造更多的就业岗位。比如,汽车的发展消灭了马车夫的岗位,但创造了更多的司机岗位。因而,从长期的视角看,我们无需对“技术性失业”过于恐惧。但是从短期看,由于新旧岗位之间的就业技能并不匹配,短暂的失业冲击确实是有几率存在的。比如,现在AI的发展可以让人们不再需要大量的插画师,但却会催生更多高端AI工程师的需求,从总体上看,岗位的增减可能是平衡的。但插画师显然不可能马上转成AI工程师,在此阶段,就也许会出现一定的失业。尤其是当AI与行业开始深度融合,对行业进行系统性变革时,失业率还可能较高。
目前,由AI引发的技术性失业已经在一些行业慢慢的出现。为了应对这种冲击,相关的政策就必须积极介入。这些政策包括并不限于:加强职业培训和再教育体系的建设、鼓励服务业、鼓励零工经济和共享经济的发展等。只有做好了这些工作,面对AI引发的失业潮才能做到心中不慌。
微软的创始人比尔·盖茨有一句名言:“我们总是高估在一年或者两年中能做到的,而低估五年或十年中能做到的。”这句话用来理解AI的影响是相当合适的。
作为通用目的技术,AI的技术属性决定了它可能在长期产生巨大影响,但受制于各方面的因素,它的影响在短期内可能并不明显。在这种情况下,我们应当积极用好相关的政策手段,促进AI技术正向影响的发挥;同时利用现在的时间窗口,针对其可能的负面影响建立起各种应对机制。如果做到了这样几点,就可以扬长避短,让AI技术更好地造福于人。