(相关资料图)

许余洁(山东产业技术研究院数字经济研究所首席经济学家)

2022年11月30日,ChatGPT横空出世,在全球范围内形成了热烈的讨论,成为现象级产品。它不但能够像人类那样即时对话,流畅地回答各种问题,从回答历史问题,到写诗歌讲故事和编程,甚至能够撰写商业计划书和行业分析,“几乎”无所不能。

微软公司联合创始人比尔·盖茨近期发文,谈及ChatGPT和生成式人工智能对教育、医疗、生产力提升、公平等等方面的影响时,明确表示AI时代已经到来,OpenAI发布的大语言模型ChatGPT是他一生中遇到的两项革命性技术之一。比尔·盖茨预言,在未来5到10年内,人工智能驱动的软件将最终彻底改变人们教学和学习方式。

如现在我们所见到的,ChatGPT使用了自然语言处理技术,通过对海量文本数据的训练,使其能够生成自然流畅的对话内容。国内外科技“大厂”如谷歌、百度、华为、腾讯、阿里、京东等巨头都已纷纷表示跟进开发,推出自己的大模型。面对ChatGPT这样的巨大进展,我们不禁要问,ChatGPT的关键要素有哪些?对我国数字经济的未来发展有何借鉴意义?笔者认为,关键要素包括数据、算法、算力资源和人才,具体而言:

首先,ChatGPT的一个重要因素是数据。GPT需要大量且多样的输入数据来训练,而这些数据对GPT的质量和效率均产生了重要影响,高质量数据或者说有效数据犹如原料资源,是大模型的基础。人工智能如ChatGPT,已经把数据应用到极致,赋能和创新了技术服务于社会发展、经济发展和科技发展的模式。数字经济中,数据作为主要的生产要素,正是因为数据已经从量变发生了质变,在这个基础上形成新的经济形态。

其次,ChatGPT利用了大量算力资源。算力资源的有效利用,可以帮助ChatGPT大模型在训练和部署上都变得更加高效。对于ChatGPT而言,为了加快训练速度、提高推理效率和增强系统可扩展性,需要由数千乃至上万台计算机组成的大规模计算集群、专门优化深度学习计算的GPU加速、如AWS、GCP、Azure等云计算服务以及高性能的分布式存储系统,最终实现更快的模型训练和更高的模型精度。据测算,支撑ChatGPT算力的基础设施需要上万颗如英伟达GPU A100或者更高端的芯片,一次模型训练成本超过1200万美元,对应需要科技“大厂”庞大的算力与网络资源。

第三,算法也是ChatGPT的关键要素之一。GPT是一个基于深度学习算法的模型,能够从大量输入数据中提取特征并预测输出。算法能够直接反映出变量之间的因果关系,对模型起到了至关重要的作用。预训练模型是人工智能研究的重要突破口,在对预训练模型的各种不同的技术评测中,算法性能展示了一个规律:数据规模越大、预训练模型参数越多,算法输出精度往往也越高。算法也是数字经济基础设施中非常重要的一部分,基础设施领域,“数据+算力+算法”日益成为数字经济的通用技术底座。汇集数字经济发展过程中收集的大量数据,集成多种应用场景,最核心的工作内容就是把人工智能算法做得更好,打造和建设算法平台基础设施,是未来释放数字经济新活力的重要方向。

最后,人才也是ChatGPT的重要因素。人才的创造力和创新精神是推动技术发展的关键,在ChatGPT大模型的开发中,有着一群技术精湛的研究团队进行了极为艰苦的研究和开发工作。值得一提的是,人才的影响是最难以量化的因素,尤其是具有多种特征的数字经济,发展过程中需要的是复合型人才,包括数字化领域的基础研发、应用技术与业务模式融合以及相关领域的治理型等方面的人才。

人工智能的发展,意味着数字化可以帮助很多行业取代人工,比如ChatGPT 在文字数据标记上的表现已经超过了人类工人。但就如制造业中的便宜人工,并不构成竞争优势一样,未来数据量大也不构成数字经济发展的竞争优势,高质量数据才是。资源,无论自然资源,还是人力资源,在技术进步之前,都没有价值。未开发的数据犹如海底石油,有了对应开发挖掘的技术,才有了价值增值。产业技术进步的两大动力,一是自然资源,依靠天然禀赋;二是组织化制度,需要人类智慧创新。总而言之,ChatGPT的几大关键要素也是数字经济发展的关键。未来,我国发展数字经济,最核心的是需要围绕高质量的“数据、算法、算力和人才”等关键要素与资源,创新组织与制度,推动数字经济进一步发展。

推荐内容