21世纪经济报道记者杨清清、实习生黄俊钧 北京报道

2023年,随着ChatGPT等应用的爆火,以生成式AI为代表的人工智能再度成为各界的焦点。

“从更长远的角度来讲,我们可以把2023年看作是AI领域令人振奋的一年,”5月10日,在2023年中国ICT市场趋势论坛(北京站)上,IDC中国区研究副总裁钟振山表示,“在这一年中,我们能够看到大量语言及图像模型的逐步成熟与推广,并看到新的AIGC产品及企业级应用共存,未来有望全面改写企业数字化进程的趋势。”


(资料图片仅供参考)

钟振山指出,生成式AI都是基于大模型的应用之一。根据IDC的定义,大模型是对原有算法模型的技术升级,基于海量数据开发预训练模型,到最终用户环境中使用少量数据即可获得比之前的算法模型更好的结果。

如今大热的ChatGPT便是建立在OpenAI的GPT-3.5系列大型语言模型之上的,并通过监督和强化学习技术进行了微调。

钟振山认为,基于大模型的AI应用和传统AI的区别,本质上在于前者改变了用户使用数据的方式。

根据IDC预测的数据,到2026年中国地区所产生的数据量约为50ZB,年复合增长率约为26%,远超世界上其他任何一个国家。但是,其中真正能被企业和个人所使用的数据却不到1%。对企业来说,这意味着大部分的数据都无法产生价值。

不过,随着ChatGPT等基于大模型的生成式AI的出现与成熟,这一现状有望得到改变。以ChatGPT为例,该应用抓取了2021年之前所有的互联网数据进行了预训练。“未来随着AIGC应用不断成熟之后,无论企业还是个人所产生的任何数据,都可以被用来训练大模型的产品,从而为企业带来相关的价值。”

钟振山认为,对于用户来说,大模型在降低开发门槛和计算资源、提升预测效果等方面具有重要价值。

其中,钟振山特别强调,对于一个只有应用需求的企业来说,自行搭建大模型体系的成本极高。因此大模型生成式AI的应用往往是由相关的技术厂商进行前期的预训练工作,再由企业使用少量内部数据进行二次训练,即可满足预期的需求,从而实现计算资源的节省。

目前在大模型的基础上,生成式AI的典型应用场景主要集中在数字人、艺术设计领域。此外,生成式AI在知识管理类应用、销售和营销、代码生成、医疗领域、金融业、制造业中也均有应用案例。以医疗领域为例,生成式AI已被应用于抗体和蛋白质的设计。

而它们均基于大模型底座。钟振山介绍称,目前全球范围内,除OpenAI的GPT-3(大型语言模型)、DALL-E 2(图像模型)以及Whisper(语言识别模型)外,包括Stable Diffusion(图像模型)、Midjourney(图像模型)、Make-a-Video(视频模型)等都是典型的AIGC基础模型。

不过,虽然从颠覆性的功能价值与丰富的应用场景来看,生成式AI的表现令人振奋,但是其面临的挑战也不容忽视。

钟振山表示,生成式AI还存在不少挑战,包括prompt工程师等相关人才的缺乏;AI生成内容的准确度不足,版权不清,甚至可能产生误导、有害或误用的内容;威胁用户隐私安全;甚至可能造成在线社区内的性别、种族、能力歧视等。

尽管如此面临挑战,展望未来,钟振山仍对大模型所在的AI市场充满信心。他预测,到2026年,中国人工智能市场规模将达到264.36亿美元左右。而市场增量则主要来源于基于大模型的应用替换过去几年建设的AI应用,生成式AI带来增量市场,以及全新的AI赋能的企业级应用。

鉴于此,钟振山提醒道,过去通用AI市场将会日渐饱和甚至消失,而不具备大模型能力的厂商将难以维持竞争优势。

推荐内容