直击WAIC｜对话天数智芯董事长盖鲁江：如何为大模型提供国产芯片算力支持？

(相关资料图)

南方财经全媒体记者江月上海报道7月7日，在上海举行的世界人工智能大会启幕，国产芯片也急需在大模型训练和推理中显身手。在大模型发展的核心三要素中，算力起到底座作用，国产芯片能否撑起国内大模型的发展需求？

国产CPU设计商天数智芯董事长兼CEO盖鲁江向南方财经全媒体记者表示，该公司的通用型GPU（GPGPU）已跑通接近500个大模型，其中覆盖多款主流模型。他还表示，大模型企业对算力需求与日俱增，模型参数也在持续升级，因此将在产品上针对性地对算法进行硬件级优化，以便满足国内大模型发展的算力需求。

在国内，不少互联网大厂、创业型公司等在自制人工智能大模型。获得算力，也就是买到或租用到合适的GPU，可谓这项工程的“第一步”。GPU市场的大部分份额目前为海外厂商所占据，而国产GPU设计商仍在寻求与其进行技术竞争，从而给大模型开发商提供更丰富的选择。

据盖鲁江介绍，天数智芯旗下通用型GPU“天垓100”，目前已经跑通了清华大学的GLM、Meta的LLamA、北京智源研究院的Aquila等大模型。此外，智源研究院的650亿参数大模型，也正在天垓100上进行训练，预计10月可以完成。盖鲁江还表示：“如果有一部分客户从国外的云平台迁回来，急需算力，我可以联合我的合作伙伴给他们搭建算力平台，来支持他们的开发。”

据该公司数据，截至2022年底，天数智芯累计订单接近6亿元，并在当年确认收入2.5亿元。这反映该公司量产的产品已经进入市场。

盖鲁江称，天数智芯重视国际主流软件生态，希望方便客户在API接口层面兼容国际主流终端，并降低迁移成本。“在500多人的研究团队中，软件人员的数量是硬件人员的2倍。”盖鲁江称，他指唯有做好软件优化，硬件性能才有可能呈几何倍数增长。

提及对未来的展望，盖鲁江表示一是要准备好应对国内大模型从“千卡集群”向“万卡集群”升级，二是将联手数据中心做好云平台建设。

盖鲁江指出，天数智芯目前已经和国内主流的服务器厂商完成了服务认证。这意味着天数智芯将以自身GPU搭载主流CPU，加载在第三方服务器上完成联合出货。谈及未来云平台中需要更多数量的GPU，盖鲁江也指出，chiplet和3D封装技术可以成为技术升级中的考虑选项。

面对国内客户或将迁移平台，盖鲁江希望能在此过程中与客户达成更好的互信。“GPU开发商需要客户开放更多底层数据，才能做好软、硬件优化。”他称。