英特尔将打造超稳定的AI超级计算机,配备CPU和Gaudi2

不再是用GPU或者TPU构建的超巨大的人工智能系统,据消息英特尔计划使用 Xeon 处理器和 4000 个 Gaudi2 AI 硬件构建大型AI超级计算机。生成式人工智能公司 Stability AI 将成为该系统的主要客户,英特尔声称该系统将成为世界上最大的人工智能超级计算机之一。

Gaudi 处理器是英特尔在 2019 年以 20 亿美元收购 Habana Labs 的成果。当时,英特尔取消收购Nervana 的人工智能芯片,转而支持这家的以色列业务。在本月早些时候最新的 MLPerf 基准测试竞赛中,Gaudi2 表现出色 - 在推理方面,它比 Nvidia A100 快 2.4 倍,接近 H100 Hopper GPU。在训练方面,它仍然落后,但英特尔预计本月将添加 FP8 精度量化,这可能使其与 H100 具有竞争力。然而,Nvidia 的 H100 仍然领先于竞争对手,而 Grace Hopper(H100 和 Grace Arm 芯片)则击败了它。

 

让事情变得更加复杂的是,Nvidia 本月发布了“适用于 LLM 的 TensorRT ”,据称该产品使 H100 的推理性能提高了一倍。但该软件尚未及时为 MLPerf 做好准备,因此尚未进行基准测试。GPU 公司在人工智能领域的主导地位也使其在软件方面对生成式人工智能的大部分开发具有控制力。像英特尔的新型超级计算机这样的项目旨在打破这种束缚,通常以优惠的价格为初创公司提供机会。

THE END