Cloudflare将在300个数据中的边缘部署Nvidia GPU 以进行生成式 AI 推理

2023-9-30

Cloudflare公司计划在其全球边缘网络中部署 Nvidia GPU。该平台针对人工智能应用，特别是像大语言模型这样的生成式人工智能模型。Nvidia GPU的型号并未透露。“网络上的人工智能推理将成为许多企业的最佳选择：私人数据靠近用户实际所在的任何地方，同时由于就在附近而运行起来仍然极具成本效益，”Matthew Prince，首席执行官兼联合创始人云焰说道。“借助 Nvidia 在我们全球网络上最先进的 GPU 技术，我们正在使人工智能推理变得在全球范围内变得可用且经济实惠，这在以前对许多客户来说是遥不可及的。”

- Cloudflar01

Cloudflare还将部署Nvidia以太网交换机，并使用Nvidia的全栈推理软件，包括Nvidia TensorRT-LLM和Nvidia Triton Inference服务器。该公司表示，到 2023 年底，GPU 将部署在 100 多个城市，到 2024 年底，“Cloudflare 网络几乎覆盖所有地方”。它在全球 300 多个城市的数据中心运营。Nvidia 超大规模和 HPC 副总裁 Ian Buck 表示：“Nvidia 的推理平台对于推动下一波生成式 AI 应用程序至关重要。”“借助 Cloudflare 上提供的 Nvidia GPU 和 Nvidia AI 软件，企业将能够创造响应迅速的新客户体验并推动各个行业的创新。”

发布时，AI Edge网络将不支持客户提供的模型，仅支持Meta的Llama 2 7B和M2m100-1.2、OpenAI的Whisper、Hugging Face的Distilbert-sst-2-int8、微软的Resnet-50和Baai的bge-base -en-v1.5。Cloudflare 计划未来在 Hugging Face 的帮助下添加更多模型。