英伟达宣布创造满血 DeepSeek-R1 模型 AI 推理性能的世界纪录

2025-03-26 12:59:10 作者:精选手游网

本站 3 月 19 日消息,英伟达在今日举行的 NVIDIA GTC 2025 上宣布其 NVIDIA BlackwellDGX 系统创下 DeepSeek-R1 大模型推理性能的世界纪录。

据介绍,在搭载了八块 Blackwell GPU 的单个 DGX 系统上运行6710 亿参数的满血DeepSeek-R1 模型可实现每用户每秒超 250 token 的响应速度,系统最高吞吐量突破每秒 3 万 token。

英伟达表示,随着 NVIDIA 平台继续在最新的 Blackwell Ultra GPU 和 Blackwell GPU 上突破推理极限,其性能将会继续不断提高。

▲运行 TensorRT-LLM 软件的 NVL8 配置的 NVIDIA B200 GPU

小编推荐

排行榜