RNGD进入量产阶段：台积电出货4000台高性能AI加速器

2026-02-28 19:11:26

来源
中国存储网

RNGD 是一款用于高级语言模型以及生成式和代理人工智能的数据中心推理加速器。

中国存储网消息，FuriosaAI正式大量发售RNGD，官方博客称：随着我们的合作伙伴台积电和华硕已交付了首批4000台，我们的高性能AI芯片可立即面向全球企业客户提供，既有独立PCIe卡，也有交钥匙服务器。

Furiosa联合创始人兼首席执行官白秋表示：“将第一原理架构转化为量产硅芯片，是少数AI芯片初创公司能做到的。“随着RNGD现已发售，我们赋予企业大规模运行最先进的大型语言模型和代理人工智能的能力，而无需承担传统解决方案带来的巨大能源和基础设施损失。我们将在此基础上继续努力，积极推进，实现让高性能人工智能计算真正可持续的使命，惠及每一家企业。”

RNGD进入量产阶段：台积电出货4000台高性能AI加速器

高性能，无需数据中心改造

现代AI模型需要大量计算，但绝大多数企业数据中心采用风冷，且每机架功率上限为15kW。耗电量大的老旧GPU通常每颗芯片消耗600W+，需要昂贵且耗时的基础设施升级。GPU数据中心在获取、交付和支付大量电力以维持运营方面面临着巨大的额外障碍。行业需要一种高性能的替代方案，能在你今天的机架中发挥作用。

RNGD 是一款用于高级语言模型以及生成式和代理人工智能的数据中心推理加速器。它兼具性能（512 INT8 TFLOPS）和突破性的能源效率，这对于克服基础设施瓶颈和降低总拥有成本至关重要。

FuriosaAI稳步推进硬件稳定和软件栈优化，带来了现实里程碑，如LG AI Research采用EXAONE，以及去年下半年与OpenAI合作的gpt-oss模型公开演示。

与此同时，公司通过与台积电、SK海力士及其他全球科技领头企业的紧密合作，建立了稳定的制造和供应链。

由于我们的架构专为人工智能设计，RNGD在标准环境中的计算密度（每机架吞吐量）比基于H100的系统高出3.5倍。RNGD现已提供两种形式：

RNGD PCIe 卡：一款可直接加速的加速器，在严格的 180W TDP 下实现前沿型号性能 NXT RNGD 服务器：即插即用的 4U 机架式服务器，内置 8 张 RNGD 卡。由于系统仅需3kW，你可以在一个标准空冷机架中堆放五台NXT RNGD服务器，每个机架可实现20 petaFLOPS（INT8）

RNGD由功能齐全的SDK支持，提供先进的优化技术，如芯片间张量并行，并支持Qwen 2和Qwen 2.5等流行模型。Furiosa SDK 支持 torch.compile，是 vLLM 的替代工具，并兼容 OpenAI API，使开发者只需对现有代码进行最小修改即可快速作。拥抱面中心的预编译工件现在支持最高32K令牌的上下文长度，使应用更复杂且具备上下文感知能力。

硅在生产中已验证 LG AI Research通过其EXAONE模型进行严格验证，确认RNGD每瓦性能比同类GPU高出2.25倍。

我们优化了OpenAI的120B参数GPT-OSS模型，使其仅能在两张RNGD卡上运行，证明我们能用通常所需硬件的一小部分处理庞大的参数数量。

在GPU上运行先进AI的成本和基础设施挑战正成为整个行业的瓶颈。但现在任何数据中心都有高性能推理的替代解决方案。RNGD正在发售，可扩展，现在就可以部署了。

声明： 此文观点不代表本站立场；转载须要保留原文链接；版权疑问请联系我们。

RNGD进入量产阶段：台积电出货4000台高性能AI加速器

三星SDS发布基于Nvidia B300的GPU服务

英伟达已停止生产定制的H200处理器

探索DeepSeek 多样化技术路径，英特尔架构师用至强CPU尝鲜

首届“国家绿色算力设施”推广交流活动在上海市举办

Illumio 通过网络态势拓宽风险可见度

Check Point 公布私有 AI 安全蓝图

美团后台数据争议：技术便利与隐私边界的博弈

谷歌：2025年共发现90个已被实际利用的零日漏洞

特朗普政府发布《美国网络战略》

使用 Amazon FSx 为 NetApp ONTAP 和 Komprise 优化成本的文件存储

CT3进入下一代去中心化存储系统的测试最终阶段

Wasabi 推出隐蔽复制功能，提升云存储安全，防勒索软件

HostColor 在迈阿密数据中心推出新的 AI 兼容云和裸机服务器

Inveniam 收购 Storj 为去中心化数据基础设施的未来提供动力

三星SDS发布基于Nvidia B300的GPU服务

政府工作报告连续第3年点名量子科技

英伟达已停止生产定制的H200处理器

工业和信息化部部长李乐成:我国规上制造业企业人工智能(AI)技术应用普及率超30%

工业和信息化部部长李乐：:我国规上制造业企业人工智能(AI)技术应用普及率超30%

Salute 与 Ecolab 为人工智能中心增设冷却服务

Sandisk 推出下一代 USB-C 便携式 SSD 产品组合

嵌入式世界2026：Apacer 嵌入式人工智能工业存储解决方案展示

Meta与英伟达宣布长期AI基础设施合作

Nutanix：2026财年第二季度财务业绩

重庆电信AI赋能疾控两项创新应用获评国家级案例

研发：五篇关于DNA数据存储的文章

天硕工业级宽温存储方案：智能SLC模式助力关键领域国产化替代

为AI时代打造的 Pure Storage平台，让数据更智能、更快、更安全、更有趣

和硕通过先进的 OCP 解决方案为数据中心的未来提供动力

科技要闻

Illumio 通过网络态势拓宽风险可见度

Salute 与 Ecolab 为人工智能中心增设冷却服务

如何在AI时代找到一份软件开发工作？

美团后台数据争议：技术便利与隐私边界的博弈

私删大量用户照片被实锤：美团，凭什么掌控我的手机？

RNGD进入量产阶段：台积电出货4000台高性能AI加速器

猜你喜欢

科技要闻