2026-03-04 11:00:23
来 源
中国存储网
存储资讯
Vast AI OS将利用Nvidia库加速RAG、矢量搜索、实时SQL和代理应用的计算和数据服务。

人工智能作系统公司Vast Data宣布,通过与英伟达的扩展合作,实现了端到端、完全CUDA加速的AI数据栈。随着Vast AI作系统直接运行在Nvidia驱动的服务器上,客户可以消除AI流水线中的数据瓶颈,将数据采集、检索、分析和推理服务整合到统一平台上。通过将数据服务和计算层加速为一个连贯系统,Vast AI作系统消除了将独立存储、数据库和人工智能基础设施栈拼接起来的运营复杂性。结果是RAG流水线、代理系统和连续AI工作负载从实验到生产的路径更简单、更快捷。

Vast Data 与 Nvidia 推出端到端全加速 AI 数据栈

Vast CNode-X 与英伟达合作设计,推出了新一代 Nvidia 认证系统,彻底改变了 AI 基础设施的构建与运营方式。除了为Nvidia GPU加速集群提供高性能存储服务外,Vast AI作系统现在直接运行在Nvidia驱动的服务器上,使这些系统成为Vost平台内一流的基础设施公民。这一架构转变使 Vast 能够将 AI 流水线、高性能分析、向量搜索、RAG 功能和代理运行时整合为统一的软件栈。

新的CNode-X服务器为Vast AI作系统提供了计算基础,使其能够直接在核心软件服务中利用多种Nvidia软件库和API,包括Vast DataEngine和Vast DataBase。这些加速功能深植于平台内部,能够在实时SQL分析、矢量搜索与检索以及广泛的AI推理工作流程中实现更高的性能、更低的延迟和更高的效率。

“十年前,我们着手打造一个能够持续将数据精炼为智能和行动的系统,”Vast Data创始人兼首席执行官Renen Hallak说。“那个未来就在这里。通过与Nvidia加速Vast AI作系统内的计算和数据路径,我们为客户提供了一种更快、更简便的方式,将检索、分析和代理工作流程作为一个连贯的流程,使AI能够从试点系统过渡到耐用的生产系统。”

“英伟达正在为人工智能重新定义计算的每一个支柱。借助Vast Data,我们正在改造AI基础设施的存储方式,“Nvidia创始人兼首席执行官Jensen Huang表示。“CNode-X在每一层都经过CUDA加速,赋予AI代理持久记忆,使他们能够在数天、数周乃至数年内持续处理复杂问题,而不忘——为AI的下一个前沿打开了世界。”

以新的GPU加速Vast CNode-X服务器为基础,Vast正在整合Nvidia加速能力的广泛支持,整合在Vast AI作系统内,并将其部署到一个全栈软件平台中,该平台运行并协调AI流水线、向量搜索服务和生产型AI流水线。新增功能包括:

  • GPU原生SQL引擎加速,支持庞大数据库分析流程:Vast 正在推进 Vast 数据库,通过将存储侧智能与 GPU 加速执行相结合,加速现代分析工作负载在整个查询生命周期中实现。Vast DataBase查询引擎结合了智能数据布局、推送和过滤,减少了不必要的I/O,同时使用基于Nvidia cuDF的开源查询引擎Sirius,实现GPU加速的SQL计算层执行。Nvidia cuDF 是一个用于加速结构化数据分析的库。这种互补的方法加速了数据到达计算前和计算本身的过程,提供了一个同时实现存储优化和GPU加速的数据库。Sirius的早期基准测试显示查询时间减少了最多44%,查询成本降低了最多80%
  • Nvidia cuVS 用于加速向量搜索与检索:Vast 的 CNode-X 嵌入 Nvidia cuVS 库,为使用 Vast 进行可扩展向量数据库服务的组织带来了 GPU 加速,以及基于 Nvidia AI Data Platform 参考设计的 Vast InsightEngine,用于生产 RAG 流水线,提升实时、丰富上下文的 AI 应用的检索延迟。
  • Nvidia Nemotron 模型和 Nvidia NIM 微服务用于可扩展 DataEngine 流水线:Vast 现在将在 CNode-X 上部署并支持 Nvidia NIM 微服务,用于可扩展的 AI 流水线,并开源面向视频智能、企业文档 RAG 和基因组学研究用例的 AI 流水线的生产准备 Vast DataEngine 蓝图
  • Nvidia CMX 加速大规模推理:Vast 支持 Nvidia 上下文内存存储(CMX)平台,集群配置支持 Nvidia BlueField-4 DPU 和 Spectrum-X 以太网网络,加速共享 KV 缓存访问,并缩短长上下文多代理推理的首次令牌时间。这让代理能够访问整个舱体的内存。Vast 的拆分共享(Discelld Shared Thing,DASE)架构还提供了额外优势,使客户能够选择性地在带外添加企业数据服务,而不影响 KV 检索时间

加速庞大人工智能作系统
的硬件选择 
Vast 计划通过包括思科和超级微速在内的领先 OEM 合作伙伴将 CNode-X 服务器推向市场,使客户能够通过其首选供应商采购 GPU 加速基础设施,同时保持稳定的 Vast 软件、支持和运营体验。

通过与OEM合作伙伴提供的认证配置,Vast为生产AI提供了更快速、更易支持的路径。随着企业AI流水线成为连续系统,Vast将其数据平台与全栈Nvidia加速计算相结合,提供高性能的检索、分析和矢量搜索,使GPU在RAG、实时分析和大规模AI工作负载中保持高效运行。

“人工智能不会依赖孤立的组件。它通过集成系统扩展,“思科计算高级副总裁兼总经理Jeremy Foster说。“客户需要能够保障数据安全、与智能网络和GPU加速计算紧密对齐的基础设施,以打造高效、具备生产准备的平台。思科与 Vast 和 Nvidia 等合作伙伴的合作,正在为组织提供企业级基础,助力安全扩展人工智能,具备性能、韧性和控制力。”

Supermicro总裁兼首席执行官梁问道:“生产人工智能需要在计算、加速和数据平台之间实现新的集成层次。”“我们与Vast Data和Nvidia携手,打造一个真正一体化的AI数据平台,消除企业AI的复杂性。通过将高性能计算、可扩展数据基础设施和智能软件整合为一个解决方案,我们使组织能够更快地从实验过渡到生产,并从人工智能中释放真正的商业价值。”

声明: 此文观点不代表本站立场;转载须要保留原文链接;版权疑问请联系我们。