Vast Data 与 Nvidia 推出端到端全加速 AI 数据栈

2026-03-04 11:00:23

来源
中国存储网

Vast AI OS将利用Nvidia库加速RAG、矢量搜索、实时SQL和代理应用的计算和数据服务。

人工智能作系统公司Vast Data宣布，通过与英伟达的扩展合作，实现了端到端、完全CUDA加速的AI数据栈。随着Vast AI作系统直接运行在Nvidia驱动的服务器上，客户可以消除AI流水线中的数据瓶颈，将数据采集、检索、分析和推理服务整合到统一平台上。通过将数据服务和计算层加速为一个连贯系统，Vast AI作系统消除了将独立存储、数据库和人工智能基础设施栈拼接起来的运营复杂性。结果是RAG流水线、代理系统和连续AI工作负载从实验到生产的路径更简单、更快捷。

Vast Data 与 Nvidia 推出端到端全加速 AI 数据栈

Vast CNode-X 与英伟达合作设计，推出了新一代 Nvidia 认证系统，彻底改变了 AI 基础设施的构建与运营方式。除了为Nvidia GPU加速集群提供高性能存储服务外，Vast AI作系统现在直接运行在Nvidia驱动的服务器上，使这些系统成为Vost平台内一流的基础设施公民。这一架构转变使 Vast 能够将 AI 流水线、高性能分析、向量搜索、RAG 功能和代理运行时整合为统一的软件栈。

新的CNode-X服务器为Vast AI作系统提供了计算基础，使其能够直接在核心软件服务中利用多种Nvidia软件库和API，包括Vast DataEngine和Vast DataBase。这些加速功能深植于平台内部，能够在实时SQL分析、矢量搜索与检索以及广泛的AI推理工作流程中实现更高的性能、更低的延迟和更高的效率。

“十年前，我们着手打造一个能够持续将数据精炼为智能和行动的系统，”Vast Data创始人兼首席执行官Renen Hallak说。“那个未来就在这里。通过与Nvidia加速Vast AI作系统内的计算和数据路径，我们为客户提供了一种更快、更简便的方式，将检索、分析和代理工作流程作为一个连贯的流程，使AI能够从试点系统过渡到耐用的生产系统。”

“英伟达正在为人工智能重新定义计算的每一个支柱。借助Vast Data，我们正在改造AI基础设施的存储方式，“Nvidia创始人兼首席执行官Jensen Huang表示。“CNode-X在每一层都经过CUDA加速，赋予AI代理持久记忆，使他们能够在数天、数周乃至数年内持续处理复杂问题，而不忘——为AI的下一个前沿打开了世界。”

以新的GPU加速Vast CNode-X服务器为基础，Vast正在整合Nvidia加速能力的广泛支持，整合在Vast AI作系统内，并将其部署到一个全栈软件平台中，该平台运行并协调AI流水线、向量搜索服务和生产型AI流水线。新增功能包括：

GPU原生SQL引擎加速，支持庞大数据库分析流程：Vast 正在推进 Vast 数据库，通过将存储侧智能与 GPU 加速执行相结合，加速现代分析工作负载在整个查询生命周期中实现。Vast DataBase查询引擎结合了智能数据布局、推送和过滤，减少了不必要的I/O，同时使用基于Nvidia cuDF的开源查询引擎Sirius，实现GPU加速的SQL计算层执行。Nvidia cuDF 是一个用于加速结构化数据分析的库。这种互补的方法加速了数据到达计算前和计算本身的过程，提供了一个同时实现存储优化和GPU加速的数据库。Sirius的早期基准测试显示查询时间减少了最多44%，查询成本降低了最多80%
Nvidia cuVS 用于加速向量搜索与检索：Vast 的 CNode-X 嵌入 Nvidia cuVS 库，为使用 Vast 进行可扩展向量数据库服务的组织带来了 GPU 加速，以及基于 Nvidia AI Data Platform 参考设计的 Vast InsightEngine，用于生产 RAG 流水线，提升实时、丰富上下文的 AI 应用的检索延迟。
Nvidia Nemotron 模型和 Nvidia NIM 微服务用于可扩展 DataEngine 流水线：Vast 现在将在 CNode-X 上部署并支持 Nvidia NIM 微服务，用于可扩展的 AI 流水线，并开源面向视频智能、企业文档 RAG 和基因组学研究用例的 AI 流水线的生产准备 Vast DataEngine 蓝图
Nvidia CMX 加速大规模推理：Vast 支持 Nvidia 上下文内存存储（CMX）平台，集群配置支持 Nvidia BlueField-4 DPU 和 Spectrum-X 以太网网络，加速共享 KV 缓存访问，并缩短长上下文多代理推理的首次令牌时间。这让代理能够访问整个舱体的内存。Vast 的拆分共享（Discelld Shared Thing，DASE）架构还提供了额外优势，使客户能够选择性地在带外添加企业数据服务，而不影响 KV 检索时间

加速庞大人工智能作系统
的硬件选择 Vast 计划通过包括思科和超级微速在内的领先 OEM 合作伙伴将 CNode-X 服务器推向市场，使客户能够通过其首选供应商采购 GPU 加速基础设施，同时保持稳定的 Vast 软件、支持和运营体验。

通过与OEM合作伙伴提供的认证配置，Vast为生产AI提供了更快速、更易支持的路径。随着企业AI流水线成为连续系统，Vast将其数据平台与全栈Nvidia加速计算相结合，提供高性能的检索、分析和矢量搜索，使GPU在RAG、实时分析和大规模AI工作负载中保持高效运行。

“人工智能不会依赖孤立的组件。它通过集成系统扩展，“思科计算高级副总裁兼总经理Jeremy Foster说。“客户需要能够保障数据安全、与智能网络和GPU加速计算紧密对齐的基础设施，以打造高效、具备生产准备的平台。思科与 Vast 和 Nvidia 等合作伙伴的合作，正在为组织提供企业级基础，助力安全扩展人工智能，具备性能、韧性和控制力。”

Supermicro总裁兼首席执行官梁问道：“生产人工智能需要在计算、加速和数据平台之间实现新的集成层次。”“我们与Vast Data和Nvidia携手，打造一个真正一体化的AI数据平台，消除企业AI的复杂性。通过将高性能计算、可扩展数据基础设施和智能软件整合为一个解决方案，我们使组织能够更快地从实验过渡到生产，并从人工智能中释放真正的商业价值。”

声明： 此文观点不代表本站立场；转载须要保留原文链接；版权疑问请联系我们。

Vast Data 与 Nvidia 推出端到端全加速 AI 数据栈

RNGD进入量产阶段：台积电出货4000台高性能AI加速器

Vast Data 海量数据启动 Vast Amplify计划，高效提升闪存容量

Vast Data 与 Nvidia 一起重新设计智能化时代的 AI 推理架构

VAST Data 与 SK Telecom 合作，基于 NVIDIA 超级计算机优化韩国最大的人工智能基础设施

Vast Data 推出基于 Nvidia 技术的 AI 工厂数据中心架构

数据安全技术电子产品信息清除技术要求GB46864-202

Certes 新升级实现突破性的 PQC 保护，在任何场景提供量子安全保护数据

Veeam 2026年数据信任与韧性报告：对从网络事件中恢复的能力充满信心

浅析金融行业大数据平台灾备架构设计九大难点

HYCU与Halcyon合作扩展R-Shield网络韧性解决方案，推出首个抗勒索软件的数据保护解决方案

Dropbox：2026财年第一季度财务业绩

Wasabi通过网络韧性推动和灵活的云存储管理，点燃EMEA渠道增长，助力MSP服务

Wasabi 将收购Seagate希捷的Lyve云业务

使用 Amazon FSx 为 NetApp ONTAP 和 Komprise 优化成本的文件存储

CT3进入下一代去中心化存储系统的测试最终阶段

芯展速“智展AI方案”入选2026算力基础设施高质量发展优秀案例！

Celestica的存储平台成为创纪录的AI超级计算机存储的基石

DeepSeek V4首发华为平台，NVIDIA黄仁勋：对美国将会很可怕

NexusGen私有AI服务器亮相江苏建博会赋能建筑增效

将算力“搬”上天，我国加快太空算力产业生态培育

PoINT 扩展支持 LTFS 的 S3 到磁带解决方案

Rambus 支持下一代 AI PC 内存，配备完整的客户端芯片组，支持 CUDIMM 和 CSODIMM 模块

戴尔科技世界2026：MaxLinear展示Panther加速数据中心AI推理和数据流动效率

Scality推出自主数据基础设施，为AI提供动力

Microchip扩展dsPIC33A DSC产品系列专为高密度AI数据中心电源、复杂电机控制及智能传感应用而设计

华为发布AI DC数据基础设施全栈方案，加速行业智能化跃升

南京鼓楼医院携手霄云科技，以“碧海”系统打造医疗影像存储国产化新标杆

从 Nginx-Ingress 到下一代云原生网关：甲方视角下的架构演进决策框架

一批重要国家标准批准发布，涉及脑机接口、半导体器件、北斗芯片等

DigitalGlue终结“后期制作税”：creative.space 智能（CSI）与取证人工智能统一本地存储

科技要闻

戴尔科技世界2026：MaxLinear展示Panther加速数据中心AI推理和数据流动效率

华擎工业在台北COMPUTEX 2026上发布Agentic Robot101和安全边缘AI解决方案

智能制造中的计算机视觉：缺陷检测与预测性维护

Axiomtek PICO570为机器人和智能自动化应用提供高达 11 TOPS 的 AI 性能

理想汽车选用Arteris FlexNoC 5 IP用于AI驱动的自动驾驶系统系统

Vast Data 与 Nvidia 推出端到端全加速 AI 数据栈

猜你喜欢

科技要闻