Solidigm AI 中央实验室:定义未来的 AI 数据架构

Solidigm AI 中央实验室搭载 122TB 固态硬盘,部署于 16U 机架中,总数据存储容量超 23PB,可测试存储子系统在 AI 模型训练过程中持续为显卡提供数据支撑的能力。
Solidigm AI 中央实验室搭载 122TB 固态硬盘,部署于 16U 机架中,总数据存储容量超 23PB,可测试存储子系统在 AI 模型训练过程中持续为显卡提供数据支撑的能力。

市场上不乏数据存储领域的专家,也有深耕 AI 工作负载的专业团队。但若您想找到一家能同时兼具这两大核心能力的公司,或许常常无功而返。

全新的 Solidigm AI 中央实验室正为解决这一行业痛点而生。

该 Solidigm 实验室基于最新的模型训练与推理技术打造,融合存储与 AI 核心能力开展前沿研究,并与核心合作伙伴携手优化业务成果,推动两大行业协同发展。

Solidigm AI 实验室核心配置解析

该实验室配备英伟达 B200、H200 等高性能 GPU、800Gbps 以太网网络,更搭载了大量 Solidigm 固态硬盘。实验室坐落于美国加利福尼亚州兰乔科尔多瓦市,毗邻 Solidigm 总部,由 Solidigm 与 AI 基础设施提供商 FarmGPU 联合打造,可快速部署全新的软硬件开展测试工作。

实验室采用的参考架构,与全球超大规模服务商及企业级客户所部署的数据中心架构保持一致,确保研究成果可广泛适配各类客户的实际应用环境。

Solidigm AI 中央实验室在 16U 机架中搭载 122TB 固态硬盘,实现超 23PB 的总数据存储容量。

除运行真实的 AI 工作负载外,该实验室还具备遥测数据采集能力,可精准呈现系统资源的使用情况,定位性能瓶颈所在。这一能力将助力 Solidigm 及其合作伙伴制定针对性的优化方案,实现系统性能与能效的双重提升。

Solidigm 高级副总裁兼产品与营销负责人 Greg Matson 表示:“如今,仅开展存储性能测试已远远不够。”

超高性能集群,突破存储技术边界

尽管实验室刚落成不久,却已斩获多项亮眼成果。在最新一轮的 MLPerf Storage 测试(旨在测量存储子系统在 AI 模型训练运行期间保持 GPU 忙碌的能力)中,FarmGPU 提交了在一个配备 24 个 Solidigm™ D7-PS1010 SSD 的 AI 中央实验室单节点集群上的结果。在我们的旗舰级高性能驱动器的支持下,该集群实现了 116 GB/s 的吞吐量,创下该项测试单节点吞吐量的历史最高纪录。该架构可轻松拓展为多节点集群,满足未来测试需求。

Solidigm 总部的 AI 中央实验室在 16U 机架中搭载 122TB 固态硬盘,实现超 23PB 的数据存储容量。

该实验室还拥有我们认为是迄今为止构建的密度最高的存储测试集群。该集群搭载 192 块 Solidigm D5-P5336 固态硬盘,每块硬盘存储容量高达 122TB,在仅 16U 的机架空间内实现了 23.4PB 的存储容量。这一存储容量可存储超 300 年的连续高清视频,或约 50 亿首歌曲。

实验室的这一系列配置,将助力 Solidigm 在 AI 应用场景中持续突破存储性能与存储密度的技术边界,为未来的技术创新与优化开辟全新道路。

携手全球顶尖 AI 基础设施公司,共筑行业生态

该实验室的核心建设初衷,是为各类企业提供软硬件测试平台,助力行业挖掘联合创新的全新可能。到目前为止,反响如预期般热烈。

据 Matson 称,“行业对于实验室独有的 AI 与存储技术融合能力的关注热度居高不下。”目前,Solidigm 正与 AI 领域的多家企业签订或推进测试与技术探索合作协议。

早期的测试结果已经有助于重新定义关于优质存储如何改善 AI 结果的认知。今年早些时候,Solidigm 与 AI 工作负载分析和企业解决方案提供商 Metrum AI 联合发布了一份白皮书,内容涉及检索增强生成 (RAG)。双方开展了大量研究,验证了将 RAG 数据从系统内存迁移至固态硬盘的诸多优势,包括在保持系统性能与数据处理准确性的前提下,可将 DRAM 的使用量降低高达 57%。

与其他多家全球顶尖合作伙伴的合作正在推进中,更多公告即将发布。


关于作者

Ace Stryker 是 Solidigm 的市场开发总监,他主要负责公司数据中心存储解决方案产品组合中的各种新应用。