企业计算向边缘迁移

AI generated image of man standing at the edge of data collection for AI inferencing.
AI generated image of man standing at the edge of data collection for AI inferencing.

人工智能 (AI) 应用正呈爆发式增长——紧跟这一趋势的最快方式,就是将计算推向数据源头的边缘地带。这一趋势正推动边缘数据中心获得巨额投资,据Research and Markets预测,其复合年增长率(CAGR)将达 17%,全球市场规模将从 2024 年的约 150 亿美元增长到 2030 年的近 400 亿美元

在过去的二十年里,信息技术领域始终致力于将算力集中至云端。未来十年,计算将重新回归数据。
Rita Wouhaybi,Solidigm AI 研究员

顾名思义,边缘数据中心更靠近访问企业服务的终端客户、合作伙伴及设备。其规模可小至零售店储物间的几台服务器,大至托管机房(colo)的成排 IT 设备,形态灵活多变。与采用微控制器和实时软件的物联网设备不同,边缘数据中心提供全栈式应用处理能力,仅占用更小物理空间。

向边缘处理转型的原因包括交易响应能力提升、服务可扩展性增强以及数据主权保障。让我们更详细地探讨一下这些问题。

为什么要将计算迁移到边缘?

当前众多企业正面临核心数据中心的运行瓶颈,包括电力供应、散热能力、物理空间及系统架构限制。边缘数据处理通过将算力从主数据中心分散至更靠近 IT 服务使用者的位置,为规避这些限制提供了新路径。

以下是边缘处理对现代 IT 组织的关键价值:

  • 响应速度和延迟考虑因素:随着响应时间增加,客户满意度骤降。而对于安全关键决策(即机器人、自动驾驶汽车、无人机等),为避免障碍物而进行的快速决策可能至关重要。减少延迟的一个可靠方法是将计算和存储转移到客户、合作伙伴和设备使用服务的地方。通过这种方式,您可以消除将请求和响应往返传输到核心数据中心以及从核心数据中心传出所需的往返网络时间和成本。
  • 可扩展性考虑因素:在许多情况下,主数据中心的数据处理会遇到系统或架构限制,这些限制与软硬件相关。显而易见,通过部署边缘处理可缓解电力、散热和空间限制,但通过将部分工作分发到边缘,系统架构限制通常同样能被释放。长远来看,这能加速企业 IT 服务的扩展。
  • 数据缩减考虑因素:将原始数据——无论有效、无效或低效——全数回传至核心数据中心的做法,往往并无必要,某些情况下甚至完全可以避免。以卫星影像为例:其拍摄内容可能包含地质构造、地面基础设施及农作物等关键信息,但也常混杂着遮蔽重要场景的云层图像。若将所有影像传输至地面站进行存储、处理与分析,将徒增冗余操作。在边缘端实施数据预处理,可通过在采集源头筛除无效及冗余数据显著提升成本效益,由此减少后续数据传输与处理负担。
  • 数据隐私考虑因素:数据隐私要求日益影响数据处理的地点和方式。在具有严格数据驻留规则的司法管辖区,边缘计算提供了一种实用的架构方法:通过在本地(靠近数据生成位置)处理数据,组织能更轻松地确定哪些个人数据保留在境内。边缘部署可通过限制数据移动、实现对数据访问和保留的更本地化控制来支持基础设施策略。

这些仅是说明将数据处理移至边缘可能有益的部分例证。根据贵组织的需求,您可能会发现其他优势。

AI 推理正在加速边缘发展

如上所述,任何能够缓解系统限制、减少响应时间、消除不必要的数据传输和处理的工作,都值得考虑在边缘执行。AI 推理就是一个很好的例子。

前面我们讨论了集中式数据中心的电力和冷却限制。一般而言,对于大多数组织来说,AI 训练和推理基础设施是接近此类限制的首要原因。虽然组织需要大型、集中式的 GPU 加速服务器集群来执行大多数 AI 模型训练,但与部署 AI 推理解决方案相关的基础设施障碍可能要少得多。通过将推理转移到边缘,组织可以减少核心数据中心的电力和冷却需求,使其更具可持续性。此外,将 AI 推理计算负载分散至多个边缘数据中心(而非集中于核心数据中心)进行处理,可显著降低基础设施的扩展难度。

再者,将 AI 推理转移到更靠近服务使用的地方有助于缩短推理响应时间。边缘存在两种差异显著的推理场景——各自具有不同的存储需求:

  • 无状态 LLM/文本聊天:以 CPU 为中心、延迟敏感,模型加载后基本为只读。存储需求集中于快速顺序读取和成本效益容量;写入耐久性不成问题——这使得高密度QLC SSD成为理想选择。
  • 视觉 + 传感器分析:GPU/NPU 驱动的管道可摄取连续视频、激光雷达或物联网遥测数据。这些工作负载通过随机读取和持续的小规模写入(元数据、特征向量、滚动缓冲区)持续冲击存储系统。他们渴望获得高混合 IOPS 和卓越的写入耐用性,以适应 24 × 7 的捕获周期。

为什么这对 Solidigm 很重要:为每个配置文件配对正确的 SSD 可最大限度地降低成本/提高性能。基于 QLC 的 Solidigm™ D5-P5336 硬盘在海量 LLM 存储库中大放异彩,而基于 TLC 的 Solidigm D7 系列硬盘则能满足视觉工作负载对 NAND ≥3 DWPD 写入率的苛刻要求 - 无需过度配置即可提供超长寿命。

除了性能之外,数据缩减是边缘工作的另一优势。AI 推理正日益成为系统区分有效数据与无效数据或冗余数据的主要手段,这样就能在不影响系统功能的情况下消除无效数据。

同样,法规可能要求必须在国内或机构内处理个人数据。在边缘进行推理有助于满足边界要求。

AI 推理并不是唯一能够通过在边缘部署来帮助组织实现其系统目标的 IT 工作负载。但这是边缘工作的一个绝佳范例,展示了企业用于证明部署边缘处理合理性的诸多理由。

Solidigm 的优势

对于用户远离核心数据中心的组织而言,分布式边缘处理意义重大。响应速度往往是引入边缘处理的主要驱动因素,但并不是唯一的驱动力。

通过使用边缘处理从源头上减少和消除无关数据,可以显著降低数据传输、处理和存储的成本。此外,扩展系统通常会在中央数据中心遇到软件和硬件限制,但通过部署边缘处理,组织可以减少这些限制。

AI 推理是一个很好的范例,边缘处理可以带来巨大的回报。随着 AI 应用在企业 IT 中日益普及,在边缘进行推理可能会在多个方面决定成败。

做出明智的数据基础设施选择是其中的重要一环。有关 Solidigm 产品组合的更多信息以及我们对边缘 AI 的建议,请访问 www.solidigm.com/ai


关于作者

Ace Stryker 是 Solidigm 的市场开发总监,他主要负责公司数据中心存储解决方案产品组合中的各种新应用。

免责声明

本文中的任何内容均无意作出任何明示或默示的担保,包括但不限于关于适销性、适合特定目的及不侵权的默示保证,或在履行合同、交易过程或贸易惯例中产生的任何担保。

本文所述产品可能存在设计缺陷或错误,已在勘误表中注明,可能会使产品偏离已经发布的技术规范。可应要求提供最新特征勘误表。

Solidigm 不对第三方数据承担任何控制或审计的责任。您应参考其他信息来源以评估准确性。

请在下单之前联系您的 Solidigm 代表或经销商以获取最新规格。

SOLIDIGM 及 Solidigm“S”徽标均为 SK hynix NAND Product Solutions Corp.(以 Solidigm 名义开展业务)的商标,已在美国、中华人民共和国、日本、新加坡、欧盟、英国、墨西哥及其他国家注册。