传统领域是磁盘驱动器的理想归宿

多年来,IT 存储介质领域涌现了大量创新。像该领域的许多人一样,我自己的从业经历也很漫长。这一历程始于磁带等介质,随后过渡到硬盘驱动器 (HDD),最终是基于闪存的固态硬盘 (SSD)。  任何存储介质的技术属性,最终都是推动 IT 行业采用此类介质的关键因素。决定任何存储介质在市场上取得成功的因素有很多,但底层技术及其存取方式至关重要。  现在,就让我们来看看对 IT 至关重要的存储介质的几个技术特征。

以下四个要素是数据存储效率的四大支柱,它们共同构成了存储性能的体系基础。

1. 存储容量

可用存储空间的大小需要匹配或超过数据占用量。这可以是纯物理或原始存储容量,也可以仅仅是设备向操作系统 (OS) 或存储系统呈现的容量。压缩和其他数据缩减技术使得“逻辑”容量可超过物理容量。数据保护可能会产生相反的效果,由于需要通过冗余来保护客户数据免受介质故障的影响,从而减少了逻辑容量。

2. 存储性能

在考虑部署的整体速度时,存储性能的影响往往被忽视。对于大多数用例,速度通常以首字节数据时间来衡量,也称为存取时间、延迟或响应时间。这可以是持续的驱动器吞吐量,也可以是两次活跃存取之间的时间量。在数据持久化(存储中最关键的部分)的写入环节,也有类似的衡量指标。

3. 存储能耗需求

所有存储设备在进行实际工作时都需要消耗电力。通常在闲置和读/写输入输出 (I/O) 工作负载期间测量此类能耗。由于用于人工智能 (AI) 的计算资源(中央处理器 (CPU) 和图形处理器 (GPU) 在数据中心总能耗中占比越来越高,IT 业界不得不对基础设施其他部分的功耗采取创新性的解决方案。

4. 存储可靠性

当数据被写入存储介质后,数据必须能够被重新读回,这是存储可靠性的最低要求。目前业界有几种公认的存储可靠性衡量指标,包括误码率 (BER) 和平均无故障时间 (MTBF)。此外,对于 HDD 和 SSD 的某些新增特性,现在还加入了每日驱动器写入量 (DWPD) 和总写入字节数 (TBW),用以表示存储设备的耐久性。

IT 存储介质

多年来,主数据中心存储解决方案经历了多次变革。从穿孔卡片开始,后来发展到磁带,再到 HDD,现在是 SSD。正是这种从 HDD 到 SSD 的变革,正在重塑当今的企业存储市场。

基于磁带和 HDD 的旧式数据存储解决方案正逐渐被 SSD 取代。

基于磁带的存储解决方案

数据中心存储时代主要始于基于磁带的解决方案。随着首批房间大小的解决方案问世,磁带逐渐消亡,取而代之的是 HDD。此后几十年,HDD 与磁带一同主导了企业存储介质市场。

有趣的是,磁带在 70 年代和 80 年代几乎被宣判死亡。不过,磁带仍被用于大量归档数据,即所谓的“冷”存储或“冻结”存储。它的存在是为了满足云和/或高性能计算 (HPC) 机构的需求,这些机构至今仍需处理世界上现存的艾字节 (EB) 到尧字节 (YB) 级别的数据。 

要理解这一点,似乎有必要讨论一下上述不同存储解决方案的独特功能。首先,我们需要以一种独特的视角来看待磁带、HDD 和 SSD 的基础知识。 

导致磁带衰落的一些特征包括:

  • 磁带存取方法的局限性:目前市售的 LTO9 磁带,其原始(未压缩)吞吐量约为 160 MB/秒。 
  • 提高磁带容量目前已非常困难:LTO9 目前支持 18TB(原始)/ 磁带盒,磁带长 1 公里,约有 9000 个磁道,其面密度约为 12 Gbpi2(千兆比特每平方英寸)。1
  • 磁带技术生态系统正不断萎缩:目前,LTO 联盟中只有三家公司——IBM、HP Enterprise 和 Quantum——正在开发新的 LTO 技术。而且只有 Fujifilm 和 Sony 在制造 LTO 介质,而 IBM 制造 LTO 驱动器。2

除了归档用途外,磁带仍用于云/HPC 数据中心的另一个原因是其能耗和寿命。本质上,磁带在未卸载状态下功耗为 0W,且介质寿命 >10 年。

HDD 存储解决方案

HDD 的市场应用范围也正在收窄,逐渐转向利基市场。与磁带一样,类似的问题也在影响着磁盘。此类问题与诸如主轴、盘片和马达等活动部件密切相关。甚至 HDD 的接口也是一大难题:

  • 磁盘存取方法和接口创新滞后:磁盘传输协议随着时间的推移已发生变化,从光纤通道 (FC)、AT 附件 (ATA)、并行 ATA (PATA) 和串行 ATA (SATA),到串行连接 SCSI (SAS)。但是, AI 接口和存取方法方面的大多数技术创新都与磁盘无缘。磁盘驱动器当前的持续吞吐量大约为 260 MB/秒。3
  • 提高磁盘容量目前已非常困难:对于旋转磁盘介质,提高存储容量和密度的唯一方法是增加每个表面的每英寸磁道数 (TPI)。MAMR 和 HAMR(微波辅助和热辅助磁记录)磁头以及 ePMR(能量辅助垂直磁记录)介质目前属于未来技术。目前市售的企业级 HDD 使用 TDMR(二维磁记录)和 PMR 介质。还有传统磁记录与叠瓦式磁记录之分,即 CMR 与 SMR。目前的 14TB Ultrastar DC HC530 数据中心 (CMR) 磁盘驱动器支持 904 Gbpi2 的面密度。4
  • 磁盘技术生态系统正不断萎缩:同样,与磁带一样,今天只有 3 家主要公司在制造企业级磁盘驱动器:Seagate、Western Digital 和东芝。 

目前 HDD 的出货量仍然很大,并且还将持续一段时间,但就像磁带一样,这些产品主要流向超大规模企业和其他拥有 EB 到 YB 级数据的客户,这些数据需要归档,而不是主动存储。

基于 SSD 的存储解决方案

没有活动部件的 SSD 是数据存储的未来。

换个角度看,SSD 和闪存技术市场正在全面繁荣。为什么?

  • 新的 AI 低延迟存取方法和接口协议以 SSD 为目标:由于 SSD 的底层介质是半导体技术,可以电子速度进行存取,并能提供微秒级的响应时间。SSD 的持续吞吐量通常为 3 GB/秒4 GB/秒 或以上。SSD 吞吐量取决于闪存集成电路 (IC) 内部的并行性、封装中闪存 IC 的数量以及 SSD 中闪存封装的数量。这使得提高驱动器吞吐量比 HDD 或磁带容易得多。如需了解有关封装的更多信息,请参见我们的文章: 《Solidigm 如何推动 SSD 封装技术的创新基石发展》

  • 提高 SSD 容量虽极为困难,但并非不可能:本质上,提高 SSD 物理容量有三种方法:介质扩展、封装扩展和每单元比特数扩展。最早的 SSD 使用单 (1) 层单元 (SLC)。目前则发展为三 (3) 层单元 (TLC) 和四 (4) 层单元 (QLC) 设备。目前市售的闪存设备已堆叠(3D NAND)至高达甚至超过每裸片 200 个闪存层。考虑到所有的扩展,确定闪存的 Gbpi2 是一个移动的目标,但通常 SSD 为 15 Gb/mm2 (~9,600 Gbpi2) 或以上。如前所述,每个封装中可以包含不止一个闪存 IC。Solidigm™ D5-P5336 QLC SSD 支持 122.88TB 的物理存储容量。 

  • SSD 生态系统正逐步扩张:NAND 闪存基于半导体,从而令更多公司致力于推进半导体技术,并推动至少一部分 SSD 生态系统的发展。虽然主要供应商只有几家(5 家且在增长),但支持组织的生态系统规模更大。 

SSD 具有所有存储介质中最快的存取时间(微秒级)、最高的总容量和 Gbpi2、最高的吞吐量(>4GB/秒/驱动器)、最低的单位存储能耗 (TB/W) 以及扩张最快的技术生态系统。因此 SSD 正在占据当今 IT 存储市场的主导地位也就不足为奇了。 

IT 应用程序工作负载正在发生变化

重要的是要意识到,应用程序是 IT 存储介质采用的主要驱动力之一。磁带从数据中心跌落神坛的一个原因是应用程序演变为开始使用随机存取存储器 (RAM)。在该系统之前,用户需要批量输入/批量输出,这推动了顺序存取技术的发展。对随机存取的需求为 HDD 成为主要存储类型创造了机遇。因此,企业应用程序及其存取模式的变化对 IT 存储介质的采用有着巨大的影响。

当前,对企业 IT 应用程序冲击最大的变化是 AI。它在过去十年间的出现令许多企业措手不及,但到现在,AI 的采用已是全速推进。 

AI 工作负载和数据存储

但不仅仅是 AI 部署 在推动企业应用程序的变革。5 

其他一些关键因素包括:

  • 新的无代码、低代码和 AI 辅助编码应用程序每天都在涌现。这些新应用程序需要具有高性能的存储、网络和处理基础设施才能良好运行。 
  • 勒索软件和网络安全正迫使 IT 部门将业务连续性和灾难恢复奉为新的核心原则。 
  • 随着边缘计算的出现,物联网 (IoT) 应用程序正在快速增长,但某些物联网系统的能耗和物理占用空间受到了严格的限制。低功耗、高容量的 SSD 存储是具有板载数据需求的物联网应用程序的天然选择。 
  • 渐进式 Web 应用程序正在开发中,以加快用户响应时间。但其也依赖于响应迅速、高性能、高扩展性的基础设施来为用户提供低延迟的回应。 

拥有能够跟上这些趋势的低功耗、更快且更高容量的 SSD 存储变得更加至关重要。

总结

存储介质的转型在数据中心并不频繁发生。有时很难预测,但如果仔细观察,是可以确定趋势的。 

SSD 已经存在了几十年。但是,与以前让应用程序专注于访问模式的努力不同,通过 SSD 中的存储介质,AI 企业存取能够按照与 SSD 相吻合的方法/接口协议进行定制,从而将 HDD 远远甩在后面。此外,SSD 的原始容量正在超越所有其他存储介质,鉴于 SSD 的低能耗,其正迅速成为任何采用 AI 的前沿企业的首选存储介质。 

磁带在被“宣判死亡”后仍存在了约 50 年。HDD 仍然存在,但业界也只能将其用于归档,直至被完全淘汰为止。SSD 确实是唯一能够跟上企业级应用程序加速变化步伐的存储介质解决方案,尤其是在各公司转为将更多 AI 纳入其数据中心工作负载这一趋势下。 


关于作者

Scott Shadley 是 Solidigm 的领导叙事总监和传播者,关注推动应用前沿存储技术,包括计算存储、基于存储的 AI 和后量子加密。Scott 在半导体和存储领域拥有超 25 年经验,在工程和关注客户方面均从事过重要职位。