随着更新、更好、更快的存储介质的出现,多年来,一个数据字节的存储方式多种多样。字节是数字信息的单位,通常指八位。位是信息的单位,可以表示为 0 或 1,代表逻辑状态。让我们简要回顾一下历史,了解位和字节的起源。
回溯到巴贝奇的分析机,您可以看到位被存储为机械齿轮或杠杆的位置。在纸卡的情况下,位被存储为纸卡上特定位置是否存在孔。对于磁存储设备,例如磁带和磁盘,位由磁膜特定区域的极性表示。在现代 DRAM(动态随机存取存储器)中,位通常表示为存储在电容器中的两个电荷水平,电容器是一种在电场中存储电能的设备。(在 1960 年代早期,用于为 IBM 大型机输入程序的纸卡被称为霍勒里斯卡,以其发明者,制表机公司的赫尔曼·霍勒里斯的名字命名——该公司经过多次合并,就是现在的 IBM。)
1956 年 6 月,Werner Buchholz (archive.computerhistory.org) 创造了单词 byte (archive.org),指代用于编码 单个文本字符 (bobbemer.com) 的一组位。让我们讨论字符编码,从 ASCII(美国信息交换标准代码)开始。ASCII 基于英文字母表;因此,每个字母、数字和符号(a-z、A-Z、0-9、+、-、/、"、! 等)都表示为介于 32 和 127 之间的七位整数。这对其他语言不是很友好。为了支持其他语言,Unicode 扩展了 ASCII,以便每个字符都表示为一个代码点。例如,小写字母 j
是 U+006A
,其中 U
代表 Unicode,后跟一个十六进制数字。
UTF-8 是将字符表示为八位的标准,允许将 0 到 127 之间的每个代码点存储在一个字节中。这对于英文字符来说很好,但其他语言的字符通常表示为两个或多个字节。UTF-16 是将字符表示为 16 位的标准,UTF-32 是 32 位的标准。在 ASCII 中,每个字符都是一个字节,但在 Unicode 中,情况通常并非如此——一个字符可以是一个、两个、三个或更多字节。字符组也可能被称为字,如 此链接的 Univac 广告 (archive.org) 中所说的“1 千字或 12,000 个字符”。本文通篇指的是不同大小的位组——字节中的位数过去根据存储介质的设计而有所不同。
本文还穿越时空,回顾各种存储介质,深入探讨数据在整个历史中的存储方式。这绝不包括曾经制造、销售或分销的每一种存储介质。本文旨在寓教于乐,提供信息,但并非百科全书式。文章最后展望了当前和未来的存储技术。
首先,假设我们有一个字节的数据要存储:字母 j,
或编码后的字节 6a
,或二进制 01101010
。当我们穿越时空时,这个数据字节将在本文涵盖的一些存储技术中发挥作用。
故事始于 1951 年,用于 Univac 1 计算机的 Uniservo 磁带驱动器,这是为商用计算机制造的第一个磁带驱动器。磁带是三磅重的薄条(半英寸)镀镍磷青铜,称为 vicalloy,长 1,200 英尺。我们的数据字节可以以每秒 7,200 个字符 (computerhistory.org) 的速率存储在以每秒 100 英寸速度移动的磁带上。在历史的这个阶段,您可以通过磁带行进的距离来衡量存储算法的速度。
让我们快进一年到 1952 年 5 月 21 日,当时 IBM 宣布了其首个磁带单元 IBM 726。我们的数据字节现在可以从 Uniservo 金属磁带转移到 IBM 的磁带上。对于我们非常小的数据字节来说,这个新家会非常舒适,因为磁带最多可以存储 200 万个数字。这种磁性七轨磁带以每秒 75 英寸的速度移动,传输速率为每秒 12,500 个数字 (ibm.com) 或 7,500 个字符 (ibm.com)——当时称为复制组。作为参考,本文有 35,123 个字符。
七轨磁带有六条数据轨道和一条用于维护奇偶校验的轨道,方法是确保字符串中 1 位的总数为偶数或奇数。数据以每线性英寸 100 位的密度记录。该系统使用真空通道方法来保持磁带环路在两点之间循环。这使得磁带驱动器可以在瞬间启动和停止磁带。这是通过在磁带盘和读/写头之间放置长真空柱来实现的,以吸收磁带中张力的突然增加,否则磁带通常会断裂。磁带盘背面的可拆卸塑料环提供写保护。大约 1.1 MB 的数据可以存储在 一卷磁带 (spectrum.ieee.org) 上。
回想一下 VHS 磁带:将电影归还给百视达之前需要做什么?倒带!计算机使用的磁带也是如此。程序不能在磁带上跳跃或随机访问数据——它们必须按顺序读取和写入。
1956 年,随着 IBM 完成交付给 旧金山 Zellerbach Paper (ibm.com) 的 305 RAMAC 计算机,磁盤存储时代开始了。这台计算机是第一台使用移动磁头 HDD(硬盘驱动器)的计算机。RAMAC 磁盘驱动器由 50 个磁性涂层 24 英寸直径的金属盘片组成,能够以每字符 7 位的密度存储约 500 万个字符的数据,并以每分钟 1,200 转的速度旋转。存储容量约为 3.75 MB。
与磁带或穿孔卡片不同,RAMAC 允许实时随机访问大量数据。IBM 宣传 RAMAC 能够存储相当于 64,000 张穿孔卡片 (youtube.com) 的数据。以前,交易会被保存,直到积累了一组数据并进行批处理。RAMAC 引入了随着交易发生而持续处理交易的概念,以便在数据新鲜时立即检索数据。我们的数据字节现在可以在 RAMAC 中以每秒 100,000 位 (ibm.com) 的速度访问。在此之前,使用磁带时,人们必须编写和读取顺序数据,并且无法随机跳转到磁带的各个部分。当时,数据的实时随机访问确实是革命性的。
DECtape 于 1963 年推出。它的名字来源于数字设备公司 (Digital Equipment Corporation),简称 DEC。DECtape 价格低廉且可靠,因此被用于多代 DEC 计算机。这种 ¾ 英寸的磁带被层压并夹在四英寸卷轴上两层 Mylar 之间。
DECtape 可以手动携带,这与其笨重的前身形成对比,使其非常适合个人计算机。与七轨磁带相比,DECtape 有六条数据轨道、两条标记轨道和两条时钟轨道。数据以每英寸 350 位的密度记录。我们的数据字节是八位,但可以扩展到 12 位,可以以每秒 8,325 个 12 位字的速率传输到 DECtape,磁带速度为每秒 93 +/-12 英寸 (pdp8.net)。这比 1952 年的 Uniservo 金属磁带每秒多传输百分之八的数字。
四年后,在 1967 年,IBM 的一个小团队开始研究 IBM 软盘驱动器,代号为 Minnow (ibm.com)。当时,该团队的任务是开发一种可靠且廉价的方式,将微代码加载到 IBM System/370 大型机 (archive.org) 中。然后,该项目被重新分配和重新定位,以将微代码加载到用于 IBM 3330 直接访问存储设备(代号 Merlin)的控制器中。
我们的数据字节现在可以存储在只读的八英寸柔性 Mylar 磁盘上,该磁盘涂有磁性材料,称为软盘。在发布时,该项目的成果被命名为 IBM 23FD 软盘驱动器系统。这些磁盘可以容纳 80 KB 的数据。与硬盘驱动器不同,用户可以轻松地将软盘从一个驱动器转移到另一个驱动器,并放在其保护套中。后来,在 1973 年,IBM 发布了读/写软盘驱动器,然后它成为了 行业标准 (web.archive.org)。
1969 年,AGC(阿波罗制导计算机)只读绳索存储器搭载阿波罗 11 号升空,阿波罗 11 号载着美国宇航员往返月球。这种绳索存储器是手工制作的,可以容纳 72 KB 的数据。制造绳索存储器既费力又缓慢,并且需要类似于纺织工作的技能;将程序编织 到绳索存储器中 (authors.library.caltech.edu) 可能需要数月时间,如图 1 所示。但它是当时抵抗太空严酷环境的正确工具。当一根电线穿过其中一个圆形磁芯时,它表示 1。围绕磁芯的电线表示 0。我们的数据字节将需要一个人花费几分钟才能编织到绳索中。
Commodore PET 是第一台(成功的)大众市场个人计算机,于 1977 年发布。PET 内置了一个 Commodore 1530 Datasette(data 和 cassette 的组合词)。PET 将数据转换为模拟声音信号,然后将其 存储在盒式磁带 (wav-prg.sourceforge.net) 上。这提供了一种经济高效且可靠的存储解决方案,尽管速度非常慢。我们的小数据字节可以以大约每秒 60-70 字节 (c64-wiki.com) 的速率传输。盒式磁带每 30 分钟的单面可以容纳约 100 KB 的数据,每盘磁带有两面。例如,您可以在盒式磁带的一面容纳大约两张(“rickroll”警告)55 KB 图像 (blog.jessfraz.com)。Datasette 也出现在 Commodore VIC-20 和 Commodore 64 中。
让我们快进一年到 1978 年,当时 MCA 和 Philips 以 Discovision 的名义推出了 LaserDisc。大白鲨是北美地区在 LaserDisc 上销售的第一部电影。LaserDisc 的音频和视频质量远优于竞争对手,但对于大多数消费者来说太贵了。与消费者可以用来录制电视节目的 VHS 磁带不同,LaserDisc 不能写入。LaserDisc 使用模拟视频,带有 模拟 FM 立体声音频和 PCM(脉冲编码调制)数字音频 (tools.ietf.org)。光盘直径为 12 英寸,由两张单面铝盘分层在塑料中组成。LaserDisc 今天被人们铭记为 CD 和 DVD 的基础。
一年后,在 1979 年,Alan Shugart 和 Finis Conner 创立了希捷科技,他们的想法是将硬盘驱动器缩小到与当时的 5¼ 英寸软盘相同的尺寸。他们的第一个产品是 1980 年的希捷 ST506,这是第一款用于微型计算机的 HDD。这款 5¼ 英寸的磁盘可容纳 5 MB 的数据,这在当时是标准软盘的五倍。它是一个刚性的金属盘片,两侧都涂有一层薄薄的磁性材料来存储数据。我们的数据字节可以以每秒 625 KB/s (pcmag.com) 的速度传输到磁盘上。这大约是每秒一张(第二次也是最后一次“rickroll”警告)625 KB 动画 GIF (blog.jessfraz.com)。
几年后,索尼推出了首款 3½ 英寸软盘驱动器。惠普是 1982 年首个采用该技术的公司,推出了 HP-150。这使 3½ 英寸软盘声名鹊起,并在 行业中得到广泛分销 (jstor.org)。这些磁盘是单面的,格式化容量为 161.2 KB,未格式化容量为 218.8 KB。1982 年,双面版本问世,微型软盘行业委员会(一个由 23 家媒体公司组成的联盟)基于索尼的原始设计制定了 3½ 英寸软盘的规范,将该格式写入了 历史 (americanradiohistory.com)。我们的数据字节现在可以存储在最广泛分发的存储介质之一的早期版本上:3½ 英寸软盘。
1984 年,索尼和飞利浦宣布推出 CD-ROM(只读光盘存储器),可容纳 550 MB 的预录数据。这种格式是从 CD-DA(数字音频光盘)发展而来的,CD-DA 是这两家公司在 1982 年开发的。CD-DA 用于发行音乐,容量为 74 分钟。据说,当索尼和飞利浦就 CD-DA 的标准进行谈判时,参与的四个人中有一个人坚持认为它应该能够容纳 贝多芬的第九交响曲全集 (wired.com)。CD-ROM 上发布的第一款产品是 1985 年推出的格罗里电子百科全书。该百科全书包含 900 万个单词,仅占可用空间的 12%,即 553 兆字节 (books.google.co.uk)。百科全书和我们的数据字节都有足够的空间。此后不久,在 1985 年,计算机和电子公司共同制定了光盘标准,以便任何计算机都能够访问信息。
同样在 1984 年,藤尾増岡发表了他关于一种新型浮栅存储器(称为闪存)的研究成果,该存储器能够多次擦除和重新编程。
让我们首先回顾一下浮栅存储器的工作原理。它使用晶体管,晶体管是可以单独打开和关闭的电子门。由于每个晶体管可以处于两种不同的状态(开或关),因此它可以存储两个不同的数字:0 和 1。浮栅指的是添加到中间晶体管的第二个栅极。第二个栅极由薄氧化层绝缘。这些晶体管使用施加到晶体管栅极的小电压来表示它是开还是关,这反过来转化为 0 或 1。
使用浮栅时,当在氧化层上施加合适的电压时,电子会隧穿过氧化层并卡在浮栅上。因此,即使电源断开,电子仍然存在于浮栅上。当浮栅上没有电子时,它表示 1;当电子被困在浮栅上时,它表示 0。反转此过程并在氧化层上沿相反方向施加合适的电压会导致电子隧穿离开浮栅,并将晶体管恢复到其原始状态。因此,这些单元被制成 可编程和非易失性 (economist.com)。我们的数据字节可以编程到晶体管中,表示为 01001010
,电子被困在浮栅中以表示零。
増岡的设计比 EEPROM(电可擦可编程只读存储器)更经济实惠,但灵活性较差,因为它需要同时擦除多组单元,但这也有助于提高其速度。当时,増岡在东芝工作,但在不久后辞职,成为东北大学的教授。他对东芝没有因他的工作而奖励他感到不满,并起诉该公司,要求对其工作进行赔偿。该案件于 2006 年以一次性支付 8700 万日元(相当于 758,000 美元)的和解告终。考虑到闪存对行业的影响,这仍然显得很低。
在讨论闪存时,让我们看一下 NOR 闪存和 NAND 闪存之间的区别。闪存将信息存储在由浮栅晶体管组成的存储单元中。这些技术的名称直接与存储单元的组织方式有关。
在 NOR 闪存中,各个存储单元并联连接,从而实现随机访问。这种架构实现了微处理器指令随机访问所需的短读取时间。NOR 闪存非常适合主要为只读的低密度应用。这就是为什么大多数 CPU 通常从 NOR 闪存加载其固件的原因。増岡及其同事在 1984 年提出了 NOR 闪存的发明,并在 1987 年提出了 NAND 闪存 (ieeexplore.ieee.org)。
相比之下,NAND 闪存设计人员放弃了随机访问能力,以换取更小的存储单元尺寸。这也带来了更小的芯片尺寸和更低的每比特成本的好处。NAND 闪存的架构由串联连接的八个存储晶体管阵列组成。这导致了高存储密度、更小的存储单元尺寸以及更快的写入和擦除速度,因为它一次可以编程数据块。但这需要以必须覆盖数据(当数据不是顺序写入且 数据已存在于块中时 (aturing.umcs.maine.edu))为代价。
让我们快进到 1991 年,当时 SanDisk(当时称为 SunDisk (computerhistory.org))为 IBM 制造了一个用于评估的 SSD(固态磁盘)模块。这种设计将闪存阵列和非易失性存储芯片与智能控制器相结合,以自动检测和纠正有缺陷的单元。该磁盘采用 2½ 英寸外形尺寸,容量为 20 MB,售价约为 1,000 美元 (meseec.ce.rit.edu)。IBM 最终将其用于 ThinkPad 笔式计算机 (westerndigital.com)。
1994 年,Iomega 发布了 Zip 磁盘,这是一种采用 3½ 英寸外形尺寸的 100 MB 盒式磁盘,比标准 3½ 英寸磁盘稍厚。Zip 磁盘的更高版本可以存储高达 2 GB 的数据。这些磁盘具有与软盘一样小的便利性,但能够容纳更多数据,这使其具有吸引力。我们的数据字节可以以 1.4 MB/s 的速度写入 Zip 磁盘。当时,1.44 MB 3½ 英寸软盘的写入速度约为 16 kB/s。在 Zip 驱动器中,磁头是非接触式读/写,并在表面上方飞行,这类似于硬盘驱动器,但与其他软盘不同。由于可靠性问题和 CD 的经济性,Zip 磁盘最终变得过时。
同样在 1994 年,SanDisk 推出了 CompactFlash,它被广泛应用于消费设备,例如数码相机和摄像机。与 CD-ROM 一样,CompactFlash 速度也基于 x 评级(8x、20x、133x 等)。最大传输速率是根据原始音频 CD 的 150 kB/s 传输速率计算的。这看起来像 R = K × 150 kB/s
,其中 R
是传输速率,K
是速度评级。对于 133x CompactFlash,我们的数据字节将以 133 × 150 kB/s
或大约 19,950 kB/s 或 19.95 MB/s 的速度写入。CompactFlash 协会成立于 1995 年,旨在为基于闪存的存储卡创建行业标准。
几年后的 1997 年,CD-RW(可重写光盘)问世。这种光盘用于数据存储,以及备份和将文件传输到各种设备。CD-RW 只能重写约 1,000 次,这在当时不是一个限制因素,因为用户很少在一个光盘上覆盖数据。
CD-RW 基于相变技术。在给定介质的相变过程中,介质的某些特性会发生变化。在 CD-RW 的情况下,由银、碲和铟组成的特殊化合物中的相移会导致反射面和非反射凸点,每个凸点代表 0 或 1。当化合物处于晶态时,它是半透明的,表示 1。当化合物熔化成非晶态时,它变得不透明且不反射,表示 0 (computer.howstuffworks.com)。我们可以用这种方式将我们的数据字节 01001010
写成非反射凸点和反射面。
CD-RW 最终失去了大部分市场份额给 DVD。
1999 年,IBM 推出了当时世界上最小的硬盘驱动器:IBM 微硬盘,容量分别为 170 MB 和 340 MB。这些是小型硬盘,尺寸为一英寸,设计用于安装在 CompactFlash Type II 插槽中。其目的是创建一种像 CompactFlash 一样使用但具有更大存储容量的设备。然而,这些很快就被 USB 闪存驱动器和更大的 CompactFlash 卡所取代,因为后者变得可用。与其他硬盘驱动器一样,微硬盘是机械的,包含小型旋转盘片。
USB 闪存驱动器于 2000 年推出。这些驱动器由闪存组成,封装在一个小尺寸的外形中,并带有 USB 接口。根据使用的 USB 接口版本,速度会有所不同:USB 1.1 限制为 1.5 Mbps,而 USB 2.0 可以处理 35 Mbps,USB 3.0 可以处理 625 Mbps (diffen.com)。首款 USB 3.1 Type-C 驱动器于 2015 年 3 月发布,其读/写速度为 530 Mbps (web.archive.org)。与软盘和光盘不同,USB 设备更难划伤,但仍然提供数据存储、传输和备份文件的相同用例。因此,软盘和光盘驱动器此后逐渐不受欢迎,取而代之的是 USB 端口。
HDD 制造商于 2005 年开始出货使用 PMR (垂直磁记录) (youtu.be) 的产品。有趣的是,这与苹果公司发布 iPod Nano 的时间相同,iPod Nano 使用闪存而不是 iPod Mini 中的一英寸硬盘驱动器,这引起了一点 行业骚动 (eetimes.com)。
典型的硬盘驱动器包含一个或多个刚性磁盘,这些磁盘涂有磁性敏感膜,该膜由微小的磁性晶粒组成。当磁性写入头在旋转的磁盘上方飞行时,数据会被记录下来,这很像唱片播放器和唱片,只是唱针与唱片物理接触。当盘片旋转时,与其接触的空气会产生轻微的微风。正如飞机机翼上的空气产生升力一样,空气也会在磁头的翼型上产生 升力 (books.google.com)。写入头快速翻转晶粒的磁化方向,使其磁极指向上或下,以表示 1 或 0。
PMR 的前身是 LMR(纵向磁记录)。PMR 可以提供比 LMR 高三倍以上的存储密度。两者之间的主要区别在于,PMR 介质的晶粒结构和存储数据的磁方向是柱状的而不是纵向的。PMR 由于更好的晶粒分离和均匀性,因此具有更好的热稳定性和改进的 SNR(信噪比)。它还受益于更好的可写性,因为具有更强的磁头场和更好的介质磁对准。与 LMR 一样,PMR 的基本限制也基于磁性写入数据位的热稳定性以及具有足够的 SNR 以读回信息的需求。
日立环球存储科技公司在 2007 年宣布了首款 1TB HDD。日立 Deskstar 7K1000 使用了五个 3.5 英寸 200 GB 盘片,并以 7,200 RPM 的速度旋转。这与世界上第一款 HDD IBM RAMAC 350 形成鲜明对比,后者的存储容量约为 3.75 MB。在 51 年的时间里,我们取得了多么大的进步!但是等等,还有更多。
2009 年,NVMe(非易失性存储器快速) (flashmemorysummit.com) 的技术工作开始启动。NVM 是一种具有持久性的存储器类型,与易失性存储器(需要持续供电才能保留数据)形成对比。NVMe 满足了对基于 PCIe(外围组件互连快速)-based SSDs (nvmexpress.org) 的可扩展主机控制器接口的需求。超过 90 家公司参与了开发该设计的工作组。这一切都基于先前定义 NVMHCIS(非易失性存储器主机控制器接口规范)的工作。打开现代服务器可能会发现一些 NVMe 驱动器。如今,最好的 NVMe 驱动器可以实现大约 3,500 MB/s 的读取速度和 3,300 MB/s 的写入速度 (pcgamer.com)。对于我们最初使用的数据字节,字符 j
,与为阿波罗制导计算机手工编织绳索存储器花费几分钟相比,这非常快。
现在我们已经穿越了一段时间,让我们看一下 SCM(存储类内存)的最新技术水平。与 NVM 一样,SCM 具有持久性,但更进一步,它还提供比主存储器更好或相当的性能,以及 字节寻址能力 (ieeexplore.ieee.org)。SCM 旨在解决当今缓存面临的一些问题,例如 SRAM(静态随机存取存储器)的低密度。DRAM (arxiv.org) 提供了更好的密度,但这以较慢的访问时间为代价。DRAM 也存在需要持续供电才能刷新内存的问题。
让我们稍微分解一下。由于电容器上的电荷会一点一点地泄漏,因此需要供电;这意味着如果没有干预,芯片上的数据很快就会丢失。为了防止这种泄漏,DRAM 需要一个外部内存刷新电路,该电路定期重写电容器中的数据,将其恢复到原始电荷。
为了解决密度和功率泄漏问题,正在开发一些 SCM 技术:PCM(相变存储器)、STT-RAM(自旋转移矩随机存取存储器)和 ReRAM(阻变式随机存取存储器)。所有这些技术的一个优点是它们能够充当 MLC(多级单元)。这意味着与只能存储每个存储单元或元素的 SLC(单级单元)相比,它们可以存储多个比特的信息。通常,一个存储单元由一个 MOSFET(金属氧化物半导体场效应晶体管)组成。MLC 减少了存储与 SLC 相同数量数据所需的 MOSFET 数量,使其更密集或更小,从而提供与使用 SLC 的技术相同的存储量。让我们回顾一下这些 SCM 技术中的每一种是如何工作的。
PCM 与前面描述的 CD-RW 的相变类似。其相变材料通常为 GST 或 GeSbTe(锗-锑-碲),它可以以两种不同的状态存在:非晶态和晶态。非晶态的电阻高于晶态,前者表示 0,后者表示 1。通过为中间电阻分配数据值,PCM 可以用作 MLC (ieeexplore.ieee.org) 来存储多种状态。
STT-RAM 由两个铁磁性永磁层组成,这两层之间用电介质(一种可以传输电力而不导电的绝缘体)隔开。它根据磁方向的差异存储数据位。一个磁层(称为参考层)具有固定的磁方向,而另一个磁层(称为自由层)的磁方向由电流控制。对于 1,两层的磁化方向对齐。对于 0,两层具有相反的磁方向。
ReRAM 单元由两个金属电极组成,这两个电极之间用金属氧化物层隔开。这类似于増岡最初的闪存设计,在闪存设计中,电子会隧穿过氧化层并卡在浮栅中,反之亦然。然而,对于 ReRAM 而言,单元的状态由金属氧化物层中氧空位的浓度决定。
虽然这些 SCM 技术很有前景,但它们仍然存在缺点。PCM 和 STT-RAM 具有高写入延迟。PCM 的延迟是 DRAM 的 10 倍,而 STT-RAM 的延迟是 SRAM 的 10 倍。PCM 和 ReRAM 在发生硬错误之前对写入耐久性有限制,这意味着存储单元会 卡在特定值 (arxiv.org)。
2015 年 8 月,英特尔宣布推出 Optane,这是一款基于 3DXPoint,发音为 3D 交叉点 (anandtech.com) 的产品。Optane 声称性能比 NAND SSD 快 1,000 倍,性能是 NAND SSD 的 1,000 倍,而价格是闪存的四到五倍。Optane 证明 SCM 不仅仅是实验性的。观察这些技术如何发展将是一件有趣的事情。
HHDD(氦气硬盘驱动器)是一种高容量 HDD,在制造过程中填充氦气并进行气密密封。与前面介绍的其他硬盘一样,它很像唱片播放器,带有旋转的磁性涂层盘片。典型的 HDD 腔体内只有空气,但空气会对盘片的旋转产生一定的阻力。
氦气球会漂浮,因此我们知道氦气比空气轻。事实上,氦气的密度是空气的七分之一,因此减少了盘片旋转的阻力,从而减少了磁盘旋转所需的能量。这实际上是一个次要特征;氦气的主要优点是它允许在外形尺寸相同的空间内封装七个盘片,而通常只能容纳五个盘片。尝试使用充气驱动器这样做会导致湍流。如果您还记得早期的飞机机翼类比,这完全符合。氦气减少了阻力,从而消除了湍流。
然而,众所周知,充气气球在几天后开始下沉,因为气体正在逸出气球。这些驱动器也是如此。制造商花费了数年时间才创造出一个容器,可以防止氦气在外形尺寸的寿命内逸出。Backblaze 发现 HHDD 的年化错误率较低,为 1.03%,而标准硬盘驱动器的年化错误率为 1.06%。当然,这个差异太小了,很难从中得出太多结论 (backblaze.com)。
充氦外形尺寸可以封装使用 PMR 的 HDD,也可以包含 MAMR(微波辅助磁记录)或 HAMR(热辅助磁记录)驱动器。任何磁存储技术都可以与氦气而不是空气配对。2014 年,HGST(日立环球存储科技公司)将其两种尖端技术结合到其 10TB HHDD 中,该 HHDD 使用主机管理的 SMR(叠瓦式磁记录)。
前面介绍的 PMR 是 SMR 的前身。与 PMR 相比,SMR 写入的新磁道与先前写入的磁道部分重叠,这反过来又使先前的磁道变窄,从而实现更高的磁道密度。该技术的名称源于重叠的磁道类似于屋顶瓦片。
SMR 导致写入过程复杂得多,因为写入一个磁道最终会覆盖相邻的磁道。当磁盘盘片为空且数据是顺序的时,这不会起作用。但是,一旦您写入一系列已经包含数据的磁道,此过程就会对现有的相邻数据造成破坏。如果相邻磁道包含有效数据,则必须重写该磁道。这与前面介绍的 NAND 闪存非常相似。
设备管理的 SMR 设备通过让设备固件管理其复杂性来隐藏这种复杂性,从而产生一个类似于您可能遇到的任何其他硬盘驱动器的接口。主机管理的 SMR 设备则相反,依赖于操作系统来了解如何处理驱动器的复杂性。
希捷于 2013 年开始出货 SMR 硬盘,声称其密度比 PMR 高 25% (anandtech.com)。
MAMR 是一种能量辅助磁存储技术,类似于接下来将介绍的 HAMR,它使用 20 到 40 GHz 的频率,用环形微波场轰击磁盘盘片。这降低了其矫顽力,意味着盘片的磁性材料对磁化变化的抵抗力较低。正如已经讨论过的,盘片区域磁化的变化用于表示 0 或 1,因此由于盘片对磁化变化的抵抗力较低,数据可以更密集地写入。这项新技术的核心是自旋力矩振荡器,它用于产生微波场,而不会牺牲可靠性。
西部数据(Western Digital),也称为 WD,在 2017 年推出了这项技术 (storagereview.com)。东芝 (Toshiba) 紧随其后,于 2018 年推出 (theregister.co.uk)。当 WD 和东芝忙于追求 MAMR 时,希捷 (Seagate) 正在押注 HAMR。
HAMR 是一种能量辅助磁存储技术,旨在通过使用激光传递的热量来帮助将数据写入盘片表面,从而大大增加可以存储在磁性设备(如 HDD)上的数据量。热量使数据位在盘片上更加紧密,从而实现更高的数据密度和容量。
这项技术非常难以实现。一个 200 毫瓦的激光器在写入数据之前,快速将区域中的微小区域加热到 750 华氏度(400 摄氏度),同时不会干扰或破坏磁盘上其余的数据 (fstoppers.com)。加热、写入数据和冷却的过程必须在不到一纳秒的时间内完成。这些挑战需要开发纳米级表面等离子体激元(也称为表面引导激光),而不是直接基于激光的加热,以及新型玻璃盘片和热控制涂层,以承受快速的点加热,而不会损坏记录头或任何附近的数据,以及需要克服的各种其他技术挑战 (seagate.com)。
尽管许多人持怀疑态度,希捷还是在 2013 年 (computerworld.com) 首次展示了这项技术。它于 2018 年 (blog.seagate.com) 开始出货首批驱动器。
本文从 1951 年最先进的存储介质开始,并在展望存储技术的未来后结束。存储随着时间的推移发生了很大变化,从纸带到金属带、磁带、绳索存储器、旋转磁盘、光盘、闪存等等。进步带来了更快、更小、性能更强的存储设备。
将 NVMe 与 1951 年的 Uniservo 金属带进行比较表明,NVMe 每秒可以读取多出 486,111% 的数字。将 NVMe 与 1994 年的 Zip 磁盘进行比较,您会看到 NVMe 每秒可以读取多出 213,623% 的数字。
唯一不变的是 0 和 1 的存储。实现这一目标的方式千差万别。我希望下次您为朋友刻录包含歌曲的 CD-RW,或在光盘存档中存储家庭视频时(是的,你没听错 (pro.sony)),您会想到非反射凸点如何转化为 0,而磁盘的反射区域如何转化为 1。如果您正在制作盒式磁带混音带,请记住,这些与 Commodore PET 中使用的 Datasette 密切相关。最后,请记住要友善并倒带(这是对百视达的致敬,但今天仍然有 开放格式用于磁带 (wikipedia.org))。
感谢 Robert Mustacchi (https://twitter.com/rmustacc)、Trammel Hudson (https://twitter.com/qrs) 和 Rick Altherr (https://twitter.com/kc8apf) 在整篇文章中提供的点滴信息(我情不自禁)。
最昂贵的单字节错误
Ken、Dennis 和 Brian 在以空字符结尾的文本字符串方面是否做出了错误的选择?
Poul-Henning Kamp
https://queue.org.cn/detail.cfm?id=2010365
您应该上传还是运送大数据到云端?
普遍接受的观点并不总是正确的。
Sachin Date
https://queue.org.cn/detail.cfm?id=2933408
为了乐趣和利润注入错误
错误检测和纠正功能的好坏取决于我们测试它们的能力。
Steve Chessin
https://queue.org.cn/detail.cfm?id=1839574
Jessie Frazelle 是 Oxide Computer Company 的联合创始人兼首席产品官。在此之前,她曾在 Linux 的各个部分工作,包括容器以及 Go 编程语言。
版权 © 2020 归所有者/作者所有。出版权已授权给 。
最初发表于 Queue 第 18 卷第 3 期—
在 数字图书馆 中评论这篇文章