下载本文的PDF版本 PDF

存储——方方面面
Randy Harr,Queue 顾问委员会成员

“存储”这个词汇在存储专家的大脑中会激发出许多想法——比计算机领域的其他大多数主题都多。业内人士之间关于存储的任何讨论都会让人想起英国诗人约翰·戈弗雷·萨克斯 (John Godfrey Saxe) 笔下著名的关于盲人观察大象的东印度传说。当他们都伸出手去触摸离自己最近的大象部分时,他们都有不同的“看法”。每个人都是正确的,但又不完全正确,因为没有一种看法可以涵盖整个画面。

计算机存储也是如此。这种观点的多样性不仅来自我们眼前可以看到的物理对象(例如,磁盘驱动器、令人讨厌的旧 SCSI 电缆等),还来自构成存储系统控制、配置、管理和架构的抽象层。

有了所有这些不同的观点,我们怎么能希望为您带来一期关于存储的综合性特刊,充分涵盖这片广阔的信息领域呢? 简短的回答是我们不能。结果将是一部非常庞大的巨著,与其说是 Queue 杂志,不如说更像是一本书。尽管如此,我们仍然认为,通过一些耐心的工作,我们可以从浩瀚的存储宇宙中开辟出一块,传递一些当今引人入胜的话题。

让我解释一下我们是如何缩小讨论范围以及原因。首先,为了明确重点,我们在此仅讨论磁盘存储,将光存储、磁带存储和半导体存储留给未来的期刊。其次,忠实于 Queue 的使命,我们从软件架构师的角度关注存储,从而排除了对存储介质和互连物理技术趋势的讨论。最后,我们寻找变化最快且最有可能在不久的将来对您产生最大影响的关键技术——从而避免深入讨论诸如 SCSI 或光纤通道等长期存在的协议。

我们本期以 Seagate Technology 的 Dave Anderson 撰写的一篇关于磁盘驱动器不断变化的面貌的文章开始。他所说的关于磁盘访问如何被抽象化和优化的内容可能会让您感到惊讶。为了理解为什么不断增长的存储和磁盘可用性和容量似乎永远不够用,我们在 Anderson 的文章中加入了一篇简短的摘要,总结了加州大学伯克利分校信息管理与科学学院的 Peter Lyman 和 Hal Varian 所做的现已著名的“How Much Data”研究。

接下来,Seagate Research 的 Erik Riedel 解释了网络存储是如何从传统的直连存储构建起来的。紧随其后的是微软 iSCSI 组的 Jeff Goldner,他为我们带来了 iSCSI 的优缺点,iSCSI 是存储系统领域的新进入者。

自从 Multics 及其后续项目 Unix 时代以来,文件系统一直是用户、应用程序编写者和信息技术管理人员查看存储的最可见方式。 Network Appliance 的 Steve Kleiman 对不断发展的文件系统提出了看法,并就新的直接访问文件系统 (DAFS) 提出了立场。

也许最精彩的部分是微软研究院的存储行业传奇人物 Jim Gray 接受的深度采访,采访者是另一位存储技术资深人士,加州大学伯克利分校的 Dave Patterson。我们还收录了 Scale8 的 Josh Coates 的一篇观点文章,提醒我们为什么应该(或不应该,视情况而定)在那些复杂的存储系统上花费大量资金。

我想特别感谢 Clint Jurgens 和 Jim Gray 对本期期刊的帮助。没有他们在阅读、编辑、倾听等方面的协助,本期期刊根本不可能完成。阅读并享受吧。

RANDY HARR,adVenture Planner,RED Associates,最近担任 Intransa 的联合创始人,Intransa 是一家仍处于隐身模式的存储网络初创公司。作为其工程副总裁兼首席架构师,他开发了一款具有五年架构扩展的入门级产品。在加入 Intransa 之前,Harr 在 Synopsys 的高级技术集团工作了五年,在那里他构思并指导了高级产品开发。在 Synopsys 工作期间,他被任命为国防高级研究计划局 (DARPA) 微系统技术办公室 (MTO) 的三年职务。

acmqueue

最初发表于 Queue 第 1 卷,第 4 期
数字图书馆 中评论本文





更多相关文章

Pat Helland - 关注你的状态,为了你的心态
应用程序在进入分布式和可扩展的世界后,经历了有趣的演变。 同样,存储及其近亲数据库也与应用程序并驾齐驱地发生了变化。很多时候,存储和应用程序的语义、性能和故障模型都在微妙地跳舞,以支持不断变化的业务需求和环境挑战。向组合中添加规模确实激起了风波。本文着眼于其中的一些问题及其对系统的影响。


Alex Petrov - 现代存储系统背后的算法
本文仔细研究了现代数据库中使用的两种存储系统设计方法(读取优化的 B 树和写入优化的 LSM(日志结构合并)树),并描述了它们的使用案例和权衡。


Mihir Nanavati, Malte Schwarzkopf, Jake Wires, Andrew Warfield - 非易失性存储
在大多数执业计算机科学家的整个职业生涯中,一个基本观察结果一直成立:CPU 的性能和成本都远高于 I/O 设备。 CPU 可以以极高的速率处理数据,同时为多个 I/O 设备提供服务,这一事实对各种规模系统的硬件和软件设计产生了广泛的影响,几乎从我们开始构建它们以来就一直如此。


Thanumalayan Sankaranarayana Pillai, Vijay Chidambaram, Ramnatthan Alagappan, Samer Al-Kiswany, Andrea C. Arpaci-Dusseau, Remzi H. Arpaci-Dusseau - 崩溃一致性
数据的读取和写入是任何冯·诺依曼计算机最基本的方面之一,但却出人意料地微妙且充满细微差别。 例如,考虑在具有多个处理器的系统中访问共享内存。 虽然程序员最容易理解的简单直观的方法(称为强一致性)最容易理解,但许多较弱的模型已被广泛使用(例如,x86 总存储顺序); 这些方法提高了系统性能,但代价是使关于系统行为的推理更加复杂且容易出错。





© 保留所有权利。

© . All rights reserved.