下载本文的PDF版本 PDF

先驱者的灵光一闪

吉姆·格雷对闪存存储的远见构成了本期主题的基石。

BRYAN CANTRILL,SUN MICROSYSTEMS

在《Queue》五/六月刊中,埃里克·奥尔曼撰写了一篇纪念吉姆·格雷的文章,提到《Queue》将在未来几个月刊登吉姆的一些最佳作品。我很惭愧地承认,当最初讨论这个想法时,我以为这些论文将主要由吉姆关于数据库的开创性工作组成——这仅仅表明我(与《Queue》编辑委员会的其他所有人不同)从未了解吉姆。为了更多地了解他的工作和吉姆本人,我参加了五月在加州大学伯克利分校为他举行的纪念活动。

我深受感动,不仅因为吉姆是一位伟大的、富有冒险精神的思想家,而且他还是一位脚踏实地的人。这种微妙的平衡贯穿了他一生的工作:IBM System R 的人们谈到,他在一年内不仅写了九篇论文,还编写了一万行代码。威斯康星大学的数据库研究人员描述了吉姆如何在事务处理领域进行了如此多的开创性工作之后,又开创了数据库基准测试,在一篇经典的《Datamation》论文中开发了后来成为事务处理性能委员会的前身。他的 Tandem 同事谈到,他如何超越研发,与领域和客户互动,以找出(并发布!)系统实际失败的原因——这对于一家以“NonStop”著称每种产品的公司来说,是一个相当大的突破!吉姆在微软的同事们谈到,他推动性的愿景是在网络上建立一个人们真正会使用的大型数据库,从而促使他开发了 TerraServer,以及他激励和协助后续项目(如斯隆数字巡天和微软研究院的世界望远镜)的能力——这些系统解决了困难的抽象问题,并交付了可观的实际成果。

鉴于吉姆坚持在关注宏大的、面向未来的想法的同时,设计和实施眼前的实际系统,他和《Queue》彼此之间有着天然的亲和力也就不足为奇了。在听吉姆纪念活动的演讲时,我开始问自己一个问题,我想其他人也可能在问:如果吉姆在这里,如果我能和他进行一次对话,那会谈论什么呢?对我来说,答案很明确:我想和他谈谈即将到来的基于闪存的存储革命,这也是本期《Queue》的重点。把这期杂志组织起来令人兴奋,因为正如亚当·莱文塔尔的文章《今日闪存存储》所讨论的那样,闪存的经济性已将其从配角提升为主角:闪存正从单纯的好奇心发展成为存储层次结构中的一个新层级——也许是自 1956 年 IBM RAMAC 推出以来的第一个这样的层级!

这种发展正是吉姆显然津津乐道的那种变革——以至于在听他的纪念活动时,我开始怀疑他在失踪之前是否思考或发表过任何关于基于闪存的存储的文章。由于闪存的经济性快速变化,吉姆本需要特别有洞察力(在他失踪时,闪存的价格是现在的两倍多),但这似乎是可能的。他在微软的同事不知道他写过任何关于这个主题的具体内容,但指引我到他的网站查看他的论文列表。考虑到已发表的作品可能太旧了,我可能已经走到了死胡同,但我还是去了那个网站——我在那里看到的东西几乎让我惊掉了下巴:倒数第二个链接是“闪存盘的激进观点”,链接到一个文档和一个演讲。感谢吉姆家人的支持,我们得以在本期杂志中发表了他与同事鲍勃·菲茨杰拉德合写的论文《服务器应用中闪存盘的机会》。它很粗糙,数字现在也过时了——但吉姆清楚地看到了他面前的未来,读者能够站在他的肩膀上,这是一种独特的乐趣。

发现吉姆的作品启发我们为本期杂志添加了另外两篇论文。首先,自从吉姆研究这个问题以来,一个重要的障碍已被消除:他描述的设备级问题——困扰消费级闪存 SSD(固态硬盘)的问题——在新一代企业级闪存 SSD 中已在很大程度上得到解决。从业人员了解这些问题及其解决方案非常重要;STEC 的 Pat Wilkison 和 Mark Moshayedi 在他们在本期杂志上的文章中解释了这些重要新设备的内部结构。

其次,在寻找吉姆可能在闪存方面做的其他工作时,我们偶然发现了惠普研究员 Goetz Graefe 的工作,他重新审视了吉姆的“五分钟规则”(我们在五/六月刊在线指出的吉姆·格雷经典之作),想知道闪存是否改变了等式。Goetz 也在这项工作中看到了吉姆的身影(他将这项工作献给了吉姆),并且 Goetz 对吉姆规则的更新现在与吉姆对基于闪存的未来的激进观点并存,这似乎尤其恰如其分。

享受这组文章——以及它们所描述的存储层次结构中即将到来的革命——并花一点时间悼念一位伟大的计算机科学家,他(再一次)本应身处其中!

BRYAN CANTRILL 是 Sun Microsystems 的杰出工程师,他在那里花了十多年时间从事系统软件工作,从内核的核心到浏览器上的客户端代码,以及两者之间的许多内容。Cantrill 与同事 Mike Shapiro 和 Adam Leventhal 一起设计并实施了 DTrace,这是一种用于生产系统动态instrumentation的工具,该工具在 2006 年获得了《华尔街日报》的顶级技术创新奖。2005 年,Cantrill 被 MIT 的《技术评论》评为 35 岁以下的前 35 位技术专家之一,并被 InfoWorld 评为年度创新者之一。他获得了布朗大学计算机科学专业的 Sc.B 优等学位。

acmqueue

最初发表于《Queue》第 6 卷,第 4 期——
数字图书馆 中评论本文





更多相关文章

Pat Helland - 关注你的状态,为了你的心境
随着应用程序进入分布式和可扩展的世界,它们经历了有趣的演变。类似地,存储及其近亲数据库也与应用程序并肩发展。很多时候,存储和应用程序的语义、性能和故障模型在变化以支持不断变化的业务需求和环境挑战时,会进行微妙的舞蹈。规模的扩大确实搅乱了局面。本文着眼于其中的一些问题及其对系统的影响。


Alex Petrov - 现代存储系统背后的算法
本文仔细研究了现代数据库中常用​​的两种存储系统设计方法(读优化的 B 树和写优化的 LSM(日志结构合并)树),并描述了它们的使用场景和权衡。


Mihir Nanavati, Malte Schwarzkopf, Jake Wires, Andrew Warfield - 非易失性存储
对于大多数执业计算机科学家的整个职业生涯来说,一个基本的观察结果一直成立:CPU 的性能和成本都明显高于 I/O 设备。CPU 能够以极高的速率处理数据,同时服务于多个 I/O 设备,这一事实对各种规模系统的硬件和软件设计产生了深远的影响,几乎在我们构建它们的整个历史中都是如此。


Thanumalayan Sankaranarayana Pillai, Vijay Chidambaram, Ramnatthan Alagappan, Samer Al-Kiswany, Andrea C. Arpaci-Dusseau, Remzi H. Arpaci-Dusseau - 崩溃一致性
数据的读取和写入是任何冯·诺依曼计算机最基本的方面之一,但它出人意料地微妙且充满细微差别。例如,考虑在具有多个处理器的系统中访问共享内存。虽然一种称为强一致性的简单直观的方法最容易被程序员理解,但许多较弱的模型也得到了广泛应用(例如,x86 总存储顺序);这些方法提高了系统性能,但代价是使系统行为的推理更加复杂且容易出错。





© 保留所有权利。

© . All rights reserved.