计算机科学吸引了许多非常聪明的人,但少数人脱颖而出,他们似乎天生具有我们大多数人所缺乏的创造力。艾伦·图灵、艾兹格·迪科斯彻和约翰·巴科斯等人的名字浮现在脑海。吉姆·格雷也是其中之一。
吉姆是计算机科学领域的巨人,但在个人生活中却出奇地谦逊。他会安静地坐在我们的编辑委员会会议上,感觉没有必要主导对话。然而,当他发言时,房间里的每个人都会安静下来倾听(对于那个群体来说,这是一项艰巨的任务!),因为我们都知道吉姆说的任何话都会是相关的且有趣的。他也是会议期间最活跃的董事会成员之一,尽管他是那些时间最紧张的人之一。他很好地承受了这些需求,并且从容不迫。当你和吉姆在电话里交谈时,你可以感觉到他没有在阅读电子邮件或整理桌子——他完全专注于你——而且他似乎从不匆忙。
我第一次见到吉姆是在我还是加州大学伯克利分校的本科生,研究当时新兴的关系数据库管理系统领域时。吉姆(他在伯克利获得了计算机科学领域的第一个博士学位)当时在IBM研究院从事一个竞争项目,但他很快成为我的第一批导师之一。他似乎特别喜欢与聪明的年轻人一起工作,当然也包括许多学生。传递信息是他最大的热情。
吉姆最后的项目之一是斯隆数字巡天(http://sdss.org)。据说比尔·盖茨曾问吉姆,他为什么要从事一个没有可能盈利动机的项目,吉姆回答说:“正是如此,这就是重点。”他想尽他所能做到最好,并尽可能多地与人分享,他知道一旦金钱介入,一切都会改变。对他来说,天空巡天的吸引力在于它给了他一个机会,让他能够使用完全由公共数据组成的最大的数据库,并且他可以分享他创造的一切。而且,这很酷。
也许我觉得吉姆最令人印象深刻的是他能够以深刻的清晰度表达事物。他擅长研究有争议的问题,然后发表权威性的论文,使解决方案对每个人都清晰明了。他的分析如此简单、如此简洁、如此明显正确,以至于争论结束了,使该领域能够继续前进到下一个重大挑战,而吉姆当然会密切关注。
尽管他取得了所有重大的成就,但我的记忆中更多的是吉姆这个人——他喜欢欢笑,喜欢岭金粉黛葡萄酒,他热爱家庭,热爱户外活动,并且非常率性。几年前的十月,我和我的伴侣去旧金山拜访吉姆和他的妻子唐娜,有一天我们在北滩附近散步,偶然遇到一位卖南瓜的 vendor。吉姆立刻买了好几个南瓜,我们回到他家雕刻南瓜。我们其他人雕刻出的南瓜灯笼就像你对书呆子的期望一样:全是直线和三角形。但吉姆的作品是一件艺术品,主要由曲线构成,有着突出的眉毛和丰满的嘴唇,面带笑容。
2007年1月28日,吉姆驾驶他的帆船“坚韧号”前往法拉隆群岛。那天天气晴朗,阳光明媚,微风习习,能见度极佳,吉姆也配备了充足的安全设备。但他再也没有出现过。尽管美国海岸警卫队和计算机行业的许多顶尖人士进行了大规模搜索,但仍未发现残骸。收集了大量数据,包括从卫星数据到水下声纳图像的一切数据,这激发了新的图像处理算法的开发。我想吉姆会喜欢对他的搜寻催生了新的研究。
在接下来的几个月里,《Queue》杂志将刊登一系列吉姆的最佳作品,以此致敬他对本杂志和整个领域的巨大贡献。本月,我们首先刊登的是2003年的“分布式计算经济学”。吉姆进行了一些粗略的计算,比较了网络、计算、数据库访问和数据库存储的成本,并得出了一些在某些情况下与普遍看法不一致的结果。作为比较,我们在网上发布了一篇1987年的类似论文 (http://acmqueue.org/special/Gray_5Minute Rule.pdf),名为“用内存换取磁盘访问的5分钟规则和用内存换取CPU时间的10字节规则”。虽然经济学已经过时(每兆字节主内存 5,000 美元?),但方法论仍然很有趣,吉姆特别谈到了技术变革将如何改变这些权衡。
在本期中,我们还将刊登吉姆的妻子唐娜·卡恩斯所写的“水手颂歌”,作为对吉姆的公开致敬活动(http://www.eecs.berkeley.edu/IPRO/JimGrayTribute/)的序言,该活动于5月31日在加州大学伯克利分校举行。唐娜慷慨地允许我们转载它。尽管它引用了《Queue》本期未收录的论文,但它给出了吉姆的个人甚至私密的形象,我们认为这是恰当的。
埃里克·奥尔曼是Sendmail的首席科学官。他与吉姆·格雷等人一起,是《Queue》编辑顾问委员会的创始成员。
最初发表于《Queue》杂志第6卷,第3期——
在 数字图书馆 中评论本文
钱力,彼得·克拉夫特 - 事务和无服务器天生一对
数据库支持的应用程序是无服务器计算令人兴奋的新领域。通过紧密集成应用程序执行和数据管理,事务性无服务器平台实现了许多在现有无服务器平台或基于服务器的部署中不可能实现的新功能。
帕特·海兰德 - 任何其他名称的身份
新兴的系统和协议既收紧又放松了我们对身份的概念,这很好!它们使完成工作变得更容易。REST、物联网、大数据和机器学习都围绕着故意保持灵活且有时模糊的身份概念。身份概念是我们分布式系统的基本机制的基础,包括互换性、幂等性和不变性。
雷蒙德·布鲁姆,贝齐·拜尔 - 实现数字永恒
当今的信息时代正在为世界所依赖的数据创造新的用途和新的管理方式。世界正在从熟悉的物理文物转向更接近信息本质的新型表示手段。我们需要流程来确保知识的完整性和可访问性,以保证历史将被了解和真实。
格雷厄姆·科莫德 - 数据草图
你是否曾经感到被源源不断的信息淹没?似乎大量的新的电子邮件和短信需要持续关注,还有电话要接,文章要读,敲门声要回应。将这些碎片拼凑在一起以跟踪重要的事情可能是一个真正的挑战。为了应对这一挑战,流数据处理模型越来越受欢迎。其目的不再是捕获、存储和索引每一个细微的事件,而是快速处理每一次观察,以便创建当前状态的摘要。