第九届世界系统学、控制论与信息学多学科会议(SCI)2005年吸引了比其空洞的标题通常应得的更多的关注,因为它接受了一篇来自三位麻省理工学院研究生的恶搞论文。《泰晤士报》(当然,默认情况下是伦敦的)以引人注目的标题刊登了“胡言乱语如何让科学家蒙羞”(2005年4月6日)。其中一位学生杰里米·斯特里布林解释了他们如何开发了一个计算机程序来生成随机的技术术语序列,以证实他们怀疑学术性可疑的论文正在绕过严肃的,或者根本没有任何审查。事实上,学生们声称,这种缺乏适当同行评审的背后存在不可告人的经济动机。有人认为,SCI组织者通过大量的电子邮件群发征集投稿,并且通常对被会议接受的论文收取费用。
计算机生成的无稽之谈和用手工编造的胡言乱语愚弄各种学术实体的先例有很多。前者最初是为了好玩,例如简单的 Datamation 行话生成器,它从标准列表中随机连接几个时髦的流行语。如果目的是让营销人员感到羞愧,那显然失败了。一些语言学家认为,“系统”这个词已经语法化1,成为一个分隔标签,表示这些随机的行话字符串的结束。因此:X 是一个稳定、无缝、可移植、多范式、多态、以用户为中心、操作系统中立的……执行控制语言系统。这个标签在其他领域也持续存在,例如当“我的信仰”被提升为“我的信仰体系”时。
当然,也有大量严肃的计算机生成的无稽之谈,形式是由昂贵的高级工具和框架蠕动2式地生成的源代码和 HTML 页面。人类程序员在检查由此产生的代码膨胀时感到适当地惊恐,但又因他们的技能仍然需要修剪脂肪而感到鼓舞!出格的聊天空间 http://www.theDailyWTF.com 提供了代码的鲜活例子,这些代码引来了惊呼“WTF!?”(WTF 及其同类 FUBAR 和 RTFM 的扩展解释可以通过普通棕色信封邮寄给您,但需请求)。
人为制作的科学讽刺作品形成了一种久经考验且持久的类型,以 JIR(《不可重复结果杂志》,www.jir.com)为例,该杂志由亚历山大·科恩和哈里·J·利普金于 1955 年在以色列创立,至今仍在诺曼·斯珀林的编辑领导下,从 JIR 在加利福尼亚州圣马特奥的总部蓬勃发展。当我最近重新订阅时,该网站缺少一个最新的、安全的订阅输入表格。您可以打印并通过蜗牛邮件发送您的订单,或者使用两个单独的目标地址发送两份“半申请”。您在一封电子邮件中输入一半的信用卡数据,在另一封电子邮件中输入剩余的一半。现在,对于那些回应福音的呼召的人来说,这是一个挑战:“来,我要叫你们得人的渔夫……”(马可福音 1:17)。就我的信用评级而言,我可以回应伊阿古的话:“谁偷了我的身份,谁就偷了垃圾。”
一个与 JIR 平行且经常与其汇合的机构是 Ig 诺贝尔奖委员会 (www.improbable.com/ig/ig-top.html),尽管这扩展了该类型,使其从刻意的模仿更多地转向具有所有恶搞和夸张愚蠢特征的真实研究。
如果您目睹过 Ig 诺贝尔奖颁奖典礼,很明显,大多数到场的获奖者绝不会因他们的“反奖”而感到羞耻。我认为,这不仅是我们名人文化(因臭名昭著而出名,反之亦然)的副产品,也是对整个事件背后不残酷、戏谑幽默的致敬。人们甚至可能怀疑,一些永远不可能得到斯德哥尔摩认可的研究人员,有意识地夸大他们的散文,半只眼睛盯着 Ig 诺贝尔奖。我最喜欢的一个是 2001 年 Ig 诺贝尔和平奖,颁发给了立陶宛蘑菇汤百万富翁维柳马斯·马利瑙斯卡斯,因为他的迪斯尼风格的斯大林世界主题公园。许多被推倒的列宁和斯大林雕像都找到了新家,游客可以享受“古拉格一日游”,一边啜饮冰冷、清淡的罗宋汤,一边听着广播里苏联歌曲和宣传的噼啪声。愤世嫉俗者将这个项目与亨利·基辛格在 1973 年获得的真正诺贝尔和平奖进行了有利的比较。
“真实”和“虚假”论文变得难以区分这一事实,直接原因是专业化程度日益提高。数学家 D. E. 利特尔伍德3 重复了古老的谚语,即专家对越来越少的事情了解得越来越多,推断到他们对 epsilon 了解一切。在复述了旧约巴别塔神话之后,利特尔伍德观察到:“这个故事并非与今天的科学无关,今天的科学在某些方面超越了天堂。语言混乱的诅咒同样适用。哪个科学家能够饶有兴趣地阅读与其自身科学分支不同的技术论文?哪个数学家能够有益地阅读他没有专门知识的主题的研究论文?”
具有讽刺意味的是,利特尔伍德关于代数群的开创性论文之一被一家领先的数学期刊拒绝,理由是它难以理解。这提醒我们,gibberish 这个词及其各种同源词,至少在词源学上揭示了主观和潜在无效判断的因素。因此,babble 是婴儿和不善言辞的小溪所发出的声音。gibberish 和 gobbledygook 都是毫无意义的火鸡语,希腊人听到他们的非希腊语邻居只发出绵羊般的“baa-baas”声,就将他们都称为野蛮人。即使 jargon 最初在法语中是“鸟的啁啾声”,尽管后来演变出了不太贬义的第二层含义:特定行业或领域的专门词汇。
考虑到这一点,我们回到欺骗 CSI 会议审稿人的事件。被接受的恶搞论文之一是“Rooter:访问点和冗余的典型统一方法”。引言断言,“当然,为研究栅格化铺平道路的 Smalltalk 仿真的常用方法不适用于此处。”对于我们这些了解行话的人来说,这是一个绝妙的模仿。对 root/router 的双关语符合麻省理工学院毕业生的幽默感,并且至少强制使用一次 methodology。然而,也许语法的规则遵守得太严密了,愤世嫉俗者可能会认为这是一个暗示,即作者不是真正的科学家!然而,再一次,某种信息正在被呈现,并且可能是讨论的领域恰好落在读者的知识库之外。毕竟,Smalltalk 和 GUI 来自施乐帕克研究中心,毫无疑问,各种栅格化在那里被研究、实现,并且(暗示暗示,不用多说)被苹果或 IBM 偷走了?
当《泰晤士报》引用以下摘录时,人们的困惑增加了,显然期望我们震惊地倒下,因为如此胡言乱语竟能通过最宽的编辑筛子溜过去:“我们比较了微软 Windows Longhorn、Ultrix 和微软 Windows 2000 操作系统上的吞吐量。”
作为句子的句子有点奇怪,但在技术上是完全合理的。这三个命名的产品确实是真实或即将推出的操作系统(Longhorn 是微软下一个重大事物的内部公开代号),可以(并且经常)有意义地比较它们的吞吐量。
我认为结论是,可靠的胡言乱语过滤器需要由几位同行领域专家进行仔细的整体审查。每个词和每个句子都可能被证明是无可挑剔的,尽管总体上是无稽之谈4,这可能排除了未来多年内用于人工和计算机生成的恶作剧的计算机化过滤器。
D. E. 利特尔伍德问题将依然存在:一篇非常先进的论文,以至于当时只有他一个人能理解。我非常了解他的焦虑,所有提交的论文被拒绝的人都有同感。也许我们可以接受绞刑法官杰弗里的议程:宁可拒绝一百篇好论文,也不要发表一篇恶搞者或怪人的论文。
参考文献
斯坦·凯利-布特尔 (http://www.feniks.com/skb/; http://www.sarcheck.com),出生于英国利物浦,20 世纪 50 年代在剑桥大学攻读纯数学,之后在先驱 EDSAC I 上涉足计算机科学的杂质。他的许多著作包括《魔鬼的 DP 词典》(McGraw-Hill,1981 年)和《理解 Unix》(Sybex,1994 年)。《软件开发杂志》已将他评为首届年度斯坦·凯利-布特尔电子科技奖的获得者,以表彰他在“技术和文学方面的终身成就”。诺贝尔和图灵都没有获得如此珍贵的同名认可。在他的笔名斯坦·凯利下,他还享有作为歌手和词曲作者的并行职业生涯。
© 2005 1542-7730/05/0700 $5.00
最初发表于 Queue 第 3 卷,第 6 期—
在 数字图书馆 中评论本文
凯瑟琳·海耶斯,大卫·马龙 - 质疑评估非密码哈希函数的标准
尽管密码哈希函数和非密码哈希函数无处不在,但在它们的设计方式上似乎存在差距。存在许多受各种安全需求驱动的密码哈希标准,但在非密码方面,存在一定程度的民间传说,尽管哈希函数历史悠久,但尚未得到充分探索。虽然针对现实世界数据集的均匀分布很有意义,但当面对具有特定模式的数据集时,这可能是一个挑战。
妮可·福斯格伦,艾里妮·卡利亚姆瓦库,艾比·诺达,米凯拉·格雷勒,布莱恩·霍克,玛格丽特-安妮·斯托里 - DevEx 在行动
在许多软件组织中,DevEx(开发者体验)正受到越来越多的关注,因为领导者们希望在财政紧缩和人工智能等变革性技术的背景下优化软件交付。技术领导者们凭直觉接受,良好的开发者体验能够实现更有效的软件交付和开发者幸福感。然而,在许多组织中,旨在改进 DevEx 的拟议倡议和投资难以获得支持,因为业务利益相关者质疑改进的价值主张。
若昂·瓦拉乔,安东尼奥·特里戈,米格尔·阿尔梅达 - 低代码开发生产力
本文旨在通过介绍使用基于代码、低代码和极端低代码技术进行的实验室实验结果,研究生产力差异,从而提供关于该主题的新见解。低代码技术已清楚地显示出更高的生产力水平,为低代码在短期/中期内主导软件开发主流提供了强有力的论据。本文报告了程序和协议、结果、局限性和未来研究的机会。
艾瓦尔·雅各布森,阿里斯泰尔·科克本 - 用例至关重要
虽然软件行业是一个快节奏且令人兴奋的世界,其中不断开发新的工具、技术和技巧来服务于商业和社会,但它也很健忘。在其快速前进的匆忙中,它容易受到时尚的支配,并且可能会忘记或忽略某些它面临的永恒问题的行之有效的解决方案。用例,最早于 1986 年引入并在后来普及,就是这些行之有效的解决方案之一。