老顽固

  下载本文的PDF版本 PDF

网络搜索有害论

David J. Brown,Queue 顾问委员会成员

搜索仍然过于困难的五大原因

如今,当您发现自己对“美国偶像”或任何其他最新的电视“真人秀”节目感到厌恶时,您可能会决定,“管他的,是时候寻求一种稍微不那么可怕的惩罚形式了:让我们上网吧。”

如果您只是为了消遣,那么您可以无休止地花费时间在迄今为止发明的最伟大的在线冒险游戏中。但如果您的愿望实际上是找到您想要的东西,那么这个过程可能会不太令人满意。对于像我这样的普通人来说,找到你想要的东西仍然太难了。

“为什么会这样呢?”您可能会问?好吧,以下是我对网络搜索的五大不满

1. 您能找到“正确”的魔法词语吗?(又名“此路不通。”)

现在每个人肯定都知道,当尝试使用当前的搜索引擎定位某些内容时,您选择的特定词语(以及通常这些词语的顺序)对于决定您在结果中得到的是水果还是白菜至关重要。不幸的是,很难知道在您想要表达的意思的几个完全合理的词语选择中,您需要使用哪一个。

拥有高级计算机科学教育的人会告诉您,这是一种“句法”方法(一种试图匹配键入的特定符号和单词的方法,可能注意它们的顺序),而不是“语义”方法(一种试图寻找您键入内容的含义的匹配项的方法)。像我一样,我认为许多人会遗憾地看到,在当今搜索引擎的运行方式中,句法显然压倒了语义。

2. 人气竞赛的获胜者无需申请。

偶尔,您可能会比平时幸运一些,并发现您偶然发现了一些与您实际想要的东西有某种明显关系的魔法词语。使用 Google,您可能会获得“丰厚的奖励”——大量的搜索结果。(“先生,现在您想要以下 8,000 个搜索结果中的哪一个?”)

但是选择哪个呢?鉴于结果的数量通常很大,现代搜索引擎会尝试将它们排序为某种优先级顺序。Google 的搜索结果使用受欢迎程度算法进行优先级排序。如果您正在追踪最新的 Britney Spears 专辑或其他流行文化项目,这可能会有很大的帮助。不幸的是,如果您想要的东西不太容易受到如此强大的社会引力的影响,您会喃喃自语我常说的重复语:“也许那是‘他们’想要的,但这绝对不是我想要的。”

3. 滑坡效应:分心、易分心以及那些广告商的目标(“认识营销先生”)

在所有网络搜索事项中,在搜索对话框中输入几个词后,您就开始沿着立即提供的数千条路径追逐超链接。一旦在网络上放任自流,您将不可避免地被沿途无数的干扰项分散注意力——有些是合理的,有些是旨在诱惑——直到您变得可怕且无望地迷失方向。

如果您是一个彻底容易被暗示的现代人(并且乐于接受今晚电视上播放的任何“娱乐”),您可能会简单地屈服于这些海妖的歌声。很快您就会完全忘记您艰苦的探索:您从哪里来,以及您要去哪里。

请记住,广告商的资金是所有主要 WWW 搜索引擎提供商的主要资金来源。这些赞助商的目标很明确:他们希望 (a) 引起您的注意,(b) 让您点击进入一个网站,其中包含他们出售的所有商品,以及 (c) 最终将其“转化”为实际的产品销售。但是,零售疗法是如此令人愉悦的麻醉剂。无论如何,您难道真的不想在 eBay 上竞标那件迷人且非常令人向往的垃圾吗?

4. 呼叫拉尔夫·纳德:这辆车没有方向盘!(您如何指导您的搜索和/或缩小范围?)

但让我们假设您是一个意志坚定的人。没有任何弹出广告或产品营销的海妖之歌可以诱惑您偏离您的目标。那么您如何驾驶这台顽固的引擎呢?

您唯一明显的手段是尝试将一把又一把的替代魔法词语扔进伟大的搜索神谕的对话框中,看看是否有可能实现更大的乐趣。嗯,我似乎记得一些故事,说这种枯燥的机械和重复的处理正是计算机最初应该让我们摆脱的。

5. 它一定在那里,对吧?

一个普遍的假设是,如果某物存在,它就一定在网络上。遗憾的是,事实并非如此。尽管在网络上可以找到很多东西确实令人惊讶,但假设我们可能希望找到的一切都可以在那里找到是错误的。

许多广受欢迎的东西很快就能找到,但更具体或晦涩的东西呢?我挑战您寻找 1945 年 M-7 克莱斯勒皇冠船用发动机零件的供应商。如果您成功了,我很乐意收到您的指示。

更糟糕的是,当您确实知道您寻找的内容在网络上,但您似乎就是无法访问它时。我曾经浏览 PBS 网站以寻找我观看过的节目的在线内容。即使搜索范围如此狭窄,并且使用了所有看似合适的关键字,我仍然无法——在半小时的搜索中——找到相关节目。

我可以继续说下去,但真正有什么意义呢?毕竟这只是一篇抱怨文章,总有一天——“因为摩尔定律”,他们可能会告诉你——网络搜索将变得完美无缺。但在过渡时期(引用 Hunter S. Thompson 的话):“作为您的律师,我建议您大量饮酒。”

DAVE BROWN 是经典游艇协会北加州舰队的准将。他曾经是 Silicon Graphics 的创始人之一,后来在剑桥大学获得博士学位,论文是关于描述图形工作站的统一内存架构。此后,他们无论如何还是给了他在 Sun 的一份工作。Brown 曾致力于一个或两个大型且可怕的软件系统问题,包括 Solaris 中的应用程序二进制兼容性。

© 2004 1542-7730/04/0400

acmqueue

最初发表于 Queue 第 2 卷,第 2 期——
数字图书馆 中评论这篇文章





更多相关文章

Latanya Sweeney - 在线广告投放中的歧视
搜索听起来像黑人的名字比听起来像白人的名字更频繁地出现暗示逮捕记录的在线广告吗? 什么是听起来像黑人的名字或听起来像白人的名字?广告必须不利地影响一个种族群体多少次才能被认为是歧视? 在线活动是否如此普遍,以至于计算机科学家不得不考虑技术设计中结构性种族主义等社会后果?如果是这样,这项技术将如何构建? 让我们深入研究在线广告投放,以找到答案。


Ryan Barrows, Jim Traverso - 搜索被认为是不可或缺的
大多数公司必须利用其数据来获得竞争优势。知识工作者可用的数据量在过去几年中急剧增长,虽然很大一部分数据存在于大型数据库中,但一个重要的子集仅以非结构化或半结构化数据的形式存在。如果没有合适的系统,这会导致信噪比持续恶化,从而为试图快速查找信息的繁忙用户制造障碍。三种企业搜索解决方案有助于改善知识发现。


Ramana Rao - 从 IR 到搜索,及更远
自从范内瓦·布什 (Vannevar Bush) 的开创性文章《诚如所思》近 60 年前描绘了一位学者在机器的帮助下的形象以来,“一种个人在其中存储他所有的书籍、记录和通讯的设备,并且该设备被机械化,因此可以以极快的速度和灵活性进行查阅。”


Mike Cafarella, Doug Cutting - 构建 Nutch:开源搜索
搜索引擎对于互联网的使用至关重要,就像网络基础设施的任何其他部分一样,但它们与其他组件在两个重要方面有所不同。首先,它们的内部运作是秘密的,不像 DNS(域名系统)的运作那样。其次,它们掌握着政治和文化权力,因为用户越来越依赖它们来浏览在线内容。





© 保留所有权利。

© . All rights reserved.