当搜索听起来像黑人的名字时,比搜索听起来像白人的名字时,更频繁地出现暗示逮捕记录的在线广告吗?什么是听起来像黑人的名字或听起来像白人的名字呢?广告必须不利地影响某个种族群体多少次才会被认为是歧视?在线活动是否如此普遍,以至于计算机科学家必须考虑技术设计中的结构性种族主义等社会后果?如果是这样,这项技术该如何构建?让我们对在线广告投放进行科学的深入研究,以找到答案。
“你曾被逮捕过吗?” 想象一下,当有人在搜索引擎中输入你的名字时,就会出现这个问题。也许你正在竞争奖项、奖学金、任命、晋升或新工作,或者你可能处于信任职位,例如教授、医生、银行家、法官、经理或志愿者。也许你正在填写租赁申请、销售商品、申请贷款、加入社交俱乐部、结交新朋友、约会,或参与数百种需要别人在线了解更多关于你的情况。在你的成就列表旁边出现一条广告,暗示你可能有犯罪记录,无论你是否真的有。更糟糕的是,这些广告可能不会为你的竞争对手展示。
职位申请经常包括诸如以下问题:你曾被逮捕过吗?你曾被指控犯罪吗?除了交通罚单,你曾被判犯有罪行吗?雇主提出这些问题是为了建立信任度。因为其他人经常将犯罪记录等同于不可靠或不诚实,所以存在对有犯罪记录的人的保护措施。
如果雇主仅根据表明逮捕记录的信息取消求职者的资格,公司可能会面临法律后果。美国 EEOC(平等就业机会委员会)是负责执行 1964 年《民权法案》第七章的联邦机构,该法律适用于大多数雇主,禁止基于种族、肤色、宗教、性别或国籍的就业歧视。1973 年发布的指南将保护范围扩大到有犯罪记录的人。5,11 第七章并不禁止雇主获取犯罪背景信息。然而,某些犯罪信息的使用,例如全面政策或实践,即仅根据表明逮捕记录的信息排除申请人或取消员工资格,可能会导致歧视指控。
为了做出决定,EEOC 使用不利影响测试,该测试衡量某些做法(无论有意与否)是否对一群人的影响不成比例,这些人的定义特征受第七章的保护。要做出决定,你需要计算每个群体中受影响的人的百分比,然后将较小的值除以较大的值以获得比率,并将结果与 80 进行比较。例如,假设一家公司以相同的比率解雇了可比的黑人和白人工人——黑人和白人都为 25%——那么比率,25 除以 25,将为 100%。如果比率小于 80%,那么 EEOC 认为影响不成比例,并可能追究雇主歧视的责任。6
如果在线广告暗示你的名字有逮捕记录,即使你的名字的人没有人被逮捕,那又会怎么样?除非你有逮捕记录,并且可以证明潜在雇主经常使用广告或来自广告赞助公司的信息,并且结果对雇用有犯罪记录的申请人产生了不适当的寒蝉效应,否则第七章不适用。
广告商可能会辩称这些广告是商业言论自由——一种与你的名字相关的展示广告的宪法权利。美国宪法第一修正案保护广告。在一项里程碑式的判决中,美国最高法院为评估政府对商业言论的限制制定了一项测试,该测试首先确定言论是否具有误导性。3 如果没有人以该名字有逮捕记录,那么暗示存在逮捕记录的在线广告是否具有误导性?
假设这些广告是言论自由:当这些广告在一个种族群体中比另一个种族群体更频繁地出现时会发生什么?并非每个人都受到言论自由的平等影响。那是言论自由还是种族歧视?
种族主义,正如美国民权委员会所定义的,是“任何因其肤色而贬低个人或群体的态度、行为或制度结构……种族主义不仅仅是态度问题;行为和制度结构也可能是一种种族主义形式。”16 根据国家研究委员会歧视评估方法小组的说法,当一个人或一群人因其种族出身而受到不同对待时,就会产生种族歧视。12 权力是必要的先决条件,因为歧视取决于给予或扣留本应有权获得福利、设施、服务、机会等的人的能力,并且是基于种族而被剥夺的。制度性或结构性种族主义,正如《社会工作词典》中所定义的,是一个程序/模式系统,其效果是促进歧视性结果或优先考虑一个群体的成员而不是另一个群体的成员。1
即使不是故意的,也可能导致种族主义,而在线活动现在可能非常普遍,以至于计算机科学家必须考虑他们设计的技术中的结构性种族主义等社会后果。这些考虑构成了大局,即本次探索所处的相关的法律、社会和技术背景。现在我们转向探索本身:在具有种族关联的名字样本中,暗示逮捕记录的在线广告是否在一个种族群体中比另一个种族群体更频繁地出现。然后,如果存在该模式的证据,我们将研究技术可能在解决这个问题中发挥的作用。
广告投放的疑似模式是什么?以下是一些真实世界示例的问题概述。
本研究始于个性化广告暗示逮捕记录不会因种族而异的假设。我们通过仔细构建该模式的科学最佳实例来实现这一点——一个具有种族识别性且伪随机选择的名字的实例。
今年早些时候,在谷歌上搜索Latanya Farrell、Latanya Sweeney 和 Latanya Lockett,结果显示了图 1 中的广告和犯罪报告。这些广告出现在 Google.com (图 1a, 1c, 1e) 和新闻网站 Reuters.com 上,谷歌向其提供广告 (图 1c, 底部)。所有相关广告都链接到 instantcheckmate.com (图 1b, 1d, 1f)。第一个广告暗示 Latanya Farrell 可能被捕了。她被捕了吗?点击链接并支付必要的订阅费后,显示该公司没有她的逮捕记录(图 1b)。Latanya Sweeney 也没有逮捕记录,但 Latanya Lockett 有。
相比之下,搜索 Kristen Haring、Kristen Sparrow 和 Kristen Lindquist 没有产生任何 instantcheckmate.com 广告(图 2a、2c 和 2e),即使该公司的数据库报告拥有所有三个名字的记录,并且 Kristen Sparrow 和 Kristen Lindquist 有逮捕记录(图 2d 和 2f)。
搜索 Jill Foley、Jill Schneider 和 Jill James 显示了带有中性文案的 instantcheckmate.com 广告;即使该公司数据库中出现了所有三个名字的逮捕记录,逮捕一词也没有出现在广告中。图 3 显示了这三个名字的广告和犯罪报告,这些广告和犯罪报告出现在 Google.com (图 1c, 1e) 和 Reuters.com (图 1a) 上。犯罪报告来自 instantcheckmate.com (图 1b, 1d, 1f)。
最后,我们考虑了与这些名字相关的种族代理。图 4 显示了在谷歌图片中,分别搜索 Latanya、Latisha、Kristen 和 Jill 时出现的种族差异。与 Latanya 和 Latisha 相关的面孔往往是黑人,而白人面孔在 Kristen 和 Jill 的图像中占主导地位。
总之,这些精心挑选的示例描述了疑似模式:暗示逮捕的广告倾向于与与黑人相关的名字一起出现,而中性广告或没有广告与与白人相关的名字一起出现,无论投放广告的公司是否透露与该名字相关的逮捕记录。
谁生成广告的文字?谁决定广告何时何地出现?在之前的例子中,谷歌、路透社等新闻网站和 Instant Checkmate 之间的关系是什么?对投放广告的 Google AdSense 计划的概述解释了这些公司之间的联系。
在印刷报纸和杂志中,广告空间和广告内容是固定的。传统上,每个阅读该出版物的人都会在相同的空间中看到相同的广告。网站则不同。在线广告空间不受相同的物理限制,可以是动态的,广告可以根据读者的搜索条件、兴趣、地理位置等量身定制。任何两个读者(甚至同一个读者返回到同一个网站)都可能看到不同的广告。
Google AdSense 是最大的动态在线广告提供商,为数百万个网站上的数百万个赞助商投放广告。9 在 2011 年第一季度,谷歌通过 Google AdSense 赚取了 24.3 亿美元(年化 97.1 亿美元),占其总收入的 28%。10 存在几种不同的广告安排,但为简单起见,本文仅描述 Google AdSense 针对相关 Instant Checkmate 广告的特定功能。
当读者在注册网站上输入搜索条件时,Google AdSense 会将据信与搜索相关的广告嵌入到结果页面中。图 1、2 和 3 显示了 Google AdSense 响应各种 firstname lastname 搜索而投放的广告。
广告商向谷歌提供搜索条件、一旦匹配发生时投放的可能广告的副本,以及如果读者点击投放的广告,赞助商愿意支付的竞价。(本文混淆了两个相互作用的 Google 计划:Google AdWords 允许广告商指定搜索条件、广告文字和竞价;而 Google AdSense 将广告投放到托管网站。) 谷歌对相同搜索条件的竞价进行实时拍卖,计算出总体的“质量得分”作为拍卖的基础。质量得分包括许多因素,例如广告的过去表现和公司网站的特征。10 质量得分最高的广告首先出现,质量得分第二高的广告其次出现,依此类推,如果谷歌认为竞价太低,或者显示广告超出阈值(例如,赞助商的最高账户总额),则谷歌可以选择不显示任何广告。图 1、2 和 3 中的 Instant Checkmate 广告经常在广告中排名第一,这意味着 Instant Checkmate 具有最高的质量得分。
想要“托管”在线广告的网站所有者注册 AdSense 并修改网站以包含特殊的软件,该软件将有关当前读者的信息(例如,搜索条件)发送给谷歌;作为交换,该网站从谷歌接收相应的广告。当显示的广告出现在 Google.com 以外的网站上时,它们带有“Google 广告”横幅。例如,Reuters.com 是 AdSense 主机,在搜索栏中输入 Latanya Sweeney 会生成一个新的网页,其中包含由谷歌投放的广告,并带有“Google 广告”横幅(图 1c)。
显示广告不收取任何费用,但如果用户实际点击广告,则赞助商支付竞价价格。这可能低至几美分,并且金额在谷歌和主机之间分配。点击 Reuters.com 上的 Latanya Sweeney 广告(图 1c)将导致 Instant Checkmate 向谷歌支付其竞价,而谷歌将与路透社分享付款。
Instant Checkmate 指定了哪些搜索条件?广告是随机投放的吗?广告是否仅依赖于名字?广告会为虚构的名字投放吗?Google AdSense 提供了这些问题的答案。在 Google.com 上显示的广告允许用户了解特定广告出现的原因。点击广告横幅中带圆圈的“i”(例如,图 1c)会进入一个解释广告的网页。对图 1 和图 3 中的广告执行此操作会显示,广告出现的原因是与竞价相关的搜索条件与搜索的确切名字和姓氏组合相匹配。因为一家公司大概会对它销售的记录进行竞价,所以这些名字很可能都是真实人物的名字和姓氏。
这意味着与这些广告相关的搜索条件必须由名字和姓氏组成,并且这些名字应该属于真实人物。
接下来的步骤描述了系统地构建种族关联的名字和姓氏列表,以用于真实人物作为搜索条件。不假定 Instant Checkmate 在竞价时使用了这样的列表,谷歌在投放广告时也没有使用。相反,该列表提供了一个合格的种族关联名字样本,用于测试广告投放系统。
黑人识别性和白人识别性名字在一个种族中的出现频率明显高于另一个种族。
2003 年,NBER(国家经济研究局)的 Marianne Bertrand 和 Sendhil Mullainathan 做了一个实地实验,他们向招聘广告提供了几乎相同的简历,只是其中一些简历带有黑人识别性名字,另一些简历带有白人识别性名字。2 他们的工作歧视研究表明,对黑人名字存在显着歧视:白人名字收到面试回复的可能性高出 50%,即使简历在其他方面具有相同的资格。
该研究使用了 1974 年至 1979 年间马萨诸塞州出生的黑人和白人婴儿的名字的相关性,将黑人识别性名字和白人识别性名字定义为在一个种族群体中的频率与另一个种族群体中的频率之比最高的那些名字。
在畅销书《魔鬼经济学》(William Morrow,2006 年)中,Steven Levitt 和 Stephen Dubner 报告了排名前 20 位的最白人和最黑人的女孩和男孩的名字。该列表来自 Levitt 和 Roland Fryer 早期的工作,该工作显示了从 1970 年代开始,黑人给孩子起名字的方式发生了一种模式变化,他们将其与黑人权力运动联系起来。7 他们假设该运动影响了黑人对其身份的看法,他们给出的证据是,在该运动之前,给黑人和白人儿童起的名字没有明显的差异,但在该运动之后,出现了明显的黑人名字。
与工作歧视研究类似,Fryer 和 Levitt 使用的列表是从 1961-2000 年加利福尼亚州出生记录中记录的黑人和白人儿童的名字(超过 1600 万次出生)汇编而成的。
为了测试广告投放方法,我们结合了先前研究中的列表,并添加了两个黑人女性名字 Latanya 和 Latisha。表 1 列出了此处使用的名字,包括每个类别的八个名字:来自 Bertrand 和 Mullainathan 工作歧视研究的白人女性、黑人女性、白人男性和黑人男性名字(表 1 中的第一行);以及来自 Fryer 和 Levitt 工作的每个类别的前八个名字(表 1 中的第二行)。Emily(白人女性名字)、Ebony(黑人女性名字)和 Darnell(黑人男性名字)都出现在两行中。第三行包括图 4 中显示的观察结果。删除重复项后,总共有 63 个不同的名字。
拥有种族关联的名字列表只是一个开始,但测试广告投放需要真实人物的名字和姓氏(全名)。网络搜索提供了一种通过以下方式查找和收集全名的方法:(1) 抽样在网络上出现的专业人士的名字;以及 (2) 抽样活跃于社交媒体网站和博客(网民)的人的名字。
专业人士通常有自己的网站,或者在机构网站上出现传记信息,列出职称和职位,并描述以前的成就和当前的活动。研究、医学、法律和商业等多个专业通常具有与该专业人士相关的学位称号(例如,PhD、MD、JD 或 MBA)。在谷歌上搜索名字和学位称号可以产生具有该名字和学位的人员列表。这些类型的搜索可以收集具有种族关联名字的专业人士的全名样本。
下一步是访问与每个全名关联的网页,如果图像可以辨别,则记录该人是黑人、白人还是其他种族。应存档访问的每个网页以保存图像和内容。
以下是我广告投放测试中的两个例子。在谷歌上搜索 Ebony PhD,结果显示了以 Ebony 为名字的真实人物的链接——具体来说,是 Ebony Bookman、Ebony Glover、Ebony Baylor 和 Ebony Utley。我收集了出现在搜索结果前三页的全名,根据需要使用其他专业结尾(例如 JD、MD 或 MBA)进行搜索,以找到至少 10 个 Ebony 的全名。点击与 Ebony Glover 关联的链接提供了关于她的更多信息,包括图像。8 本研究中的 Ebony Glover 看起来是黑人。
同样,Jill PhD 的搜索结果列出了名字为 Jill 的专业人士。访问链接会产生网页,其中包含关于每个人的更多信息。例如,Jill Schneider 的网页上有一张图像,显示她是白人。14
收集网民的名字与收集专业人士的名字类似,但更简单。PeekYou 搜索用于收集具有种族关联名字的网民的全名样本。网站 peekyou.com 汇编了关于个人的在线和离线信息——从而将居住信息与 Facebook 和 Twitter 用户、博主和其他人联系起来——并为其在线足迹的大小分配了自己的评级。来自 peekyou.com 的搜索结果首先列出得分最高的人,并包括该人的图像。名人公众人物往往排在第一位,拥有最高的 PeekYou 分数,其次是博主、推特用户和其他人。
在 PeekYou 上搜索 Ebony 找到了 Ebony Small、Ebony Cams、Ebony King、Ebony Springer 和 Ebony Tan。在 PeekYou 上搜索 Jill 找到了 Jill Christopher、Jill Spivack、Jill English、Jill Pantozzi 和 Jill Dobson。在收集了这些和其他全名后,如果可以辨别,我报告了该人的种族。
使用刚刚描述的方法,我从 2012 年 9 月 24 日到 10 月 22 日收集了 2,184 个具有种族关联的全名,这些人都在网上出现。使用与这些名字相关的图像,我能够确认种族关联的名字可以预测种族。15 与黑人识别性名字相关的大多数图像都是黑人(88%),而与白人识别性名字相关的图像是白人的百分比更高(96%)。
分别检查黑人名字和白人名字作为种族预测指标。结果显示,490 张黑人图像具有黑人相关名字,68 张没有;18 张黑人图像具有白人名字;852 张既没有黑人名字也没有黑人图像。同样,831 张白人图像具有白人名字,50 张白人图像没有白人名字;39 张具有白人名字但非白人图像,508 张既没有白人名字也没有白人图像。
在谷歌上搜索名字和学位称号不如在 PeekYou 上查找名字有效。在谷歌上,白人男性名字 Cody、Connor、Tanner 和 Wyatt 检索到的结果是作为姓氏而不是名字;黑人男性名字 Kenya 与国家混淆;黑人名字 Aaliyah、Deja、Diamond、Hakim、Malik、Marquis、Nia、Precious 和 Rasheed 检索到的全名少于 10 个。只有 Diamond 在 PeekYou 搜索中构成问题,似乎与其他在线实体混淆。因此,Diamond 被排除在进一步考虑之外。
一些黑人名字具有完美的预测(100%):Aaliyah、DeAndre、Imani、Jermaine、Lakisha、Latoya、Malik、Tamika 和 Trevon。对黑人预测最差的是 Jamal (48%) 和 Leroy (50%)。在白人名字中,31 个名字中有 12 个做出了完美预测:Brad、Brett、Cody、Dustin、Greg、Jill、Katelyn、Katie、Kristen、Matthew、Tanner 和 Wyatt;对白人预测最差的是 Jay (78%) 和 Brendan (83%)。这些发现有力地支持在本研究中使用这些名字作为种族指标。
列表中出现了 62 个全名两次,即使这些人不一定是同一个人。没有名字出现超过两次。总的来说,谷歌和 PeekYou 搜索倾向于产生不同的名字。
有了这个暗示种族的名字列表,我准备测试在搜索这些名字时会出现哪些广告。为此,我检查了在 Google.com 和 Reuters.com 两个网站上投放的广告,以响应在每个网站上搜索每个全名一次。在每次搜索之前,浏览器的缓存和 cookie 都被清除,并且保存了收到的网页副本。图 1、2、3、6 和 7 提供了示例。
从 2012 年 9 月 24 日到 10 月 23 日,我在 Google.com 和 Reuters.com 上搜索了 2,184 个全名。搜索发生在一天中的不同时间、一周中的不同日子,使用美国不同地区的不同的 IP 和机器地址以及不同的浏览器。我手动搜索了 1,373 个名字,并使用自动化手段17 搜索了剩余的 812 个名字。以下是 10 个观察结果。
1. 广告以尊重的形式展示,没有杂乱。我们都见过网页上的广告妨碍了视线,占据了页面或与页面紧密交织在一起,以至于你无法区分广告和内容。这里的情况并非如此。在 Google.com 或 Reuters.com 上搜索时,最多只出现三个广告。在页面上,没有一家公司的广告被列出超过一次,并且广告以单个集合形式出现在边距内的矩形区域中。谷歌和路透社是受人尊敬的信息来源,以这种方式展示,广告并没有夺走网站的风采;相反,网站和广告的尊重展示甚至可能提升广告的地位。
2. 在 Google.com 上出现的广告比在 Reuters.com 上出现的广告少得多——即使在 Google.com 上检查最多三页的搜索结果,也少了大约五倍。当广告确实出现在 Google.com 上时,通常只显示一个广告,而 Reuters.com 上通常显示三个广告。这表明谷歌可能对 Google.com 上出现的广告数量很敏感。
3. 在捕获的 5,337 个广告中,78% 是针对政府收集的关于被搜索人(公共记录)的信息。美国的公共记录通常包括一个人的地址、电话号码、犯罪历史以及专业和商业执照,尽管具体细节因州而异。在搜索的 2,000 多个名字中,78% 的名字至少有一个关于被搜索人的公共记录广告。购买某人公共记录的广告几乎在搜索任何名字时都会出现,但它们在 Reuters.com 上出现的频率远高于在 Google.com 上出现的频率。
4. 四家公司占据了捕获的所有广告的一半以上。这些公司是 Instant Checkmate、PublicRecords(由 Intelius 拥有)、PeopleSmart 和 PeopleFinders,它们的所有广告都在销售公共记录。Instant Checkmate 广告的出现次数最多:占所有广告的 29%。广告分布在谷歌的网站上有所不同;Instant Checkmate 仍然拥有最多的广告(50%),但 Intelius.com 虽然没有进入总体前四名,但在 Google.com 上拥有第二多的广告。这些公司主导了在线广告销售公共记录的广告空间。
5. Instant Checkmate 广告在最顶部的广告位置中占据主导地位。它们在 Reuters.com 上几乎一半的搜索中占据了该位置。紧随其后的 PublicRecords.com 很少占据最顶部的位置,但最常出现在第二和第三位置。如此频繁地作为第一个广告出现表明,总的来说,Instant Checkmate 向谷歌提供的资金更多,或者质量得分高于其竞争对手。
6. 针对个人的公共记录广告在具有黑人相关名字的人中比在具有白人相关名字的人中更频繁地出现,与公司无关。PeopleSmart 广告在黑人识别性名字中不成比例地更高——41%,而白人名字为 29%。PublicRecords 广告在黑人名字中出现的频率比在白人名字中高 10%。Instant Checkmate 广告在黑人相关名字中显示的频率略高(相差 2%)。这是那些有趣的发现之一,引发了一个问题:公共记录包含每个人的信息,那么为什么黑人相关名字的广告更多?
7. Instant Checkmate 在几乎每个名字类别的广告中都占最大的百分比,除了 Kristen、Connor 和 Tremayne。对于这些名字,Instant Checkmate 的广告异常地少(少于 25%)。PublicRecords 的广告在以 Tremayne 开头的名字中占 80%,而 Instant Checkmate 仅占 23%。同样,对于 Connor,PublicRecords 占 80%,而 Instant Checkmate 占 20%,对于 Kristen,PublicRecords 占 58%,而 Instant Checkmate 占 16%。为什么在这些名字中代表性不足?Instant Checkmate 是否出于某种原因避免使用这些名字?这些低估是否显示了故障?在与公司代表的电话会议中,他们声称 Instant Checkmate 为姓氏组(而不是名字)向谷歌提供了相同的广告文字。
8. 几乎所有公共记录广告都包含该人的名字,使每个广告几乎都是唯一的,但除了个性化之外,广告模板几乎没有变化。唯一的例外是 Instant Checkmate。例如,几乎所有出现在 Reuters.com 上的 PeopleFinder 广告都使用了相同的个性化模板(“我们找到了 fullname。当前地址、电话和年龄。查找 fullname,任何地方”,其中人的名字和姓氏替换了 fullname)。PublicRecords 使用了五个模板,PeopleSmart 使用了七个,但 Instant Checkmate 在 Reuters.com 上使用了 18 个不同的广告模板。图 5 列出了所有四家公司的广告文字和频率(用人的名字和姓氏替换 fullname)。
只有 Instant Checkmate 广告使用了 arrest 一词,该词出现在其在 Reuters.com 上找到的 18 个广告模板中的 8 个中。虽然 Instant Checkmate 的竞争对手——PeopleSmart、PublicRecords 和 PeopleFinders——也销售犯罪历史信息,但它们的广告中都没有包含 arrest 或 arrested 一词。
9. 使用“逮捕”一词的 Instant Checkmate 广告,在针对黑人身份名字的搜索中出现的比例高于白人名字。在 Reuters.com 网站上出现了超过 1,100 个 Instant Checkmate 广告,其中 488 个广告使用了黑人身份名字;在这些广告中,有 60% 在广告文本中使用了逮捕一词。在显示白人身份名字的 638 个广告中,有 48% 使用了逮捕一词。这种差异具有统计学意义,数据可以用偶然性来解释的可能性小于 0.1%(卡方检验:χ2(1)=14.32,p < 0.001)。美国平等就业机会委员会和美国劳工部用于衡量歧视的不利影响测试在本例中为 77,因此如果这是一种雇佣情况,可能会导致歧视指控。(不利影响测试使用中性广告的比率,即用 100 减去给定的百分比来计算差异:100-60=40 和 100-48=52;用 40 除以 52 等于 77。)
在 Reuters.com 网站上,中性广告(广告文本中没有出现逮捕一词)比例最高的名字是 Jill(77%)和 Emma(75%),这两个名字都是白人身份名字。广告文本中包含逮捕一词的广告比例最高的名字是 Darnell(84%)、Jermaine(81%)和 DeShawn(86%),这些都是黑人身份名字。有些名字的出现与这种模式相反:白人身份名字 Dustin 在 81% 的搜索中生成了逮捕广告;而黑人身份名字 Imani 在 75% 的搜索中产生了中性广告。
10. 在 Google 网站上的歧视结果与此类似,但有趣的是,广告文本和分布有所不同。在 Google.com 上出现的 Instant Checkmate 广告通常使用与 Reuters.com 上不同的广告文本。虽然在 Reuters.com 上占主导地位的相同的中性和逮捕广告也经常出现在 Google.com 上,但 Google 上的 Instant Checkmate 广告还包括另外 10 个模板,所有模板都使用了犯罪或逮捕一词。这些新模板出现在 Google 上约 20% 的 Instant Checkmate 广告中。
在 Google 上出现了超过 400 个 Instant Checkmate 广告,其中 90% 的广告都暗示了逮捕,与种族无关。这两个最后的发现共同强调了 Google 自己的网站上出现的广告与 Google AdSense 投放给路透社的广告之间的其他差异。广告文本有所不同。包含犯罪一词而不是逮捕一词的广告仅出现在 Google 的网站上,并且在 Google.com 上,无论种族,使用逮捕或犯罪的广告都更频繁地出现。
尽管如此,在 Google 自己的网站上,暗示逮捕的 Instant Checkmate 广告在针对黑人相关名字的搜索中显示的比例仍然高于白人相关名字。在针对黑人身份名字出现的 366 个广告中,有 92% 暗示了逮捕。针对白人身份名字显示的广告要少得多(总共 66 个),但有 80% 暗示了逮捕。92 和 80 这两个比率之间的差异具有统计学意义,数据可以用偶然性来解释的可能性小于 1%(卡方检验:χ2 (1)=7.71,p < 0.01)。 美国平等就业机会委员会用于衡量歧视的不利影响测试为 40%,因此在雇佣情况下,可能会导致歧视指控。(不利影响测试给出 100-92=8 和 100-80=20;用 8 除以 20 得到 40%。)
在专业人士和网民子集中,广告文本中包含逮捕一词的 Instant Checkmate 广告在针对黑人身份名字的搜索中出现的比例也高于白人身份名字。
本研究的初始假设是,基于种族相关名字的搜索,在暗示逮捕记录的广告投放方面不存在差异。研究结果否定了这一假设。在 Reuters.com、Google.com 以及样本子集上的搜索中,广告文本中使用逮捕一词的广告在针对黑人身份名字的搜索中出现的比例高于白人身份名字。在托管 Google AdSense 广告的 Reuters.com 上,黑人身份名字生成暗示逮捕记录广告的可能性高出 25%。
本研究中使用的名字背后的人是多元化的。政治人物包括马里兰州州众议员艾莎·布雷博伊(逮捕广告)和杰伊·雅各布斯(中性广告);美国副总统乔·拜登的妻子吉尔·拜登(中性广告);以及克莱尔·麦卡斯基尔,她在密苏里州竞选美国参议员的广告与使用逮捕一词的 Instant Checkmate 广告同时出现(图 6)。从学术网站挖掘的名字包括研究生、研究人员、行政人员、职员和有成就的学者,如宾夕法尼亚大学校长兼美国总统生物伦理问题研究委员会主席艾米·古特曼。达斯汀·霍夫曼(逮捕广告)也在使用的名人名字之列。从当地到全国的名人运动员也出现在其中(各种中性和逮捕广告)。研究中使用的名字中最年轻的人是一位失踪的 11 岁黑人女孩。
本研究中收集的 1,100 多个名字来自 PeekYou,其评分估计了该名字在网络上的总体存在感。正如预期的那样,名人的得分最高,为 10 分和 9 分。这里使用的名字中只有四个的 PeekYou 得分为 10 分,12 个的得分为 9 分,包括达斯汀·霍夫曼。这些高分名字只出现了两个广告;在其余 PeekYou 分数范围内出现了大量广告。对于 PeekYou 分数较高、更知名和受欢迎的名字,获得广告首位的竞价可能更高。了解到研究中高分人数很少,并且广告出现在 PeekYou 分数的完整范围内,这减轻了人们对竞价价格差异的担忧。
有时同一个人会出现不同的 Instant Checkmate 广告。大约 200 个名字在 Reuters.com 和 Google.com 上都有 Instant Checkmate 广告,但只有 42 个名字收到了相同的广告。其他 82% 的名字在两个网站上收到了不同的广告。在 Reuters.com 上对研究中出现的 62 个重复名字的搜索结果显示,其中 37 个名字的广告不同,7 个名字的广告相同,18 个名字没有广告。对于同一个名字,在 Reuters.com 和 Google.com 上最多出现了三个不同的广告。图 7 显示了 Latonya Evans 和 Latisha Smith 出现的各种广告。为一个名字提供不同的可能广告文本提醒我们,虽然 Instant Checkmate 提供了广告文本,但 Google 的技术在决定显示哪个广告时,是从可能的文本中选择的。在图 7 中,每个名字都有暗示逮捕和不暗示逮捕的广告,尽管它们都有更多暗示逮捕的广告。
为什么会发生这种歧视?是 Instant Checkmate、Google 还是社会应该为此负责?我们尚不清楚,但要了解情况,需要进一步了解 Google AdSense 的内部运作。Google 明白广告商可能不知道哪种广告文案效果最好,因此广告商可能会为同一个搜索字符串提供多个模板,而“Google 算法”会随着时间的推移学习哪种广告文本从观看者那里获得最多的点击。它通过根据每个广告的点击历史记录分配权重(或概率)来做到这一点。起初,所有可能的广告文本的权重都相同,并被假定为同样有可能产生点击。随着时间的推移,当人们点击某个版本的广告的次数多于其他版本时,权重会发生变化,因此获得最多点击的广告文本最终会更频繁地显示。这种方法使作为广告投放者的 Google 的经济利益与广告商的经济利益保持一致。
Instant Checkmate 是否为黑人身份名字不成比例地提供了暗示逮捕的广告模板?或者,Instant Checkmate 是否为种族相关名字大致均匀地提供了相同的模板,但用户更频繁地点击了针对黑人身份名字的暗示逮捕的广告?正如前面提到的,在与 Instant Checkmate 的创始人及其律师的电话会议中,该公司代表声称 Instant Checkmate 为其数据库中的姓氏组(而非名字)向 Google 提供了相同的广告文本;他们没有表达其他关于名字和广告选择的标准。
Google 使用云缓存策略来快速投放广告。这些策略是否可能对先前加载到云缓存中的模板产生偏差?是否存在组合效应?
这项研究只是一个开始,还需要更多的研究。为了保留研究机会,我捕获了在 30 个提供 Google 广告的网站上,针对 2,184 个名字的 50 次点击的额外结果,以了解每个名字广告出现次数的潜在分布。虽然分析这些数据可能具有启发意义,但最终,本研究中提出的基本信息不会改变:在这些广告的投放中存在歧视。
技术如何解决这个问题?一种答案是改变广告的质量评分,以折扣掉不必要的偏见。其想法是衡量广告投放中的实时偏见,然后在拍卖时相应地调整广告的权重。Google 技术的通用术语是广告交易平台。这种方法无缝地集成到广告交易平台的运作方式中,允许以最小的修改使广告投放与社会规范协调一致;它可以推广到其他广告交易平台(不仅仅是 Google 的);最后,它适用于任何歧视原因——广告商在投放广告中的偏见或社会在选择广告中的偏见。
然而,歧视是在线广告的核心。差异化投放是其背后的理念。例如,如果年轻的育儿妇女倾向于购买婴儿用品,而有低音钓鱼艇的退休男性倾向于购买渔具,并且您知道观看者是这两种类型之一,那么向年轻母亲提供婴儿用品广告,向渔民提供钓鱼竿广告,而不是反过来,效率更高。
另一方面,并非所有歧视都是可取的。社会已经确定了一些需要保护的群体,使其免受特定形式的歧视。根据美国的社会和法律规范,针对黑人身份名字的搜索比针对白人身份名字的搜索更频繁地投放暗示逮捕的广告,这是一个不受欢迎的歧视例子。尤其如此,因为无论公司数据库中是否存在这些名字的实际逮捕记录,广告都会出现。
好消息是,我们可以使用前面描述的机制和法律标准来构建技术,区分广告投放中可取和不可取的歧视。关键组成部分是:(1)识别受影响的群体;(2)明确要评估的广告范围;(3)确定广告情感;以及(4)测试不利影响。
1. 识别受影响的群体。可以定义一组谓词来识别受保护群体和比较群体的成员。给定广告的搜索字符串和文本,如果广告可能影响谓词主题的群体,则谓词返回 true,否则返回 false。婴儿名字统计数据可以识别名字,用于构建种族和性别群体,以及姓氏,用于对某些族裔进行分组。特殊的词汇表或报告成员资格程度的函数可能对其他比较有帮助。
在本研究中,广告出现在真实人物全名的搜索中,分配给更多黑人或白人婴儿的名字构成了用于测试的群体。这些黑人和白人谓词根据搜索字符串的名字评估为 true 或 false。
2. 明确要评估的广告范围。重点应放在那些能够以法律或社会规范禁止的歧视形式影响受保护群体的广告上。保护通常涉及给予或拒绝利益、便利、服务、就业或机会的能力。与其将所有广告混为一谈,不如使用搜索字符串、广告文本或产品,或与广告一起显示的 URL 来决定要评估哪些广告。
本研究评估了真实人物的名字和姓氏的搜索字符串、公共记录广告以及具有特定显示 URL (instantcheckmate.com) 的广告,后者信息量最大,因为不利广告都具有相同的显示 URL。
当然,广告的受众不一定是广告主题人物。在本研究中,受众是询问广告主题人物姓名的人。在考虑可能受广告影响的群体的身份时,这种区别很重要。群体成员资格基于广告的搜索字符串和文本。受众可能会对群体的明显正面或负面描述产生更多共鸣。
3. 确定广告情感。情感分析最初与总结产品和电影评论相关联,是计算机科学的一个领域,它使用自然语言处理和文本分析来确定文本的总体态度。13 情感分析可以衡量广告的搜索字符串和随附文本是否具有正面、负面或中性情感。文献检索没有发现任何先前在在线广告中的应用,但在评估社交媒体中的情感方面已经做了大量研究(例如,sentiment140.com 报告推文的情感,这与广告一样,单词有限)。
在本研究中,包含逮捕或犯罪一词的广告被归类为具有负面情感,而没有这些词的广告被归类为中性。
4. 测试不利影响。考虑一个表格,其中列是比较群体,行是情感,值是广告展示次数(广告出现的次数,无论是否被点击)。忽略中性广告。比较各群体之间具有相同正面或负面情感的广告百分比,揭示了一个群体可能在多大程度上受到广告情感的更多或更少的影响。卡方检验可以确定统计学意义,而美国平等就业机会委员会和美国劳工部使用的不利影响测试可以表明,在某些情况下,这种影响是否可能导致法律风险。
在本研究中,群体是黑人和白人,情感是负面和中性。表 2 显示了摘要图表。在为黑人群体出现的 488 个广告中,有 291 个(或 60%)具有负面情感。在为白人群体显示的 638 个广告中,有 308 个(或 48%)具有负面情感。这种差异在统计学上具有显著意义(χ2(1)=14.32,p < 0.001),不利影响度量为 40/52,即 77%。
将此分析纳入广告交易平台的一种简单方法是确定哪个偏差测试是关键的(例如,统计学意义或不利影响测试),然后在拍卖时将测试结果纳入广告的质量评分中。例如,如果我们修改广告交易平台,使其不显示任何不利影响评分低于 80 的广告(这是美国平等就业机会委员会的标准),那么针对黑人的逮捕广告有时会出现,但不会相对于针对白人的此类广告过度不成比例,无论广告商或点击偏差如何。
虽然本研究在整个过程中作为一个例子,但该方法可以推广到许多其他形式的歧视,并打击其他促进歧视的方式。
假设女性名字倾向于获得“立即购买”等中性广告,而男性名字倾向于获得“立即购买。五折!”等正面广告。或者,假设黑人名字倾向于获得“正在寻找 Ebony Jones”等中性广告,而白人名字倾向于获得“Meredith Jones。太棒了!”等正面广告。那么同样的分析会抑制一些正面广告的出现,以免产生歧视性影响。
这种方法不会阻止不满意的客户发布的关于商店的负面广告,也不会阻止竞争对手发布的关于竞争品牌名称的广告,除非这些被认为是受保护的群体。
即使是对受保护群体,非受保护的市场营销歧视也可以继续存在。例如,假设与黑人相关的搜索词倾向于获得某些音乐艺术家的中性广告,而与白人相关的搜索词倾向于获得其他音乐艺术家的中性广告。所有广告都会出现,而无需考虑不成比例的分布,因为这些广告不会受到抑制。
作为最后一个例子,这种方法允许每个人都受到负面影响,只要这种影响大致相同。假设所有针对所有名字的公共记录广告,无论种族如何,都同样暗示逮捕,并且展示次数几乎相同;那么就不会抑制任何暗示逮捕的广告。
计算机科学家辛西娅·德沃克和她的同事已经在研究确保种族公平性的算法。4 他们的总体概念是确保相似的群体按照与人口一致的比例收到相似的广告。效用是这个方向的关键问题,因为并非所有形式的歧视都是有害的,并且不寻常和离群的广告可能会被不必要地抑制。尽管如此,他们的研究方向看起来很有希望。
总之,这项研究表明,技术可能会助长歧视性结果,但也表明技术可以阻止不必要的歧视。
作者感谢 Ben Edelman、Claudine Gay、Gary King、Annie Lewis 和每周隐私主题参与者(David Abrams、Micah Altman、Merce Crosas、Bob Gelman、Harry Lewis、Joe Pato 和 Salil Vadhan)的讨论;感谢 Adam Tanner 首先怀疑存在这种模式;感谢哈佛大学总法律顾问办公室的 Diane Lopez 和 Matthew Fox 在面对法律威胁时使出版成为可能;以及感谢 Sean Hooley 的编辑建议。本研究的数据可在 foreverdata.org 和 IQSS Dataverse Network 上获得。部分由 NSF 拨款 CNS-1237235 和 Google, Inc. 的捐赠资助。
1. Barker R. 2003. 社会工作词典(第 5 版)。华盛顿特区:NASW Press。
2. Bertrand, M., Mullainathan, S. 2003. Emily 和 Greg 比 Lakisha 和 Jamal 更容易被雇用吗?劳动力市场歧视的实地实验。NBER 工作论文第 9873 号;http://www.nber.org/papers/w9873。
3. 中央哈德逊天然气和电力公司诉纽约公共服务委员会案。1980 年。美国最高法院,447 U.S. 557。
4. Dwork, C., Hardt, M., Pitassi, T., Reingold, O., Zemel, R. 2011. 通过意识实现公平。arXiv:1104.3913 [cs.CC]; http://arxiv.org/abs/1104.3913。
5. 平等就业机会委员会。2012 年。根据 1964 年《民权法案》第七章在雇佣决策中考虑逮捕和定罪记录。华盛顿特区。915.002; http://www.eeoc.gov/laws/guidance/arrest_conviction.cfm。
6. 平等就业机会委员会。1978 年。雇员甄选程序的统一准则。华盛顿特区。
7. Fryer, R., Levitt, S. 2004. 鲜明的黑人名字的原因和结果。经济学季刊 59(3);http://pricetheory.uchicago.edu/levitt/Papers/FryerLevitt2004.pdf。
8. Glover, E; http://www.physiology.emory.edu/FIRST/ebony2.htm(存档于 http://foreverdata.org/onlineads)。
9. Google AdSense;http://google.com/adsense。
10. Google。Google 公布 2011 年第一季度财务业绩; http://investor.google.com/earnings/2011/Q1_google_earnings.html。
11. Harris, P., Keller, K. 2005. 罪犯不得申请:雇佣决策中的犯罪背景调查。当代刑事司法杂志 21(1):6-30。
12. 国家研究委员会歧视评估方法小组。2004 年。衡量种族歧视。华盛顿特区:国家科学院出版社。
13. Pang, B., Lee, L. 2004. 情感教育:基于最小割的主观性摘要的情感分析。第 42 届计算语言学协会年度会议论文集。
14. Schneider, J. http://www.lehigh.edu/bio/jill.html(存档于 http://foreverdata.org/onlineads)。
15. Sweeney, L. 2013. 在线广告投放中的歧视。(有关详细结果和分析,请参阅存档于 http://ssrn.com/abstract=2208240 的完整技术报告。数据,包括网页和广告,存档于 http://foreverdata.org/onlineads)。
16. 美国民权委员会。1970 年。美国的种族主义及其斗争方法。华盛顿特区。
17. WebShot 命令行服务器版。版本 1.9.1.1; http://www.websitescreenshots.com/。
喜欢还是讨厌?请告诉我们
Latanya Sweeney ([email protected]) 是哈佛大学的政府和技术常驻教授。她创建和使用技术来评估和解决社会、政治和治理问题,并教导他人如何做到这一点。她也是哈佛大学数据隐私实验室的创始人和主任。她于 2001 年在麻省理工学院获得计算机科学博士学位。有关她的更多信息,请访问 latanyasweeney.org。
© 2013 1542-7730/13/0300 $10.00
最初发表于 Queue vol. 11, no. 3—
在 数字图书馆 中评论本文
Ryan Barrows, Jim Traverso - 将搜索视为不可或缺的组成部分
大多数公司必须利用其数据来获得竞争优势。知识工作者可用的数据量在过去几年中急剧增长,虽然其中很大一部分存在于大型数据库中,但重要的子集仅以非结构化或半结构化数据的形式存在。如果没有正确的系统,这会导致信噪比持续恶化,从而为试图快速查找信息的繁忙用户制造障碍。三种企业搜索解决方案有助于改进知识发现。
Ramana Rao - 从信息检索到搜索,以及更进一步
自范内瓦·布什的开创性文章《诚如所思》描绘了一位学者在机器的帮助下的形象以来,已经过去了近 60 年,“这是一种个人在其中存储他所有的书籍、记录和通信的设备,并且它是机械化的,因此可以以极快的速度和灵活性进行查阅。”
Mike Cafarella, Doug Cutting - 构建 Nutch:开源搜索
搜索引擎对于互联网的使用至关重要,就像网络基础设施的任何其他部分一样,但它们在两个重要方面与其他组件不同。首先,它们的内部运作是秘密的,不像 DNS(域名系统)的运作那样。其次,它们掌握着政治和文化权力,因为用户越来越依赖它们来浏览在线内容。
Anna Patterson - 为什么编写自己的搜索引擎如此困难
一定有 4,000 名程序员在他们的地下室里敲代码,试图构建下一个“世界上最具可扩展性”的搜索引擎。它只被完成过几次。它从未被一个大型团队完成过;总是有一到四个人完成了核心工作,而大型团队则加入进来构建详细说明和生产基础设施。为什么这么难?我们将深入探讨编写搜索引擎时需要考虑的各种问题。本文旨在为那些正在考虑为其网站或内联网进行这项工作的个人或小团体而写。