/ Voiceofvr / 0浏览

《AI骗局》作者艾米莉·M·本德和亚历克斯·汉娜对人工智能炒作的剖析

The Voices of VR Podcast

介绍

大家好,我的名字是Kent Pye,欢迎收听《VR声音播客》。这是一个探讨未来空间计算中沉浸式叙事结构和形式的播客。您可以在patreon.com/voicesofvr上支持这个播客。

关于人工智能与XR技术的交集

在《VR声音播客》中,我在过去十年里进行了大约一百个采访,探讨人工智能与XR技术(即虚拟现实、增强现实、混合现实)之间的交集。目前我们正处于人工智能的炒作阶段,所有这些大公司都在发布各种声明,进行夸大宣传。现在有一种排行榜心态,他们在公布数字,并声称他们在某个方面是最好的,但这种方法论存在很多问题。

今天的节目内容

在今天的节目中,我将通过与一本名为《AI Con》的书的作者Emily M. Bender和Alex Hannah的对话来解构一些人工智能的炒作。他们非常出色地从计算语言学和社会学的角度审视这些人工智能的炒作,研究这些大型语言模型的局限性。还有一种关于如何利用人工智能的权力以及它被如何利用的方式。要指出的是,过去一周左右,国会的共和党人申请通过一项法案,禁止美国内任何州在未来十年内通过任何限制或规制人工智能的法律。 这只是一个例子,说明像人工智能这样的术语并没有很好地定义,它可以表示各种各样的东西。如果通过了这样的立法,实际上可能意味着在未来十年内对所有技术进行监管的禁令,这在我看来是绝对荒谬的。 但这正是我们现在所处的夸大的炒作阶段。

节目的特别嘉宾

今天的采访发生在2025年5月21日,采访的嘉宾是:

Emily M. Bender

我是华盛顿大学的语言学教授,我的主要专业实际上是计算语言学。在这个范畴下,除了研究计算句法和语义学外,自2016年底以来我还一直在关注语言技术对社会的影响。

Alex Hannah

我是分布式人工智能研究所的研究主任。我们是一个非营利性的研究机构,专注于人工智能和新计算技术的危害,同时也尝试构想新的技术未来。我的工作主要关注新的计算方法背后的数据,以及这些数据如何加剧种族、阶级和性别不平等。

背景与探索

也许你们可以多谈谈你们的背景以及如何开始批判性地关注新兴技术的旅程。Emily首先谈谈。

Emily M. Bender

我最初专注于文法工程,可以将其视为跨语言的自动句子图示。当我的领域被对语言模型的热潮所采取时,事情有了变化。在计算语言学和自然语言处理领域,这种情况发生得比世界其他地方要早一些,因为这项技术源于我们的研究领域。2010年代末期,计算机科学这一方的人员开始声称语言模型能够理解。我对此表示怀疑。作为一名语言学家,我可以告诉你这绝对不可能,因为语言是符号系统,存在形式和意义,而语言模型的训练数据中只有形式,我们无法指望机器学习系统学习训练数据中未包含的内容。

Alex Hannah

而我是一名社会学家,关心技术的社会影响,从2009年作为研究生进入这一领域以来,我主要关注社交媒体对社会运动的影响。我利用一些计算社会科学的方法,尤其是文本处理和机器学习,分析关于社会运动的报纸数据。在大约九十年前的这个时候,机器学习的公平性问题引起了我的注意。然后,在Emily提到的大家对大型语言模型失去理智的情况下,我开始更加严厉地审视机器学习模型及其对社会的影响。

AI虚假宣传的批判

作为一名经验丰富的记者,我发现人们形成了一个极端化的趋势,有的人是坚定的信徒,认为这一切都是美好的,而另一些人则是完全的怀疑者。我试图在中间找到一个道路。你们能够阐述AI炒作中一些更具幻想的方面吗?以及你们是如何在《AI Con》一书中体现这些论点的?

Emily M. Bender

关键在于语言是如何运作的。当我已经提到,语言模型的唯一可用训练数据就是语言形式。体验语言形式没有意义就很困难。在不懂一种语言的国家旅行时,你可以感受到周围的人在交谈,或者看到有些标志在说些什么,但这些对你来说没有任何意义。值得记住的是,这就是语言模型的输入。然而,随着语言模型变得越来越复杂,有了聪明的架构和大量的训练数据,我们现在能看到似乎非常连贯的文本。当我们看到这样的文本时,我们会试图理解它,而这又依赖于我们在文本背后想象某种心智。

Alex Hannah

对我来说,当关注的焦点在于这些系统的意图是什么时,我的怀疑感很快就会浮现。因为这些系统的基本操作是在输入序列中生成最可能的输出,因此没有任何方式能够解决所谓的幻觉问题。此外,我们不喜欢称之为幻觉,因为这会赋予它一种人性化的特征。

关于基准和排名文化

我想深入探讨一下基准问题,这是你们两人都有很多研究的部分。我在观看谷歌IO的主题演讲时,看到他们展示了一张幻灯片,声称“看看,我们在这个排行榜上第一”,这暗示了这些模型使用了一些科学研究的方法,然而在这些数据采集方式和评估限制方面有许多漏洞。我想听听你们关于此及关于AI的排行榜文化的看法。

Emily M. Bender

我们共同撰写了几篇论文,主题正是围绕这些问题展开。我们的一篇论文名为《AI和整个iWorld基准》,讨论了一个被认为是通用图像理解数据集的概念。在这篇论文里,我们集中探讨了ImageNet。此外我们还有一篇名为《数据及其不满》的论文,涉及图像计算机视觉数据集的调查。基准经常被塑造成能做一切的样子,然而这本身就是不切实际的,试图寻找通用基准是根本不可能的。

Alex Hannah

正如Emily所说,挑战基准、排行榜文化以及AI本身的文献中有很多问题,特别是公众所期望的、通过排名数据提供的透明度不足。而在许多情况下,这种排行榜文化在很多方面反而混淆了科技进步。

再谈人类智能与权力

要谈及人工智能的这种情况,主要是这使得人类价值的构建变得更加模糊,同时降低了人的身份。接下来,我想请你们谈谈人工智能这一术语的历史,以及它如何成为一种技术的隐喻,以及在这种技术集合中,其背后所涉及的权力动态和人类的基本需求。

Emily M. Bender

在术语的层面上,“人工智能”这一词将许多不同的技术捏合在一起。我们经常需要警惕这一点。我们在使用过程中往往容易将不同的技术视为单一的“人工智能”,而这很可能导致人们对其在日常生活中的使用产生误解。同时,智能是一个定义不明确的模糊概念,当我们谈论人工智能时,实际上是在讨论人类所能做的事情,这并非是机器所能实现的。

Alex Hannah

而且,正如你提到的,技术的掌控者是那些可以利用这些技术以自身利益为目的的人。我们看到大型语言模型在许多工作场所被用于取代人类劳动力,于是这些技术实际上成为了权力的工具。需要明确的是,能够掌握、控制并受益于这些技术的,往往是那些在这种技术革命中占据主导地位的少数人。

终结问题与未来展望

在结束之前,我想请你们分享一下对新兴技术未来的看法。我们的读者是否还能够寻求实现更加伦理化和有意义的技术使用?

Emily M. Bender

这是一个复杂的问题,我想强调,技术不是注定要以某种方式发展的。我们可以共同努力,确保未来的技术使用是有目的的,是以人为本的。

Alex Hannah

在技术的发展中,绝对要强调社区的参与与协作,强调多样性和不同视角的重要性。只有这样,我们才能创作出能够真正服务于每一个人的技术。