The Voices of VR Podcast
介绍
我的名字是 Kent Bye,欢迎收听《The Voices of VR》播客。这是一个探讨空间计算未来的播客,您可以在 patreon.com/voicesofvr 支持这个节目。
这是第六集,共17集,聚焦于XR与人工智能的交叉点。在今天的节目中,我将与 Michael RunningWolf 探讨关于人工智能的土著视角。Michael RunningWolf 是北切延部落、拉科塔部落和布莱克菲特部落的人,他在蒙大拿州长大。他曾在亚马逊工作,但现在他致力于实现自己一生的目标,通过人工智能构建XR体验,用于语言教育,以重新夺回和保护土著语言。
与 Michael 的首次相遇
我第一次遇见 Michael RunningWolf 是在今年年初的斯坦福网络政策中心举行的现行法律与扩展现实会议上。他参加了一个小组讨论,讨论数据来源等不同问题,以及很多土著文化在这些年中被盗取的情况,以及这种数据整合到不同大型语言模型中的影响。因此,我将在节目说明中包含该讨论,您可以前去观看。
在这次对话中,我们将主要探讨土著语言,以及使这些语言在某些现有人工智能架构中变得独特和困难的因素,以及他希望为这些语言提供更广泛的自然语言处理支持的目标,以便保存这些语言,同时创造出具有额外背景域的沉浸式体验,改变语言的使用方式。
这次与 Michael 的访谈发生在2023年5月31日,地点是位于加利福尼亚州圣克拉拉的增强世界博览会。接下来,让我们深入探讨。
与 Michael 的对话
我叫 Michael RunningWolf,来自北切延、拉科塔和布莱克菲特部落,我在美国蒙大拿州长大,曾在亚马逊和其他公司工作。我有一个终身目标,就是使用人工智能构建XR体验,用于语言教育。例如,我想戴上头盔,能够用拉科塔语交流,体验“达科他水牛狩猎”活动或与VR中的数字化身或聊天机器人进行互动,这是一种教育体验,这样我们可以与技术互动,同时重新夺回和保护我们的语言。
是的,也许你可以进一步阐述一下你的背景以及你如何踏入人工智能和XR这一交叉领域的旅程。
背景与经历
这实际上始于我的母亲。她是一名惠普工程师,专注于激光光刻,因此她实际上是在制造微芯片。当我还是个小孩时,她教会了我如何使用滑尺,掌握了许多旧的模拟计算工具。在我成长的过程中,我非常机灵,之后对计算机科学产生了浓厚的兴趣。当我进入本科阶段时,我想,为什么不使用这些工具来处理土著文化知识呢?从那时起,我一直在追求如何创造教育技术,因为在美国,超过90%的土著语言都面临严重的濒危,而北美的大多数语言仅有少数老年说话者能流利使用这些语言,这非常不幸,因为北美代表了一些最丰富多样的语言,而这些语言正面临失传的危险。
在过去的5至10年中,我专注于语言技术和教育体验,最初从一些移动应用程序开始。之后,当我发现虚拟现实以及Oculus SDK和SDK 2时,我做了一次过山车体验在VR头盔中。那一刻我完全惊呆了,几乎跌倒在地,因为我从未想过这个玩具会让我感受到如此强烈的高度恐惧。因此,我意识到我们绝对可以使用这项技术进行语言教育,想象一下当你参与水牛猎捕,骑马,同时需要用拉科塔语与其他猎人协调,那将是一个非常吸引人的语言教育方式。
文化与语言技术
然而,关键的问题在于,早在2014年或2013年现代VR时代开始时,AI技术并不成熟,所以我有些放弃。我进行了一些文献综述,试图探寻有没有相关技术,但实际上没有针对这些土著语言的技术。
时光飞逝,2019年我在亚马逊Alexa担任隐私工程师,专注于大数据工作。在一次会议中,我偶然遇到了一支毛利科技团队,他们构建了自己的土著毛利语自动语音识别系统,他们称之为毛利Siri。我开始询问他们,像是如何做到的,面临哪些技术障碍。我发现他们只用了300小时的音频和非常小的文本语料库,我为他们所取得的成就深感震惊,因为他们创造了一项奇迹,凭借这么少的数据与资源来构建系统,这些系统通常需要谷歌和Siri有一支庞大的团队来处理从互联网收集的音频数据,建立这些自动语音识别系统需要投入数百万美元。
语言的独特性
那么,你认为土著语言为何对AI构建而言如此挑战,能否简单说明一下?
首先是数据的缺乏。我们在处理这些土著语言时面临数据不足的问题,因为这些语言的说话者数量非常有限。有的社区只有16位流利说话者,他们不可能创造出一百万小时的注释音频。因此,我们需要想出一些策略来处理非常稀疏的数据集。
其次,北美的土著语言结构与西欧语言根本不同。因此,像Siri或Google Assistant这样的AI基本上假设语言与英语、德语或法语相似,而土著语言在各方面都非常不同,尤其是它们高度多合成的特性。我们的语言里嵌入的信息密度很高,一个词可能承载与英语一句话相同的信息量。
教育与未来的展望
我希望这项技术能够让年轻的土著人能够利用这些技术,舒适自如地在新领域中骄傲地展示他们的文化。教育领域的认知研究显示,XR教育效果极佳。我也希望利用这技术为土著语言赋能,让它们在未来的社交XR中获得更多的支持,而不是被迫放弃自己的文化。通过这些XR技术让语言教育更有魅力,帮助维护弥足珍贵的文化。
总结
这次与 Michael 的访谈探讨了土著语言与AI的特别关系,以及如何利用现代科技帮助保护和提升这些语言的学习。Michael 的梦想到创造一个让土著年轻人能够用自己的语言与技术互动的新空间,这一定会带来深远的影响。
感谢您收听《The Voices of VR》播客,如果您喜欢这个节目,请让朋友们知道,并考虑成为Patreon的成员。这期节目到此结束,谢谢您的收听!