社交VR将审核挑战凸显出来,这是非VR游戏通常能够避免的。语音、沉浸感和高度社交的设计提高了风险,而经济现实也在审核覆盖范围上造成了限制。好消息是,基于数据的方法显示还有另一条道路。
特约文章由Dr. George Ng撰写
George是GGWP的联合创始人兼首席技术官,他在该公司工作于帮助在线社区理解用户、减少毒性和流失,并作为合作伙伴支持实时运营团队的系统。此前,他共同创办了Cyence,这是一个网络风险评估平台。Cyence被Guidewire Software收购,George在后者担任首席数据官。Ng博士曾是Cray超级计算机的首席数据科学家,以及DARPA的研究科学家。Ng在加州大学伯克利分校教授机器学习,在美利坚大学教授博弈论,在加州大学欧文分校教授经济学。
社交VR中的审核挑战在结构上与传统的平面游戏截然不同。
在平面游戏中,玩家通常以第一人称或第三人称的视角进行游戏,由于游戏手柄或键盘鼠标等输入设备的限制,玩家之间的互动方式有限。语音交流常常在没有麦克风的玩家与只能在派对聊天或外部语音平台(如Discord)中交流的玩家之间呈现出碎片化特征。
而VR头显将玩家直接置于角色之中,运动控制器允许更加多样化(且可能更具侵入性)的玩家之间互动。并且,由于每个VR头显都配有麦克风,开放的语音交流被期望是常态,而非例外。
这种因素的组合使得社交VR空间的审核变得独特而具有挑战性。风险面更大,安全期望更高;但由于市场现实,处理这些问题的预算通常更小。
在多款社交VR游戏中,事件数据显示出一致的模式:有效的审核并不需要持续监控。它需要基于风险信号的有针对性的关注。
为什么VR是审核的特例
在大多数社交VR游戏中,没有实际的文本备选,所以与其他在线社区相比,这里显著的区别是语音优先设计。在游戏中,有相当大一部分有意义的互动是通过语音进行的,这立即提高了每位用户的审核成本。语音审核的计算、存储和审查成本高于文本审核。它也增加了情感强度,从而在事件发生时放大了感知伤害。
受众组成又增加了另一个层面。社交VR空间通常包括具有不同成熟度和经验水平的玩家,这可能导致冲动行为和边界测试增加。当其他人表现出异常时,玩家更可能加入其中,而更不可能在当下自我调节。
此外,还有设计本身。通过接近聊天、开放大厅和自发的群体行为进行社交互动并不是附属特性,而是体验的整个核心。与团队射击游戏中语音聊天支持比赛不同,社交VR空间中的社交互动是人们出现在这里的主要原因。
社交VR中的每用户收入显著低于许多成熟类型,同时安全期望则更高。结果是一个结构性制约:高互动量、高敏感性和有限的审核预算。
为什么基于风险的优先级至关重要
一种普遍的本能是认为保持玩家安全的唯一方法是监控一切。普遍监控可能非常有效,但它也是资源密集型的。实际上,许多开发者从分层方法中受益,这种方法结合了广泛覆盖与基于风险的优先级。
在我们分析的多款VR游戏中,不到1%的玩家占据了约28%的所有记录事件。这些模式并不是理论性的。它们在今天一些最大的社交VR社区中被观察到,包括《Gorilla Tag》和《Animal Company》等标题,社交互动和语音是玩家体验的核心。
这些是反复违反规则的“老顽固”,一再制造问题。大多数玩家从未产生过单一报告。即使是那些产生报告的,许多人也并不总是具有干扰性。
统一监控假设风险是均匀的。实际上,风险高度集中。
在规模化情况下,审核是在不确定性下的资源配置问题。目标不是最大观察,而是每单位监控的最大边际伤害降低。
如果将关注点集中在少数导致大多数事件的玩家和情况上,您可以显著减少整体的伤害。
智能抽样
在VR数据中,另一个一致出现的模式是,极少数玩家始终表现不佳。相反,许多玩家是在特定情况下表现不佳。他们对周围的人作出反应,并在其他人越界时升级。他们之所以加入其中,是因为在那个时刻感觉社会上是可以接受的。
有针对性的抽样显著提高了检测效率,这意味着有效系统优先考虑与风险相关的信号,而不是随机监听固定比例的会话。过去的行为历史是一个输入,会话级别的上下文是另一个。大厅中谁在、空间的类型、玩家在会话中的进行程度都很重要。重复举报或聚集在已知违规者周围的元数据可以进一步清晰图像。
即使只有一部分会话是基于风险信号优先的,也可以揭示出不成比例的事件。在多个VR环境中,利用基于风险优先级的方法抽样大约10%的会话,平均可以揭示出约52%的所有记录事件。准确比例随标题和月份波动,但更广泛的模式保持一致:风险是集中在某些地方。当覆盖范围超出该基线后,检测和预防率进一步提升。
为什么这尤其适合VR
基于风险的优先级使开发者能够将执行重点放在伤害最集中的地方。该方法提高了干预率,同时使基础设施和审查工作流程更易管理。对于快速扩展的团队来说,这可以在不造成不可持续的运营增长的情况下显著改善安全覆盖。同样重要的是,它降低了基础设施成本,并缓解了可能破坏玩家信任的广泛监控感知,如果没有透明治理的话。
有一个权衡,因为抽样并不完美,无法实时预防。您会错过一些事件发生。它的优势在于长期的震慑和行为塑造。在许多社交VR环境中,震慑和长期行为塑造比完美的实时拦截更为重要。
震慑胜过全面覆盖
当举报得到验证且结果可见,或至少是被社会理解时,审核效果会叠加。当玩家相信执行确实发生时,行为会改变。即便是部分执行也能显著减少后续事件。
我们在大型社交VR标题中看到过这一动态。当执法变得可预测,反复违规者面临逐步后果时,整体事件率即使在没有普遍监控的情况下也会下降。
在VR中,社交线索和声望传播迅速,震慑的效果可能比完美的检测更强。
开发者应该衡量和建立的方向
对于开发者而言,收获不是审核可以最小化,而是审核应该有针对性。
倾听一切可能并不适合每个团队。投资于优先级逻辑、会话级别的上下文,以及为重复违规者建立明确的升级路径,通常会带来更好的结果。成功的度量标准应优先考虑事件集中度降低、重复违规者的再犯率和玩家自报的安全水平,而非原始检测量。
这些度量标准反映出玩家实际关心的内容,并最终引导出最繁荣的在线社区,让玩家感到安全、愿意出现、发言并留下来。
通过在可能的情况下结合全面的数据获取与智能优先级和上下文信号,开发者可以在不诉诸无差别监控的情况下,扩大规模减少伤害。
对于构建社交VR社区的开发者而言,下一步是将审核视为实时服务基础设施:低延迟、服务器端、防篡改的系统,能够实时处理语音和行为信号,优先处理高风险会话,并支持明确的升级工作流程。
GGWP正围绕这个模型构建审核基础设施,涵盖语音、文本、玩家报告和上下文风险信号。想要在不依赖普遍监控的情况下提升社交VR安全的开发者,可以在GGWP了解更多信息。