The Voices of VR Podcast
我的名字是Kent Bye,欢迎收听《VR之声》播客。元宇宙是科幻作家三十年来一直在写的主题,我认为作为一个媒介,我们仍在探索VR真正可能实现的内容。因此,我认为真正想象元宇宙的全部潜力是非常困难的,但我相信目前正在为元宇宙奠定基础,通过Unity和Unreal Engine等本地应用程序创建的不同VR体验正是如此,并发布在应用商店中。但还有另一种关于这些互联世界的愿景,将建立在开放网络之上,能够利用已经存在的互联网和全球网络,推动一个3D版本的网络,这可以说是元宇宙。
今天我们将与Josh Printer交流,他在将VR引入网络这个问题上工作了很长时间,我也在他仍在Mozilla工作时采访过他。他现在在Google的Daydream团队工作,试图将WebVR和所有这些开放标准引入即将在明年初发布的Chromium浏览器。因此,Josh实际上在这个w3c聚会上做了一个闪电演讲,谈到了他如何看待CSS、HTML和JavaScript完美地整合到这个3D网络中的愿景。
现在,这仍然像一个黑匣子一样存在。WebGL编译的二进制代码要么是为Unity导出的,要么是通过JavaScript生成的。这是一种展示什么是将要启动这个开放网络的方式。但Josh谈到了Google正在进行的一些早期实验,来创建OpenGL与CSS和JavaScript的混合组合,能够通过这些标准技术添加各种不同的用户体验层。因此,对于接下来的发展,大家都充满了兴奋和动力,但这仍然是非常早期的阶段。我们会与Josh谈论目前的情况,他如何看待未来的发展,以及他认为开放网络的优势如何与虚拟现实紧密相连。
快速赞助商广告
但首先,我们来听一段来自赞助商的简短宣传。今天的节目是由《VR之声》Patreon活动赞助的。我个人对VR的潜力感到非常着迷,它将如何改变我们的社会。在过去的几年里,我一直在全国各地进行旅行,参加所有主要的VR会议,以了解最新的趋势,获得丰富的体验并与你们分享,让你们能够获得灵感,创造你们想要创建的内容。同时也能够听到外面发生的事情。这个领域发展得非常迅速,任何一个人都很难跟上。因此,我尽全力去参加这些不同的会议并带来最新的消息。如果你对此服务感到满意,并且希望支持我和更广泛的VR社区,请成为我Patreon活动的捐赠者。
这次与Josh的采访是在2016年10月29日的一个星期六,地点在旧金山的一家咖啡馆。那么,让我们直接进入正题。
Josh Carpenter的介绍
我的名字是Josh Carpenter,我在Google的WebVR团队,属于Daydream团队。
太好了!也许你能简单给我介绍一下最近的情况。大约一周前刚刚举行了一次与所有主要WebVR参与者的大型会议。你能告诉我关于这个会议的前因后果和成果吗?
当然,这很酷。两周前,我们在w3c召开了一次WebVR研讨会。组织者们在会后跟我说:“我们不知道会有谁参加。”我们知道Mozilla会在场,Google也会在,因为他们都宣布在开发WebVR,但名单上还有每个科技公司,甚至是Apple和Sony。我从事WebVR已经两个年头了,起初这还只是一个晦涩的事情。看到它实际上突破了所谓的主流计算,真是太疯狂了。感觉像是我们跨越了一个河流,现在每个重大VR公司都在某种程度上支持这个技术,这真是太惊人了。
我也绝对视之为一个转折点,跟踪这一切的确发生了巨大的变化。从2014年在硅谷虚拟现实会议上与Vlad Posovich和Tony 3c的交流到现在,即便是在GDC上,我也知道还没有在GDC的展示厅中展示任何演示,直到现在才看到这种成果。但能够聚集所有这么多公司分享这个话题,让我感觉这是建筑在开放网络技术上元宇宙未来的巨大转折点。
的确,因此我们也发布了一项公告,我们是在Google内部的Daydream和Chrome团队进行了一些努力,过去五个半月我们一直在开发Chrome VR。所以它的概念是,网页的美在于你可以在超文本链接之间毫无障碍地漫游。没人告诉你要安装某个东西,或者不允许你去某个地方。我希望能戴上耳机,做到这一点,从世界到世界穿梭。所以我们正在积极推动这方面的工作。这是Chrome VR,它将是结合到Android Chrome中的新浏览器用户体验。
VR的未来
这次体验将在发布时,需要取出你的Android手机,首先用Chrome开始。我们希望最终能实现无处不在的支持,但你拿出手机,找到一个有趣的网站,可能是2D,也可能是视频,可能是WebVR,这并不重要。你只需将其放入Daydream头显中,戴上头显,你就正在看那个网站的内容,无论是2D、视频、家庭影院模式还是完全360度高性能的WebVR体验,都是身临其境的体验。然后你点击超链接,从一个世界游向另一个世界。我们的互动模型有点像我们认为自己是移动Safari的WebVR,你要创造新的沉浸式体验的同时,也要向后兼容。
还记得当Steve Jobs第一次在舞台上展示“捏合缩放”时吗?你会说:“哦,当然,这是如何将《纽约时报》的桌面网站缩小到3.5英寸的iPhone 1屏幕上。”我们必须做到同样的事情,对那些在当前低分辨率显示屏上难以阅读的小型文本进行易读性优化。所以我们正在进行各种有趣的设计实验,找出如何能让你像在移动设备上那样轻松地以无缝的方式放大到某段特定内容。
关于开发者与市场的看法
我觉得这一点很兴奋,因为到目前为止,我们看到的元宇宙,是由Unity等专有工具或这些碎片化的应用生态系统创造的,你必须不断进入和退出体验。我与Neil Trevitt谈过,他在2015年GDC上提到过,开放与封闭之间总会存在争议。我认为未来的元宇宙是有可能形成这样的趋势,使用web作为基础设施就显得尤其令人振奋。正如Vlad Vasovich所说的,我们已经拥有元宇宙,只是没有三维界面而已。网络和互联网就是元宇宙。 在谈到Philip Rosedale时,他提到在万维网的早期,AOL和CompuServe试图走上封闭壁垒的生态系统之路,试图提供高度优秀且经过打磨的用户体验,但网站之间缺乏互联互通。Rosedale表示:“你得看看Metcalfe定律,”它指出网络的价值是通过连接数量的平方增加的。换句话说,超文本链接越多,这些不同网站之间的连接就越多,长期来看,这样的环境更有价值,让信息能够互联互通。
因此,Chrome VR与构建元宇宙的WebVR基础设施似乎也朝着这个方向前进。是的,我认为App Store是个不错的事,我拥有Apple产品,我喜欢高性能的本地应用程序,开发者能够通过应用商店赚钱,我觉得总的来说这是件好事。我也喜欢那种阴阳平衡的局面。这是一个完全开放且去中心化的空间,没有人能告诉你不能发布某样东西。工具大多是开源的。我觉得这是一种很好的新兴创造的机制,降低摩擦,实现去中心化,开源也是非常好。所以我希望两者都能共存。
在一年内,我们将会有多个浏览器在外面存在,多个VR浏览器,这真是令人震惊的兴奋。你有Carmel,Monoculus,你会有来自我们的Chrome VR,并且希望会有其他更多的浏览器也会出现。Gear VR已经存在了。你将能够坐在你的头显上,不论你的平台是什么,要么安装一个应用程序并玩得开心,要么启动一个浏览器,游历各个虚拟世界。我认为你将会有阴与阳的结合。
接下来我觉得非常有趣的是,这曾经是两个极端:Web等于浏览器,Apps等于应用程序,两者之间没有交集。但这已经有很多年不再成立了。如今在手机上,大多数移动应用程序集成了Web视图。你甚至可能不知道它正是网页。URL栏未必会出现,但其以高速呈现你的所有内容,具有良好的向后兼容性。当你在Facebook上,点击一个链接,它在Web视图中打开。因此,Web渲染引擎已经极为商品化,现在它们被无缝嵌入到本地应用程序中。在Unity中,你有Coherent UI实现这个功能。过去制作游戏UI是在Flash中进行,而现在你可以在Chromium上使用Coherent UI。Web其实在2D领域表现很好,并且进行2D布局引擎的构建其实是非常困难的,因此我们将其应用于擅长的领域。因此,我认为你将会看到,纯本地应用和纯浏览器将各有极端,但其中会出现一些非常有趣的实验,我们将会有混合应用,即混合网与混合本地,而那里必定会发生一些很酷的事情。
作为一个想创造更多VR体验并深入这一技术的人,我想的有点像选择骑的马。使用Unity?还是选择一个使用大型资产商店且提供大量在线信息以供参考的工具?还是选择Unreal引擎,它拥有丰富的可视化脚本语言和高可视化输出?目前这两者是生产本地应用程序的主要方式,我认为大多数性能卓越的应用程序,95%以上都基于这两项技术。还有一些开源的替代方案或者手工制作的东西,但也有其他选择,比如能够编写一些东西,导出为WebGL,将WebGL内容作为本地应用程序运行,从而实现真正的跨平台兼容。我知道不同引擎公司也在进行不同的计划,最终将能够导出支持WebGL的输出,你可能在Unity或Unreal中创建一个场景,最终你可以输出并将其放到网络上。我记得在早期的网站上,有一些Adobe产品用于生成HTML,它们总是显得粗糙,完全不优雅。因此,我有点期待类似的情形。这些封闭的专有解决方案将会导出这种网络原生代码,也许它将仅被编译成WebGL二进制文件,而你无法实际编辑这一内容。此外,你必须回到系统中,没有其他人能进行编辑。因此,我认为这些不同的工具最终将可能支持能够发布到Web上的能力,也能够将WebGL内容包装在某种包装器中,以便作为本地应用程序运行,并通过Oculus Home或SteamVR交付。
小结
在过去的七八年中,我在Mozilla之前,网络的一个宏观趋势就是所谓的可扩展网络。那就是说,这会很有趣,如果明天你我有个想法,我们可以立即动手,而不必等标准。“你知道吗?这实际上对创新很有好处,因为我们在漫长的标准化过程之前可以进行实验。虽然这条路是好的,但它本质上是慢的。我们在开放网络上已经看到五年的实验。所以可扩展性的网络哲学就是:赋予开发者使用非常不具指向性的低级API创建解决方案的能力,再通过开放实验得出经验,决定最终该怎么做。这完全不同于90年代的网络,这种情况之前是不存在的,因此这听起来很令人振奋。
同时,我所描述的是一种完全的自由,任何开发者都可以创造出与之前的网站完全不同的网站。我觉得这很棒。但我也坚信一个理由,就是网络在最初能迅速起飞,因为如果我教你点击蓝色链接,你就知道如何使用90%的网络,99%的网络。作为开发者,我们不需要创造自己的滚动条。你能想象吗,假如每一个我们访问的网站都提供完全不同的用户体验,你必须去学习,完全不同的性能特征,而使用深厚的工程能力来创造,因为这是非常复杂的,你将什么都得不到免费?我认为网络不会得到扩展。因此,我的观点是,网络的公式就是我所说的“保证最低体验”。如果你什么都不做,你便能获得一个低性能稳定网络应用程序,获得良好的用户体验,之后在此基础上,你还能获得完全的自由。
所以你想要做一些疯狂的事情?尽情去做。想在Unity中开始并导出你的应用程序,让它运行在网络堆栈中,这就太棒了。如果你什么都不做,只是一个想在五分钟内发布某些内容的爱好者,你也可以做到。所以,这些是我认为对于网络平台战略上很重要的事情,我觉得这对于开发者将非常赋权。你接下来会听到我和我的团队将在明年内从HTML和CSS开始实现这一目标。
目前,今天,你想创建一个网站,都是WebGL,所以是强制性代码。再次强调,非常灵活,但在浏览器的角度看,它本质上是一个黑匣子,我们不知道里面发生了什么。此外,作为开发者的你,WebGL实际上也提供了一个将自己做坏事的机会。浏览器没有办法支持你在性能方面。所以我要做的是,给予开发者HTML和CSS这样的工具,用于创建360体验。例如,你戴上你的Daydream头盔,看到一个网站是动态呈现在你眼前的。可以想象这会是什么样子,对吧?用一行CSS就可以在背景中放置360立体图像。这是超简单的。这样,你的汽车网站可以将你置于汽车内,而Airbnb则可以将你放在房子的内部。
但即便如此,如果我们做到这一点,而窗口依然是完全不透明,那就太无趣了。你无法看到背景。所以窗口本身必须变得透明。那么这就有意思了,你可以将该窗口的内容与背景无缝匹配,也许在窗口中有一个菜单,供你从网站来网站浏览。同时,所有这些都是HTML和CSS的内容。用户的交互模型由浏览器来提供,完全免费。这里的模型基本上可能是激光指示器模式,可能是最简的标准,你不必自己重新实现。然后如果我们有CSS 3D变换,现在只是平面上的视觉变换,但如果它们可以从表面上突兀出来并创造成任何大小呢?或许你就可以做一个像宽达1万英尺的Skybox的div,这就会变得很有趣,如果我们允许你开发者将HTML和CSS突起出来。
听起来有些奇怪,但将HTML和CSS用作设计工具,我们实际上在Mozilla一年半前制作了一个HTML和CSS基础的网络浏览器,没用WebGL。我创建的用户体验和网站完全是在DOM元素中构建的。那时我坐下来,一个晚上就抓了个Vimeo视频,放在我的面前,像是一个十英尺的iframe,底部带着元数据。这是极其简单且有趣的过程,利用了作为网络开发者所具备的所有技能与工具,几乎在几分钟之内就可以创建内容。我认为这就是网络将怎样扩展到数十亿个体验。移动桌面规模的网络将不再局限于WebGL。它将涉及我所谈论的工具的混合,以及WebGL的结合。我认为这一点是至关重要的。
对于VR和网络的思考
有几件事情让我想起,首先是将2D游戏移植到VR的概念,在业内一般被认为是不可取的。别只是在3D中放置这东西并期待它转换成有效形式。因此我对将2D网络转变为3D的做法持怀疑态度。这也让我想起,随着新通讯媒介的出现,尽量去复制以往媒介中已发生的事情,以及如何从非网络中的互动内容转移到网络中。就如同在Web 1.0和Web 2.0之间所发生的事情,试图真正弄清楚网络所要如何通过更具合作性的互动进行反应。但接着我们又遍历了一场移动革命,另一种新的通讯形式,大家试图将现有的网络想法应用到移动端,但随后需要经过一场新的革命,才重新弄清楚如何优先设计移动端,这样设计再转回到Laptop和Desktop端。
因此,我特别好奇你的想法。人们是否应该采用VR优先的方法,然后再将其能力转化为响应式设计,从移动到网络?
对,我认为你的回应就是设计。设计师会送给你一个非常优雅的理论,叫做“待完成的工作”。举个例子,你访问cnn.com,实际上是雇佣CNN来完成一项工作。在这种情况下,是围绕着向你 informieren ,而现在你在看电视上的CNN,呈现的同样是不同的工作。于是你观看安德森·库珀站在墙边,被飓风袭击的场景,例如你感觉自己近在咫尺。以VR的方式来看待这个,而是实际上让你在360度的环绕中,实时呈现,无需安装。一句生成的HTML即可提供其他相关信息,但与此同时,附带其他相关故事的链接也非常方便,只需点击即可进入不同位置,也许是不同的报道,从不同角度讨论这个消息。例如摩苏尔,你可以做到这一点是非常迅速、非常偶然的。我始终认为,网络将使从未能够做到的使用场景成为可能,因为因摩擦阻碍而受阻。
是的,我认为这确实是真正的。Visual Performance是否是性能的唯一定义,显然不是。就像视觉方面的图形,我们都在观看Blu-ray而不是Netflix那样。但是我们都知道,影响性能的还有其他重要因素,摩擦当然是一个。但还有一点我想说,不应该将我或网络视作一个聪明的设计师来去构思终极形态;更像是园丁,我们要考虑正确的公式,然后赋予他人创造的权利,并尽可能地引导和培育人们创造的能力,确保阳光、土壤和浇灌等的一切都能到位。我坚信网络是新兴创造的载体。
因此我希望在两年后,我们可以坐下来后,自己绝对想不到会发生什么。某个了不起的网页开发者或大型组织,他们可能是任何人,创造出了某些非常不错的使用案例,而我们始终无法预见到的,而得以实现,是因为他们采取了完全开源的工具,利用这个去中心化的发布平台,创造出他们所需的内容,随即就被发布出去,给世界带来了下一个伟大的想法。我确实希望网络能够为此提供一个非常强大的平台,因此我感到非常兴奋。
我认为网络能迅速发展的一个重要原因,是其他开发人员可以查看源代码,了解背后的逻辑并得以基于此构建。因此,我想这就是为什么这个未来具有声明性代码、HTML、CSS的巨大潜力能够让开发者来查看VR体验,看看背后的内容,然后进行复制并以不同方式修改。在网络中,CSS是受版权和专利保护的,但其他代码都是开放的。我觉得VR的挑战在于,它涉及的3D资产可能仍然隐藏在那种版权的保护中。但对于你来说,这种声明性方法的一些主要优势是什么?它可以摆脱一个黑匣子,并且能够真正看见它,但在使用CSS作为发放纹理或潜在着色器或其他方面是否有其他性能优势?
当然,如果您正在做任何文本基础或2D布局,网络在这方面做得很不错。所以这真是太棒了。在WebGL中,这几乎是不可能的,确实没有办法让DOM呈现出H1,CSS必须在WebGL中渲染出安全,但混合策略会非常可观。所以你必须想象一下,背景中是不是有一个非常多彩的WebGL 体验,像一个画家,而与运动控制器对应的UI在经典网页上来渲染。这样将大大提升工作效率。
我认为我们会发现每个部分的优劣,利用每个部分的优势,我很兴奋的是,能够让将3D模型放入网站与插入图像一样简单。想把3D模型放入你的网站,你得写一堆JS,这是非常荒唐的。如果网页要求这样做才能插入图像,网络是不会发展的。因此,我们希望最终创造出一个模型标签。我认为GLTF是一个非常好的交付格式,能够轻松将图像放入你的站点,然后随着新的CSS单位进行缩放。你知道,让你决定要多大或多小的东西的重要性。如果在几年后,你拥有一堆不仅仅是一个imperative WebGL代码的内容,而是可解析、可索引的HTML和CSS,想象一下,用户体验将会有多棒。
现在,我们考虑到个人安全与VR的用户安全性,的确如此,如果是imperative黑匣子代码,用户代理的能力相对薄弱,开发者需要承担安全保障的责任。那么,如果用户代理能够帮助他们保持安全又会怎么样呢?想象一下,如果这是HTML和CSS内容,浏览器就可以遮挡内容。实际上,如果你创建一个个人安全区域,那就意味着某个位置必须要求得到许可,才能靠近你,比如“嘿,能靠近你5英尺吗?”因此,开发者工具能够建立在这之上,因为又是可索引可解析的,打开任何网站,立即检查它的属性,理解是如何做到的并提取出部分代码。想象一下,你可以在今天很容易地将图像拖拽到桌面,而这只是在网络上才能实现的。设想在未来的VR中,也能将场景中的部分内容拉过来,近距离看,打开新的标签页。甚至完全改造该网站的内容,以符合你的可达性问题或某种使用案例,我认为这种体验的丰富前景具有很浓厚的土壤,其与本地应用和WebGL相辅相成。
你提到了安全性,这是Tony Parisi提到的一个问题。在通过链接时,我认为当您去访问某个网站并进行全屏视频时,它会提示您是否确定让其占据整个屏幕,而这每次都需要给予正向确认,这确实令人厌烦,但这确实是一项安全措施,防止某些内容占据你的浏览器。因此,当你进入VR时,也需要做同样的事情。是否允许某个内容能够占用你的浏览器,这样Chrome VR或其他原生的东西在后台进行管理、调停信任?或者在环境中,这一切都已建立,你不需要插入任何东西?在这方面又将面临怎样的安全隐患,以及你正在做什么来解决这些问题?
好的,让我描述一下我认为网络要有任何价值所需的用户体验。你应该能够戴上耳机,步入一个世界,点击一个链接,然后到另一个世界,没有任何摩擦。理想情况下,这个过程应该比Netflix视频在良好连接下开启的时间还要短,基本上相当接近。我认为这种新的用户体验既然如此好,我想这正是我想进入的世界。如果每次点击链接都需要授予许可,那就没办法,这种网络跟不上发展。如果我们在某些情况下要求进入VR的权限,但一旦进入VR,你就会默认为授予权限,允许网站自动显示它们的VR版本。因此,我们在幕后进行一些聪明的操作,为开发者创作新模式提供新机会,让他们能适当进入该模式。这一切都是在严格的门槛之内,必须在特定API进行功能开发,接着便让它们全然进入VR模式。因此,你从世界到世界,再从世界到世界。
我们还不希望一个世界有很多内容在你面前,你并不想要。想象一下,如果你在VR中有弹出窗口呈现,那将是多么可怕。如果我从用户体验的角度出发,甚至不从API角度来看,我们真的想要有一个逃生阀。一按住单个按钮,并能够快速找得到,你就可以有一个轻松逃避的动态。那个站点暂停,并不再出现在你视野里,你能摆脱掉。你正在浏览一个随机内容的网络。我想前几年,Jezebel网站遭受了来自恶作剧者的一波创意干扰,而这些家伙做的,那实在恐怖,所以我们希望能创建安全Escape阀。
身份和相关性
我提到的个体识别问题,同样也能关联到目前2D网络当中的身份问题。身份的出现通常并不必要,例如偶尔能匿名访问某些网站,而其他网站则围绕身份建立起一整套结构。我感到在虚拟体验中的身份,将会变得越来越重要。在某些情况下,你可以完全匿名,但我认为会有更多需要关注的情况。另外,我认为可能需要借助区块链技术来解决身份支付、分布式网络内容的问题,同时解决我看到的挑战,比如现有网络的基础设施,如果你想要在网络上发表内容,你必须购买服务器并支付费用,并且现在没有任何好的方式在多台计算机上分发它。我在某种程度上将WebVR作为一次机会,去矫正我们没有完全实现的Web 1.0、2.0的过程中,去探索出新一代解决方案,努力去理解什么行得通,什么行不通,进而有效地扩大出我们所想要的元宇宙。
这是非常有趣的。当我听到时,我觉得这有点像一个奇怪的比喻,可能听起来有些愚蠢,但如今的网络和社交网络的关系,就像想象一下在城市街头漫步却看不到其他人。你可以去任何地方,做任何事情,但你并不见到任何人。而要获得社交互动,唯一能得到互动的地方,就像是俱乐部。你得开门进入某个建筑,而那才是人们聚集的地方。这样的状态间接说明了当前网络与社交网络的关系,当然,你可以在网络上访问他们,但在他们之间,你完全处于孤立状态,完全不知他人是否在同一网站。
坦白说,我想这并不是一个糟糕的界面。不过,如果我们以一种开放的方式设计一种身份,那将会很有趣。所有人都在寻求身份,不过很多人一直以来都在为这个组织在提供身份部分上而建立起了许多企业。这对我而言很酷。我们在街上走着,能看到他人,任何空间都可以成为社交空间,甚至不单限于室内或封闭网络,这很有意思,想象一下在VR中,应用程序共存的抢滩一样。弗拉什的快闪团现象产生在VR中建立在一个拥有开放身份系统的基础上。或许这并不是起始的地方,只要给开发者更好的工具和更多有前途的开放去中心化工具,就会创造出巨大的价值,从而可以立即获得成功。
在这个动态中,其实已经有相关进展。虽然我并不是这个领域的专家,但Web支付API正在逐渐受到关注,这很了不起。这是一个为了使得网站能够直接从你这里进行交易无需中介的方式。另一种选择是网站直接和你做交易的能力。再次强调,我不想高估我的专业性,对于此我并不十分了解。但你开始看到的,就是能够在网络上提供支付的一种API,在没有中介的情况下,这真是很有趣。我认为我们需要找到关键的构建块,以便人们能够以不依赖App Store的方式赚钱,能让App Store变得可选,而不是必要。
我认为,现在网络面临的最大挑战之一就是没有一个可行的微交易方式,因为很多的权威性和信任寄托在这些大公司身上,这影响着我们微交易的可行性。而且投入的成本在这些交易中通常过高,以至于使得微交易实际上不值得关注。同时并没有一个顺畅的办法让人们根据浏览行为发送小费,接下来我们从信息时代转向体验时代,是否会出现一种对体验付费的伦理?进而尝试基于某种方式,比如基于比特币区块链的方式来进行金融交易,以使得这方面变得可行,而不仅仅是某种东西在网络上走红,最终导致的却是你不得不支付较高的服务器费用,来承担这种结果。
再次说明,这并不是我的专业领域,但我对此非常感兴趣。WebTorrent是个有趣的事物。最近有人写过一篇精彩报道,它展示了如何创建一个WebGL可视化银河系的空间。许多数据实际被放置在一个torrent中,并且有一个新的API是WebTorrent API,使得浏览器能够真正接入torrent,这是非常有趣的。还有一些东西叫做IPFS,这是一个基于点对点的去中心化网络层,能够在网络上运行。又有一些层次的互操作性,但它也是一个能够将文件以点对点去中心化的方式进行托管的地方。因此外面有一些非常有趣的东西在逐渐涌现,显然在Shane方面也有一些产业方面的东西正在涌现,我们可以从中窥见如何改变网络极为静态的基本公式,它已维持近30年的时间,正如TBL在89年创造出来一样。
这个领域很深,我不知道最终会发展成什么样子。但在短期内,我关注的是:我们必须确保在性能上达到一个标准。这会是一个性能baseline,我认为并不需要与本地产品对比。我真的认为,我们只需要做到“足够好”。如果性能达到了目标,网络其他的优势就会开始显露出来。一方面一个画家的例子是,完美地加载后,它的表现非常接近本地的效果。另一方面,也希望它具备极高的共享能力。因此可以发展出一些独特的URL,传到Twitter上,这种广泛的共享方式可让其迅速流行,变得开源。因此24小时之内,某人便可能做出一个颜色渐变的画刷,并进行分享。这倒是很棒,但并不能够在性能上与本地相媲美。它有许多其他的优点。我希望能够达到在这方面取得进步的用户体验。
我想,如果能击中那两点,再得到更便利的开发者工具,HTML、CSS等相关内容就会进入,当然在WebGL上也会获得更强大的工具。如果能够实现这些条件,事情就会真正加速起来。我觉得这就像一个比喻;我们在谈论VR时,经常说我们的工作并不是去担心结果,而是把一个点燃的火柴投进一个干燥的田野,让其开始焚烧。正是这条路上的网络将会加速发展,因此我希望持续去加大这些火焰,让事情变得炙热急速。接下来,我将专注于这三件事,而到2018年时,我们就能坐下来进行对话,看看我们推出了多少浏览器、取得了怎样的性能,以及建立了一些如何有趣的企业模式。
开放源代码文化的重要性
我注意到,来自游戏社区的一个显著特点就是,大家并没有什么强烈的将代码共享回GitHub的文化。而在网页开发社区中,有使用开源许可证材料和内容的理念,人们寻找方法来利用已有的东西去构建和扩展不同的材料。而这也是我最兴奋的部分,我们可以看到这样的用户体验实验,这正是你提到的Skeuomorphic的争论,即是否可以在某种程度上创造那些模仿现实的用户体验,或者说,傻傻的模仿是否会成为糟糕的互动范式?思考如何与3D沉浸式环境上的相互作用打开新境界。而我们是否可以探索、创造新的体验,而不仅仅是向旧的模型重新回溯。
我认为,游戏设计师是在创造一场盛宴。你坐下来吃一份美食,享受丰富而复杂的体验,耗费了很大的工夫,成本很高。而这也代表了游戏或电影,娱乐的存在。但独立的一粒米,看似不那么精心制作,虽然小米粒在细节中有价值,但组合在一起却展现出极大的价值。这也是当前网络和游戏之间的差距,当我与某些游戏开发者谈论网络时,就像在早期90年代,有人用CD-ROM方式看待网络的潜力。因此而比较其他店,CD-rom的机制已经形成,它们的确能够提供非常出色的体验,我也期待这两者能够并存,因为它们会是绝对的互补。
一言以蔽之,竞争的双方也应当平衡。我们在之前谈到的,网路所展示的开放性与创造性是重要的。而这样,当我们讨论垂直整合应用时,也有必要去认识到共享或开放价值带来的价值。也许你能拓展一下你的观点,来谈谈Web的横向整合和封闭整合所带来的优势。
我认为,在计算或社会的某些地方,我们都能直观理解,某一分享的解决方案对各方都非常有利。你知道,Apple不用雇用一个独立的保安公司,因为我们有一个完善的民事社会,拥有一支警察。Apple也无需再去发明电网,因为我们已经建成了一个共享的社会,在其基础之上能开创出美好的未来。您知道,CuBluetooth便是另一个例子。实际上,Bluetooth是一个非常成功的例子,但在用户体验方面,这些标准常常并未延续,反而为某些公司创造机会,搭建出更好的用户体验并向更加完美的方向发展。因此我认为,所有计算和社会均是由这种横向与纵向结合的层级所构成的,且我们能够创造价值,为用户提供更好的体验。
我希望Web能够提供更好的用户体验,一个大家能够享受的地方。与此同时,我也非常重视Web作为基础设施,作为管道所扮演的角色。正如我之前提到的,网络现在是一个商品化的工具,通过一些开源引擎,例如Electron、Crosswalk以及Chrome嵌入框架,可以直接与本地应用程序连接。这是非常重要的,因此我非常兴奋能够看到优秀的结果。实际上,我希望如果我们再过一年进行对话,能够看到开发者在开源Chromium基础上所构建出的崭新浏览器待产。构建出非常符合VR界面或表现方式的浏览器,看看能否创造出能使人完全沉浸的独特体验。而我认为基于Chromium之上的基础设施,将会受到开发者的青睐,因此能出现一些更出色的浏览器体验。
我希望它能引发广泛的创新,内容如何被消费以及如何通过用户体验所实现的变化都将成为一个丰富的素材。我想澄清这一点。你是说你正在打造的Chrome VR浏览器是基于Chromium,是开源的。所以你所做工作的某种意义上也是开放源代码吗?
是的,Oculus的Carmel基于Chromium的构建,他们可以在此基础上进行创新,并打造出我有信心看到的优秀体验。Chrome则是同样的代码库,基于平台展开,也将在Daydream上进行开发,最终会扩展到其他市场。
这是太令人兴奋的了。还有一个很酷的现象,设计师实现自己的界面,真正不需要坚持在某个糟糕的逻辑规范中,不必为工程师实现设计所付出的代价感到痛苦。因此,当设计师能够实现他们自己的用户界面时,能够让这体验得到充分的提升。
所以我们在Chrome VR中正在努力,这十分有前途。我们并不一帆风顺,但有着良好的前景,那就是在内容中创建用户体验。事实上,在我们早期的原型阶段,假如你将控制器对准按钮,按钮会发光,而这光泽是通过HTML和CSS生成的。这个发光效果只是CSS的悬停状态,任何开发者都能够轻松使用。单击后,则通过JavaScript事件处理程序生成单击,完全是原生JavaScript。然而,这能提供高性能的呈现效果,任何本地应用程序皆可做到,因为实际上它是由OpenGL呈现的。我们的最终目标是,如假如我能在这一界面上构建用户体验,那么任何人都能做到任何人都能建立他们自己的用户体验。每一位有经验的网页开发者都能去创建这种体验,因此这非常令人振奋。
我们正在进行一些与希望在该技术堆栈上创造产品的人们的对话。比如,今天你在桌面上使用的Slack就是基于Chromium构建的,实际上它是结合了Chromium的一个桌面应用程序。那是作为一种原生应用程序运行的,但它实际上是通过网络堆栈来运作的。因此,我认为更多的人将以网络为基础,想开发出可以作为应用商店推出的产品,同时在我们的开发上获得优势,这非常令人兴奋。
我想起在2000年代从事Web开发的时光,固有的打破与碎片化网络浏览器生态,以及形形色色的实现标准,Internet Explorer的横生互动都是那一段经历。显而易见,现在WebVR正逐渐聚焦围绕这一共同焦点,究竟还会形成多少不同的实现方式?但理想情况下,这应该能够建立在某种标准化之上,以求一次编写无需针对多个平台进行修改,便能将其留存下来,以确保在其他浏览器如Microsoft Edge上正常显示。
是的,这得保持一致性,进入Web时您会遇到不同的交易。这是特别要注意的,因为如果你在追求纯图形性能时,你很可能会选择使用本地应用。人们选择网络,这是因为它具有可互操作性,因为你发布在网络上的网站可以被那些在移动电话、桌面浏览器、VR浏览器上的人访问,这一点非常关键。
上周,我们在w3c举行了一次会议,这次研讨会在三星总部进行,所有浏览器厂商在场,同时包括其他主要的科技公司也都有出席,这非常令人感到激动。我们都能发现,Microsoft表示:“我们支持这个API。”Oculus说:“对,我们也很喜欢这个API。”很高兴看到Mozilla、Google和大家一起参与并表示:“我们会遵循这个标准。”你说得对,我们不希望网络在这些小的封地里碎片化,人们试图在其中插入专有技术。这将是非常糟糕的情况,直接与网络的基础价值观相背离。我认为你会看到可扩展网络能够让网络加速创新,加快尝试新事物的速度,同时在等待标准的过程中,标准组织也会制定所需新标准。网络也会从本地学习,因此在High Fidelity与Altspace等创新平台上,我们可以看到一些有趣的尝试。这些平台并不受亿万用户的约束,可以尝试很有趣的事情,实际上利益是互补的。
接下来的发展与参与
所以,WebVR将来会有什么进展,往哪个方向走,大家如何能参与呢?
好吧,Chrome VR将在明年发布,WebVR API将使得WebVR体验成为可能,并且将直接集成到Chrome的稳定版本中。不再需要实验版本。大多数人将瞬间获得WebVR API的支持。更好的工具,我提到的HTML和CSS将逐渐成为我们可以使用的工具,作为支持的3D背景,像是只用一行CSS实现360度背景。这是我们可以在实现中入手的,当然我认为Samsung已经有了一个版本在Gear VR浏览器上运行,更好的工具将不断出现。
另外,持续推动性能很重要。在这一方面,网络在3D上的表现本应突显优势,因此Web必须尽快改进在3D应用的基本能力。我们将会对此持续努力。有些浏览器也会陆续跟进,而逐渐形成广泛发展的生态。要想参与其中,网络是开放的,所以人们可以去A-Frame,A-Frame对我而言是非常亲切的。人们可以去找这样的资源,建立出自己的VR体验,当然也有来自Oculus和Facebook团队的React VR,那么也应该跟进这个想法。
我建议你去关注开源社区,挖掘一些工具,并按计划参与其中。网络非常疯狂,去中心化,有很多端点可供试探,大家可以掺杂其中开始实验。
虚拟现实的终极潜力
最后,你如何看待虚拟现实的终极潜力,以及它将实现什么?
计算的趋势是从庞大、昂贵、冷漠的状态,转向小型、负担得起且更具人性的方向。我并不认为这一趋势会减缓,而是会加速。这也不是难以推导出这一趋势将会如何演变。我认为VR以及整体沉浸式计算是其与数字与人类结合的重要奠基。它的计算更加敏感。
当我坐下来用Microsoft Word时,我并不是因为爱好Word才忐忑。实际上,我使用它是因为我试图完成一项工作。帮我完成我想要写作的工作。它做得很好,但在我写作的过程中,影响我的因素确实更多,诸如其他干扰因素、环境的分散等。如果计算能够明智地知道这些影响,同时更好地帮助我完成工作,那会非常棒。我认为VR和AR在未来将是实现这个愿望的重要一步。因此,这十年将会是一个有趣的旅程。
好吧,非常感谢你的时间。
没关系!谢谢你,朋友。
结束语
以上是Josh Carpenter的采访,他在Google Daydream团队工作,致力于WebVR,将VR引入开放网络中。我在这次采访中有一些不同的收获:
首先,Josh提到的Netflix与Blu-ray之间的比较非常关键,因为这确实很好地描述了网络的潜力。也就是说,如果我们真的认为视觉清晰度是性能的终极表现,那么我们实际上都更倾向于购买Blu-ray,相对取悦自己于高清画面的感受。然而,虽然确实如此,但是使用Netflix的Convenience低摩擦以及便宜程度,对于普通用户来说更具吸引力。而我认为这构成了网络的强大之处在于,其能够让你瞬间获得一种体验,而不需要下载、等待非常长的时间,也不必担心发现问题。或许只要在链接里,你就能跳入其中。因此,我认为这是一个重要的区别,特别是当我们进一步思考元宇宙实际将从哪里起步时。
因此,随着Daydream成为第一个WebVR支持的浏览器,我们可以期待,许多初代的VR体验都将建立在Web上,并且它们实际上不会非常复杂。我们必须记住,这些体验都将会在运行的移动设备上展现出来。在未来,我们可能有泡泡VR体验、桌面体验、房间规模VR体验,同时虽然在初期就有足够的API准备支持房间规模体验,但我认为这些最初的体验将会更类似于移动端的VR体验,因为Daydream硬件所能支持并不会有非常大的时间差。人们将会期盼这些快速加载体验,而不是坐在那里等一秒钟或两秒钟,来让一切加载完毕。
同时,它也引发了媒体查询的问题。当你访问一个网页时,它会有媒体查询,试图确定你在用什么样的设备访问,是在桌面计算机上,还是手机或平板。然后就能够动态地提供相关的内容与页面样式。将来,VR上可能会有一个类似的机制,检测你是在Daydream手机上,还是使用的是Oculus Rift或HTC VIVE,并凭借这一信息去确定你的输入控制类型,是否是简单的Daydream控制器,还是Gear VR没有控制器、又或是Oculus Rift的游戏手柄控制器或Vive的六自由度控制器。因此都可以通过这种方式动态改变体验的保真度。我相信在最开始,所有人都会把继续推向这一目标,开始进行Web VR这方面的探索,许多用户将会针对最多的移动设备体验。
Josh提到的另一个有趣的事情是,利用Chromium的开源属性,将使其他公司如Facebook与Oculus能够构建Carmel浏览器,进而产生在界面层级的创新。我想起刚刚的对话,假如浏览器不是单纯的那种屏幕,而是一个赋予了形状与人的智能化形象的人物,又将会成为怎样的灵魂指引?想象在VR环境中,设想出一个NPC角色,也许其中有AI参与,接着或许你能够与之进行某种聊天对话。同时,或许这浏览器也有能力动态查询Twitter的API,对你所提知的问题进行讨论,结合来自多个社交渠道的思考与视角,提供进一步透彻、准确的答案,从而在一个提升体验的范围内来实现探索。
同时,对于Josh所讨论的,横向标准如何深刻理解的重要性则是进一步的探讨。其从某个层面承担了创造混合用户体验所必须的低层级API,而人们通过其构建起这样一种Web VR体验,必将达到每秒90帧以上的流畅体验,并能够创造满足VR体验的基本要求。这是这些纵向与横向整合应用的良好交锋,当我们继续推向Web;正如Josh所言,这一点是值得探索的重要趋势。相信目前市场将不断富裕出新API,例如Web支付API,也许能够帮助推出微交易,实现Web支付的API也在十字路口出现。同时,WebTorrent API将帮助分配重要资产,在网上交付资产以减轻负担,因此审视前景,开放网络将会一直走向更多创新,带来前所未有的体验。
但我认为,始终存在为非开源提供应用的方式。特别是Josh提到的那种CD-ROM,与众不同的产品一定能提供课程的体验,推向很长时间前所无人知晓的,如今的特效、极具交互性的整体流畅体验,然而依然支持发展临场反应的文化。但是,与这种CD-ROM相对的,是Blu-ray的强大魅力;使用Netflix对那些观众来说是便利与性价比,反而成为蔓延的管道,不会受到边际产品的阻滞。
简要总结,我们在探索的前景上会有所不同。虽然CD-ROM所能提供的质量体验无可否认,但我认为很快就会有强大的生态抬升,来自不同体验所能推向的用户基础,将展现出在开放Web上的便捷性与低摩擦,比原生应用更具可行性。而随着Daydream的正式上线,关于开放网络在未来VR体验中的逐渐发展说明大家对这方面的关注会更集中,而逐渐形成更为丰富的体验,这也是我们的探索。
如果你想获得更多信息,可以访问webvr.info,获取到关于WebVR上线的详细信息,包括Firefox和Chrome的开发构建,这样能真正开始探索WebVR。同时还有一个公开的Slack频道,可以加入,参与对话和交流。如果你想回听我们关于WebVR的播客,追踪这个领域的发展,我认为《VR之声》中有许多内容可以供选。