/ Roadtovr / 0浏览

传统数据可视化的问题及虚拟现实如何解决这些问题

数据可视化是VR布道者经常把它列为虚拟现实可能彻底改变的领域之一。但是,究竟如何改变?现今的数据可视化有什么问题呢?本文探讨传统数据可视化的具体问题、理解抽象信息的挑战,以及VR如何准备改变一切。

嘉宾文章作者:Evan Warfel
Evan是虚拟现实数据可视化公司Kineviz的项目经理。他曾在HID Global担任数据科学家,并且毕业于加州大学伯克利分校获得认知科学学位。当他不为Kineviz工作和探索虚拟现实时,他从事人类决策过程的写作和研究。

1983年,Amos Tversky和Daniel Kahneman向大学生提出了以下问题:
琳达今年31岁,单身,直言不讳,非常聪明,主修哲学。作为学生,她对歧视和社会公正问题非常关注,还参加了反核示威活动。那么以下情况哪个更可能发生呢?

1. 琳达是小学教师?
2. 琳达在书店工作,并上瑜伽课?
3. 琳达积极参与女权运动?
4. 琳达是一名精神卫生工作者?
5. 琳达是女选民联盟的成员?
6. 琳达是一名银行出纳员?
7. 琳达是一名保险销售员?
8. 琳达是一名银行出纳员,并积极参与女权运动?

他们发现,86%的大学生认为#8(琳达是一名银行出纳员,并积极参与女权运动)比#6更可能发生。虽然很容易想象琳达既是女权主义者又是银行出纳员,但“女权主义银行出纳员”只是银行出纳员的一种,因此女权主义银行出纳员总数少于银行出纳员总数。

这个例子不仅很出名,大多数人也觉得它很令人困惑。请注意,当它可视化时,理解起来要容易得多。

什么更可能发生:琳达是一名银行出纳员还是一名女权主义银行出纳员?假设圆圈的大小与实际情况成比例。

虚拟现实有潜力让概率推理变得简单,就像这个图表让所谓的“琳达问题”变得更容易一样。

谈论数据和虚拟现实有点“鸡生蛋”问题——在不知道人们如何使用VR数据工具的情况下,很难构建一个人们将使用的VR工具套件。尽管如此,虚拟现实可以帮助人们进行:a)概率思维(如上所示)、b)高维数据可视化、、c)高信息密度,以及d)提供完全理解正在发生的背景和情境。

高维数据可视化
“图表对于好的统计分析至关重要。”——F.J.安斯康姆
如果你的数据集有两个或更少的维度,那么相应的数据通过图表或图形相对容易进行可视化。

以上是安斯康姆的著名四重奏,摘自维基百科。每个数据集的X坐标的均值是9,Y坐标的均值是7.50,X坐标的方差是11,X和Y坐标之间的相关性是0.816,在每种情况下,最佳拟合线的方程式是Y = 3 + 5x。换句话说,这四个数据集在统计上看起来是一样的,尽管它们的真实性可能通过可视化揭示。然而,我们得心应手——只使用了两个维度的数据。

如果你有三个维度的数据,你可以使用三维图。但如果你有高维数据(例如Excel电子表格中具有许多列的数据),那么你几乎没有办法进行可视化。尽管在2D中进行思考很容易,但数据集中有许多列(例如10,000列),超过三维的数据是无法进行可视化的。

另外,还有其他的方法…用来表示维度。例如,三角形可以用来表示数据的三个维度,如果你将每个维度映射到一条边的长度。如果你真的想这么做,你可以利用红蓝光谱和明暗光谱来填充三角形的中间部分,这样你就可以在一个可视化中展示五个连续的维度。比较每个三角形,你可能会发现异常或迄今为止隐藏的模式和关系。那就是理论。赫尔曼·切尔诺夫在70年代探索了这一思想的一个变种,他将数据的维度映射到卡通人脸的不同特征上。我让你通过一个《洛杉矶时报》的信息图来评判这个方法的效果:

尤金·特纳 – 洛杉矶的生活(1977年),洛杉矶时报。四个面部维度、每张脸的地理分布和社区线信息意味着你正看着六个维度的数据。

你的直觉反应会是不看好这种数据展示方法,因为它看起来很傻,模糊不清,很难解释。但我敦促你再仔细看看——你能发现城镇贫困地区和富裕地区之间有缓冲区的吗?

我认为切尔诺夫人脸没有得到更广泛的应用的一个原因是它们看起来太卡通了(看起来很傻),而科学非常严肃,画图像成卡通脸就不合适了。虽然逼真的切尔诺夫人脸解决了卡通性的问题,但也凸显了另一个问题:尽管它们看起来可能很直观,但我们对面部和真实情绪有太多的经验,无法评估任意构造的面部。

在下面的描绘中,Tim Cook的面部参数(如眉毛的弯曲程度)已经映射到了该年度苹果的各项财务数据。

来自Christo Allegra。Tim Cook面部的每个版本都代表了相应年度的苹果财务数据。Tim Cook鼻子的宽度代表苹果的债务;Cook嘴巴的张合程度代表该年度的收入;他的眼睛大小代表每股盈利等等。欲了解更多关于切尔诺夫人脸的应用,请参考丹·多林的工作。

显然,这种方法还存在一些问题。一个显著之处在于,脸的每个方面并不以同一比例传达情感信息,例如微笑。换句话说,一个脸与另一个脸之间的感知差异与实际数据之间的差异不匹配。因此,我认为这是制图和图表如此有用的一个特性。这也是为什么将Linda问题可视化后更加直观。它也是目前高维数据可视化方法所缺少的东西。

– – — – –

虚拟现实可以解决上述问题中的一些。不使用脸部,类似切尔诺夫的技术可以应用于控制中立对象的外观、运动、交互和分布。例如,以下所有表格属性都可以用来表示不同的数据维度:高度、桌面面积、颜色、腿长、桌面抛光程度,以及污渍和烧伤的类型和位置。如果你有15维数据,将这些维度转化为控制表格外观的参数可能是一个不错的选择。

每个测量值都可以用来可视化另一个数据维度。来自mycarpentry.com。

虚拟现实的优势在于它可以使你能够真正直观地理解一张比另一张高出一倍的桌子的含义,或者理解桌面上不同摩擦系数的含义。一些测试可以确保维度之间的差异具有相同的感知权重。

另外,在心理物理学和色彩感知领域,关于如何进行这种可视化的方法已经得到了彻底探索——研究人员花费了大量时间测量人们对不同种类的微小和大的差异的感知。感觉。换句话说,虚拟现实和一点心理物理学可以使理解复杂数据变得像在宜家走一走一样容易(或者是引起压力)。
在第二页继续阅读 >>

高密度图
由于数学史上的一个不幸巧合,由点和连接组成的对象集合也被称为图。
这些类型的图通常看起来像这样:

维基百科数据的力导向弹簧布局,取自维基百科。

上图中的每个点代表一个维基页面,每条线代表页面之间的连接。
图对于在抽象中看到对象或数据点之间的关系很有用,特别是当连接类型和数量很重要时。
例如,下面的图表示出酵母物种酿酒酵母的每个基因之间的每个相互作用。

左图:酵母基因的节点和边图表示。右图:重要的基因簇。图片来源。

虽然有趣,但你肯定已经注意到上面的两个图在中间区域非常繁忙。如果你探索巴拿马文件/离岸泄密数据集,图的连接也会很快变得繁忙起来。
事实上,大多数图由于中心的重叠连接数量而变得难以理解,这可能会影响了实体之间的关联性的理解,而这正是使用图的初衷。
正如你可以想象的那样,三维图可视化可以提供更多的空间:

大脑中不同连接网络的三维图可视化。图片来源。

然而,请注意这些可视化也存在繁忙问题。尽管作者们正在使用算法将连接线“捆绑”在一起,但仍然很难弄清楚到底发生了什么。然而,想象一下,如果你能够飞进每个大脑的中心,并迅速改变你所站立的大脑的大小和比例 – 数据将会更容易理解。
提供上下文
比较以下图表:

(两张图片)

这两个图表使用了相同的基础数据。左图被称为2015年最具误导性的图表之一。
我认为,尽管上面的图表(或者Quartz文章中的其他图表)是以误导人的方式展示的,但将其作为静态图像呈现也是误导的。能够探索和改变数据的大小、形状和比例可以防止数据的误导,因为环境已经融入到体验中。
另请参阅:Epic Games和威康信托基金揭晓“大数据虚拟现实挑战”20000美元大奖得主
使用虚拟现实来可视化信息的最大优势之一是,没有必要仅分享静态的虚拟现实表达;每个虚拟现实表达也自动成为一种体验。这意味着观看者可以按照自己的意愿进行探索。
虚拟现实救援
虽然虚拟现实数据工具还处于初始阶段,但以下是三个结合了我之前提到的大部分内容的示例。
CalcFlow
首先是CalcFlow,这是一个与加利福尼亚大学圣地亚哥分校数学系合作开发的用于可视化3D数学概念的工具。目前,它设置了一系列交互演示,允许人们直观地理解双重积分或Navier-Stokes方程。在每个演示中,您都可以体验到我在本文中提到的虚拟现实的优势:能够改变比例和“围绕”数据的能力意味着数据更容易理解。演示的体验性质意味着用户可以即时进行调整,并观察到它如何在多个维度上改变结果。

DeathTools
DeathTools将数据可视化从抽象的数字转化为我们以一种与数字和图表基本不同的方式理解的真实世界。体验展示了近期中东冲突的累积人员死亡数量。与其说是一张柱状图,不如说你真的站在一排排尸袋中,这些尸袋准确地代表了死亡人数。

正如”DeathTools”的创造者Ali Eslami所说:

我们知识库中缺失的一个部分是感知大数量的能力。我们很难理解和接受大规模死亡。例如,像1、2、14、20、50这样的数字是我们经常遇到的数量,因此我们能够用代表性思维模型理解它们。但是当我们遇到像1,000、10,000、20,000这样的数字时,它们变得越来越难以概念化,但我们仍然可以通过用我们在小小现实中经常遇到的大规模事物的视觉模型来理解这些数字的一般含义。

Kineviz
最后,我们在Kineviz正在开发一款VR可用的3D图形探索工具。它旨在解决有关高信息密度的问题,并使用户在数据中直观地体验到有意义的差异。你自己来看看:

VR的主要优势在于它可以让人更容易地感知数据中的差异,使数据变得更易于理解、更直观。VR还迫使数据的呈现方式成为一种体验,这意味着很难将数据的呈现方式改变以适应预先定义的故事。最后,VR可以让一个人快速改变所观察的事物的尺度,利用人的空间意识,使得否则难以想象的数据规模能够被感知。

0

  1. This post has no comment yet

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注