虽然在支持VR的GPU上进行基本基准测试以了解性能情况已经是可能的,但NVIDIA的新FCAT VR工具允许对从任何GPU上的任何VR应用中捕获到的运行时数据进行详细记录和分析。我们使用最新的VR准备GPU来测试这个工具,看看我们能发现什么。
查看也有关NVIDIA GTX 1080Ti与1080 VR性能比较的评论: 抗锯齿对决
虽然FCAT VR工具由NVIDIA开发,但该公司坚称它是耳机和GPU无关的,仅用于捕获数据。工具本身不包含基准测试;据该公司称,该工具直接从VR运行时中记录信息。对于每帧来说,FCAT VR可以读取耳机上是否显示了适当渲染的帧,是否丢失了帧,或者该帧是通过异步空间变形合成生成的,以及更多其他信息。这使我们能够挖掘并比较真实的渲染性能,有效地消除了异步重投影和前面提到的异步空间变形等技巧所隐藏的小瑕疵。
对于我们最初的FCAT VR基准测试运行,我们从以下VR准备的GPU中收集了数据:
NVIDIA GTX 1080 Ti
NVIDIA GTX 1080
NVIDIA GTX 1070
NVIDIA GTX 1060
AMD RX 480
基准测试注意事项
对于每个GPU,我们使用FCAT VR在最高和最低设置下使用《污垢竞速(Dirt Rally)》(2016年)和《机器人召唤(Robo Recall)》(2017年)来捕获性能数据。因为Oculus运行时会动态(而且不可预测地)启用ASW,所以我们在所有测试中都禁用了它,以确保可比较的结果。一般来说,如果启用了该功能,则会通过合成生成的ASW帧填充连续出现的丢帧,因此关闭该功能时捕获的数据基本上是一样的,但通过头显看到的画面会有所不同,因为你常常会看到一帧合成的ASW而不是丢帧。
所有测试都是在单个系统上使用Oculus Rift头显执行的,其规格如下:
主板:ASUS Rampage V Extreme X99
内存:Corsair Dominator 4x8GB DDR4 2666MHz
CPU:Intel Core i7-5960X
操作系统:Windows 10 x64 TH2
GPU驱动程序:截至2017年3月14日的最新公共驱动程序
可变捕获
因为VR涉及大量的环顾和自由交互,测试单个静态场景并不是收集性能分析数据的好方法。在每次游戏运行和捕获过程中,我们努力采用相似的行为,但始终会存在一定程度的变异性。因此,分析趋势而不是单个数据点是理解数据的最佳方法。
如何阅读结果
除了图表中显示的数据外,您还会找到一张列出“已交付帧率”的表格,它是基于完全渲染到头显的帧的平均帧率。这是衡量给定GPU性能的一个良好整体指标,也是一个有用的比较点。
《污垢竞速(Dirt Rally)》
超高设置 – GTX 1060, 1070, 1080和1080 Ti
在超高设置下运行《污垢竞速》时,我们可以看到除了1080 Ti外,其他GPU在保持一致性性能方面都有困难,出现了丢帧。尽管1070和1080的帧计时相对较接近,但1060和1080 Ti在性能光谱的低端和高端上明显与它们有较大的差距。
低设置 – GTX 1060, 1070, 1080和1080 Ti
在最低设置下,卡之间的帧计时差异要小得多。所有卡都保持了一致的性能,帧渲染时间低于11毫秒。在帧计时的后半段,我们可以看到一个有趣的时刻,导致1060的表现比数据捕获的前半段更差,而其他卡则比数据捕获的前半段表现更好。
超高设置 – GTX 1060 vs. RX 480
在超高设置下,GTX 1060和RX 480都很难保持性能,帧计时远高于20毫秒。虽然这两张卡的性能接近,但RX 480的帧计时在一个帧计时到下一个帧计时之间的方差明显较大。
低设置 – GTX 1060 vs. RX 480
在最低设置下,两张卡都保持了强大的性能,帧计时低。在11毫秒以下的时间内,性能表现良好。尽管GTX 1060在测试的前半部分略有优势,但由于某种原因导致性能下降,而RX 480则相反,似乎使GTX 1060在这里脱颖而出,因为(在上述测试中)1070、1080和1080 Ti的表现更像是RX 480,稍微增加了这个测试部分的性能。
机器人召回
超高 – GTX 1060、1070、1080 和 1080 Ti
在超高设定下,机器人召回挑战了所有的显卡。即使是 1080 Ti,也需要降低设置以避免持续帧数下降以换取异步空间扭曲技术。与上述“尘埃拉力赛”超高设定相似,从 1060 到 1070,有明显的跃升,而 1070、1080 和 1080 Ti 之间的性能差别则更为平均。
低 – GTX 1060、1070、1080 和 1080 Ti
在低设定下,四张显卡都能保持一致的帧率,但偶尔会出现帧数下降的情况,导致帧时出现波动,尽管大部分帧时都在9毫秒以下。
超高 – GTX 1060 vs. RX 480
在超高设定下,无论是 GTX 1060 还是 RX 480 都难以以可玩的帧率推动机器人召回,大部分帧需要超过40毫秒才能渲染完成,导致连续丢帧三次,然后才能渲染新的帧。
低 – GTX 1060 vs. RX 480
在低设定下,无论是 GTX 1060 还是 RX 480 都相对较好地处理了机器人召回,大部分帧时都在10毫秒以下。而偶尔的丢帧结果,GTX 1060 的略多一些。
– – – – – – – – – – – –
我们希望这个分析对那些希望了解最新 VR Ready 显卡的性能比较有所帮助,还有很多其他内容可以研究,包括基准测试更多显卡、异步空间扭曲技术的影响、Oculus 和 SteamVR 运行时之间的渲染差异、专门的 VR 渲染技术(如 VRWorks)以及当然还有许多其他游戏。您想要看到下一个哪方面的分析?
声明:NVIDIA 提供了硬件供 Road to VR 收集数据用于本文。
0