Chaos
cn
登录
产品

拓展您的创意世界

探索 Chaos 生态系统

合集

云渲染

模拟

解决方案教育
Student Rendering Challenge 了解详情
用户社区支持

访问 Chaos 帮助中心

访问帮助中心

我的账户

Chaos Help Center


联系我们

学习资料作品集
NVIDIA graphics cards inside a Lenovo Thinkstation computer
NVIDIA graphics cards inside a Lenovo Thinkstation computer

如何根据 V-RAY BENCHMARK 挑选合适的渲染硬件


阅读本文以了解V-Ray Benchmark的开发缘由,这个工具在当今CG行业中的角色,以及如何运行并分析CPU和GPU渲染基准检验。

2017年,我们决定发布一个名为V-Ray Benchmark的工具。起初想法很简单,同时这也是响应对许多用户经常问的重要问题:投资怎样的硬件才能发挥V-Ray最大效益? 

我们推出这个免费的独立的应用程序,让大家可以测试CPU和GPU渲染。然后,客户可决定是否将结果发布到Chaos Group的Benchmark效能评测网页上,并查看他们的硬件与其他人的硬件的效能比较。如果不想发布的结果——或还没有任何硬件进行测试——仍然可以在网上查看评测排名,并据此做出明智选择。

从那时起,我们对Benchmark应用程序进行更新。另外,不仅仅是V-Ray的使用者会用这个工具。许多硬件制造商和评论家也开始使用V-Ray Benchmark application,来测试应用程序或测试最新最强大的硬件。这使V-Ray Benchmark成为计算机图形和硬件行业用来测试性能的实务工具。而且,与Cinebench等其他基准检验工具不一样,V-Ray Benchmark测试使用的是人们在3D CG产业实际使用的程序。

但首先,让我们回顾一下这个工具的历史,看看V-Ray Benchmark在今日的计算机绘图产业具有怎样的地位。

V-Ray Benchmark 的历史

开发这个工具背后的初心

如同前面所述:这个工具来自于V-Ray用户的需求,客户需要真正地将V-Ray性能与其他硬件进行效能比较测试。虽然过去有一些基准场景,但必须要将场景加载到DCC应用程序中并在其中进行渲染操作。这种测试不见得可靠,由于不同的用户可能会有不同的设置 — 某些用户可能会更改参数使结果产生偏差。另外,有些用户可能尚未拥有V-Ray许可证,他们或许想在购买V-Ray之前先行测试硬件性能。

因此,我们决定制作一个独立的、不需要V-Ray许可证的应用程序,使用与本公司的商业产品同样的渲染核心——任何人都可以下载并在他们的计算机上运行。通过使其独立,我们不需要担心DCC应用程序可能使用不同的设置。然后我们删除了所有其他可能被操纵的参数,这样就可以得到一个真正一对一比较的环境。


为什么有两种测试:CPU和GPU?

在一对一比较中,唯一的例外是使用V-Ray与V-Ray GPU进行渲染。V-Ray 只运行在CPU上V-Ray GPU 可运行在GPU和/或CPU上。如你所知:V-Ray跟V-Ray GPU运作方式不同——即使两者都可CPU上运行。因此,无法对这两种硬件进行真正的比较。此外,尽管V-Ray GPU也可以利用CPU硬件,但CPU渲染器与GPU渲染器彼此之间的运行效率并没有纳入效能计算。 

因此,我们决定用两个不同的场景来做两个不同的基准检验,以确实把CPU渲染的结果和GPU渲染分开。


V-Ray Benchmark 1.0是怎样过时的

当我们在2017年第一次开发V-Ray Benchmark时,我们决定当基准达到一定的噪波阈值后,根据完成渲染的时间来测量基准的结果。当初的想法是在标准硬件上使用一到两分钟的场景。然而随着V-Ray Benchmark的流行,我们发现许多用户——以及硬件制造商——都用很强大的计算机进行效能测试,其中包括CPU和GPU。一旦大家开始在具有128颗核心(或16颗GPU的系统上进行测试,基准检验时间很快就从1或2分钟降到了20秒甚至更短。当渲染时间降到如此低时,测试的结果就变得不可靠,因为与实际的渲染时间相比,I/O(输出与输入的传输速度)开始对总体时间产生更大的影响。

此外,V-Ray Benchmark测试的原始版本是根据V-Ray 3计算的。自V-Ray Next以来,我们更新了V-Ray的核心引擎,使其更快,并利用了新的硬件特性。因此,V-Ray Benchmark 1.0 不再是测试硬件的好基准,再也不能代表 当前V-Ray的真正性能了。

什么是V-Ray Next Benchmark? 如何解读评测结果

显然,我们需要更新V-Ray Benchmark,并且采用不同的方法来测量速度:让它不随着计算机的世代升级而变得过时。因此,除了更新V-Ray引擎和其渲染的场景外,我们决定让所有的渲染运行一段固定的时间。我们的新结果测量了CPU在固定时间内发射的采样数量(ksamples)和GPU发射的光线跟踪路径数量(mpath)。这样,就可以始终如一地查看每台计算机的性能,而不必担心测试时间不够长。 

再次强调,因为V-Ray测试和V-Ray GPU测试是运行两种截然不同的渲染硬件架构,每一个测试都提交两种不同的结果——V-Ray引擎的ksamples和V-Ray GPU引擎的mpath -以确保用户不会不小心比较V-Ray结果与V-Ray GPU的结果。毕竟,这是对计算机使用每个渲染器性能的测试,而不是两种渲染引擎之间的比较测试。 

如何执行V-Ray Benchmark测试

运行测试非常简单。首先要做的是下载V-Ray Benchmark应用程序。你需要先在网站上免费注册才能下载。 

下载我们的最新版本,并运行在您的计算机上。应用程序是独立的,甚至不需要安装。

请注意,如果你安装了一个新的GPU,或一个新的GPU驱动程序,在第一次测试时会出现轻微的延迟。这是因为V-Ray GPU需要为新的硬件和/或驱动程序设定配置。

V-Ray Benchmark测试应用程序启动并运行后,您将在左侧看到两个选项。你可以运行V-Ray测试,只针对CPU测试,或者可运行V-Ray GPU,利用GPU与CPU计算。 

对于V-Ray GPU测试,您将看到可供选择测试的硬件列表。将列出系统中支持的所有GPU和CPU。可以选择一个、几个或全部。如果您想仅使用GPU测试系统,请确保取消选择列出的CPU—这是一个有用的度量方法,用于量测您的CPU加诸于GPU之上所带来的额外好处。

然后点击开始按钮,让软件进行测试。无论计算机的速度如何,每轮测试都将精确地运行壹分钟。一旦完成,就会提交结果。呈列结果。你可以添加更多关于你计算机配备的信息,并提交得分。 

若对分数不满意,或觉得其他程序干扰得分,你还是可以再次运行测试。


如何分析V-Ray Benchmark测试结果

当您上V-Ray Benchmark网站时,会注意到几件事。首先,我们有两个独立的排名。一个是“V-Ray”的排名,只在CPU上运行,另一个是“V-Ray GPU”的排名,在GPU上运行。正如我们先前提到的:CPU也可以用来做V-Ray GPU测试。稍后详细介绍……

接下来是搜索栏,您可以在其中搜索列出的任何特定硬件。例如,如你只想列出AMD超威处理器的CPU,可进行搜寻,或者如果你想查看任何使用RTX 2080 Ti显示适配器测试的结果,也可针对搜寻。

这样就可以看到特定硬件的结果。例如,如果你测试你自己的计算机,根据搜寻结果,你可以看到在相同性能范围内的其他硬件列表。

至于列表本身,结果共以四列显示。第一列是实际排名,第二列显示测试的硬件。第三列是基准分数。最后一列是运行的次数。

关于V-Ray GPU结果有一点很重要。您可能会注意到,许多结果还包括CPU对渲染时间的贡献。根据您的硬件设置,CPU将提高测试的性能。因此,两个相同的GPU设置可以有很大的性能差异,这取决于CPU的额外贡献。因此,如果您只想比较您的GPU与其他GPU,那就必须确保所比较的基准检验不包含CPU—或者至少确保两者具有类似的CPU。

这样应该就能提供您足够的信息,可根据需要筛选结果,将您的硬件与其他硬件进行比较。


一些有趣的内部测试结果

现在我们已经了解如何解读评测结果,让我们来看看Chaos Group实验室中测试的硬件,并检视V-Ray Benchmark测试得到的有趣结果。

1. 联想P920工作站

联想计算机的朋友给了我们一台联想P920工作站计算机进行测试。对于Chaos Group Labs来说,这是一台理想的计算机,因其功能强大,最重要的是,由于其流畅外型和免工具快拆的设计,使切换不同的GPU变得快速和轻松。就像赛车一样,换显卡的速度几乎和换F1赛车轮胎一样快。同时也感谢我们在NVIDIA的合作伙伴,我们可以测试NVIDIA最新GPU,如下图所示显卡插在联想P920工作站。

以上设置的配置如下:

CPU: 两颗 Xeon®Gold 6136 @ 3.00 GHZ, 24核(48个线程)。

GPU: 两张Quadro RTX 8000, 48Gb GPU内存,NVLINK + Quadro P4000, 8Gb GPU内存(主要用于显示)。


首先,让我们看看CPU测试:


结果得到超过32,000 ksamples,与其他同类CPU达到相同水平。然而,当你看到列表的时候,你会发现32核的AMD Threadripper 2990WX并没有那么落后。

由于我们有很多不同的GPU配置,我们决定以多种不同的方式运行测试,如下:


两张 Quadro RTX 8000s —


首先,请谨记,当进入V-Ray Benchmark测试页面时,请限制仅列出GPU的GPU列表中寻找结果。如果您看到列出的CPU,这意味着结果包含CPU运算的混合模式。 

但是,回到我们的结果:如果你正在寻找一个快速的GPU设置与尽可能多的GPU内存,这会是最佳选择。测试结果为738 mpaths,与其他RTX 8000s和6000s达到相同水平。这样的结果说得通,因为这两张卡之间唯一的区别是GPU内存,而非速度。值得注意的是,两张GeForce RTX2080s卡可以使用几种不同配置,得分却基本相同。 

基于性价比,RTX2080是不错的选择。然而,这些测试也包含混合模式的CPU。有个测试非常接近我们的评分,也就是三张GeForce RTX 2080s。但请记住,尽管Quadro RTX 8000比GeForce卡昂贵得多,但它的GPU内存是后者的四倍。因此,虽然渲染时间可能是相同的,Quadro RTX 8000可以渲染更大的场景。


两张 Quadro RTX 8000s + Quadro P4000 —


因为我们有一张P4000显示适配器在同一个盒子里,不算慢,让我们继续插进去,看看它对评分有多大的帮助。 

这张卡最终提高了性能142 mpaths,这是一个不错的小提升。但请记住,P4000只有8 Gb的GPU内存,是非共享的内存。因此,如果你的整个场景内存需求超过那张卡,将渲染失败。从设计,V-Ray Benchmark测试对GPU内存的要求不高,因此P4000的内存还是足以拿来测试。


两张 Quadro RTX 8000s + Quadro P4000 + 两颗 Xeon ® Gold 6136 @ 3.00 GHZ —


到目前为止,让我们充分利用计算机的力量,看看我们的CPU可以帮助提高多少我们的V-Ray GPU渲染性能。 

结果证明,通过添加CPU,我们获得了额外的166个mpath的性能,这是对性能的另一个很好的提升。然而,CPU并没有与P4000相同的RAM限制,因为CPU会取用系统RAM,而当前系统内存是192Gb。

现在让我们看看另一个系统。

2. Razer Blade Studio Edition 雷蛇灵刃工作室版笔记本

由于我们与英伟达的紧密合作,NVIDIA好心好地让我们试用了新一代的笔记本电脑,这款“Studio”系列。Razer系列原本以其灵活和快速的游戏笔记本电脑而闻名,现在决定进入专业的主力笔记本电脑市场。这款新的笔记本电脑非常特别,除了功能非常强大外,还相当扎实——相对较轻,只有2.21公斤。即使这么小的尺寸,仍然威力强大。最重要的是,我们决定拿到Razer eGPU外接式显示适配器,并添加另一个全尺寸的GPU混合运算,只是为了好玩。


配置如下:

CPU: Intel®Core(™)i7-9750H @2.60 GHZ, 6核(12个线程)

GPU:Quadro RTX 5000 Max-Q设计,16Gb GPU内存

eGPU: 配备24Gb GPU内存的Quadro RTX 6000


首先,让我们单独看看CPU在标准的V-Ray测试。结果是大约6,900 ksamples,这对于笔记本电脑的CPU来说分数非常高。




接下来,让我们尝试不同的GPU配置:


Quadro RTX 5000 采用Max-Q 设计 —




这次我们得到了大约159 mpath的结果。对于拥有这么小的GPU,塞到一个不到2.27公斤的笔记本电脑来说,这个结果相当惊人。


Quadro RTX 5000 采用 Max-Q设计 + Quadro RTX 6000塞在 eGPU当中 —




显然,由于这是一个全尺寸的,顶级的GPU威力强大,我们预期其速度大幅提升。加上它给我们带来了366个mpaths,几乎是这款笔电GPU的三倍。当需要的时候可以外接这个强大的运算硬件真的很棒。


Quadro RTX 5000采用 Max-Q设计 + Quadro RTX 6000塞在 eGPU当中+ Intel ® Core (™) i7-9750H @2.60 GHZ —




在这种梦幻配置下,我们可以真正看到硬件的极限,但是当CPU只给我们36个mpaths时,请记住这是笔电上的CPU,所以能做的就只有这么多了。当然,这是当笔电外接电源、电池没有耗尽的情况下才能达到;使用笔电的电池供电通常会让CPU减速。

尽管如此,这新一代的移动工作室笔记本电脑不仅在大小合适,还可以超越许多几年前中等水平的桌机计算机。

3. GPU巨兽(或旧的、重新配置的VCA视觉运算装置)

当我们在内部测试许多不同的硬件时,我们有时会有一些旧的硬件。这包括一个旧的VCA,我们当初拿它来制作《CONSTRUCT》短片。NVIDIA很好心地寄给我们八张Quadro RTX 8000s显示适配器,我们把这些显卡装进这个怪物般的视觉运算装置盒子里。 

配置如下:

CPU: 2 x Intel Xeon E3-12xx at 3.7 GHZ 8 cores (16 threads)

GPU: 8 x Quadro RTX 8000 with 48 GB


首先,让我们进行CPU测试。请记住,虽然这些CPU在当时非常强大和昂贵,但这2012年代的,因此相当过时。尽管如此,他们还是成功地得出10613 ksamples的成绩,这还算不错,但与我们新的移动笔记本电脑的CPU相比,仍然只快了60%左右。



但我们真正想要看到的测试是这8张顶级GPU的表现如何。




这里,得到的结果高达2779 mpaths。这是很高的GPU分数!有趣的是,如果除以8,就得到347。然后,如果你使用两颗相同的GPU从P920中得到结果并除以二,你得到369——考虑到这两台计算机的巨大差异,数值已经非常接近了。这意味着V-Ray和这些GPU的比例是线性的,我们很高兴看到这点。

另外,当我们决定添加2012年的旧CPU时,发生了一件有趣的事情:


得分实际上下降了140分,而不是增加一点点。通常,V-Ray是线性扩展的,也就是说,你添加的计算机能运算力越大,V-Ray运行的速度就越快。8核比1核快8倍,4颗 GPU比1 颗GPU快4倍。 

然而,在这种情况下,虽然我们在技术上增加了CPU的计算能力,但这颗CPU是更旧的CPU,与新CPU相比速度要慢得多。V-Ray GPU的处理器平衡被调到更高的CPU / GPU速度比,所以当我们使用全新的GPU配上8年前的CPU时,已经超出了其调优的范围。 


V-Ray Benchmark 真的有帮助

V-Ray Benchmark的测试结果可以有很多不同的解读方式。实际上,在运行测试之前,通过查看基准检验页面上的结果可做很多事。使用过滤搜寻来显示您想要查看的硬件,查看不同的速度范围,比较不同类型的GPU…等等。

尽管最新版本的V-Ray Benchmark测试确实帮助了许多用户、评论网站和硬件制造商,我们仍将持续改进,随着V-Ray增加新的功能,我们也将利用这些新功能。请持续关注!


准备好进行测试了吗?免费下载V-Ray Benchmark


点此阅读V-Ray Benchmark 帮助文档。 


IMG_h96auu.jpg
About the author

Christopher Nichols

Chris is a CG industry veteran and Director of Chaos Labs. He can also be heard regularly as the host of the CG Garage podcast which attracts 20,000 weekly listeners. With a background in both VFX and Design, Chris has worked for Gensler, Digital Domain, Imageworks and Method Studios. His credits include Maleficent, Oblivion and Tron: Legacy.

Originally published: February 20, 2020.
ChaosEnscape
© 2022 Chaos Software 保留一切权利

Your shopping cart

There are no items in your cart.

Continue shopping
MasterCard
Visa
AmEx
JCB
Discover
PayPal