A9VG电玩部落论坛

 找回密码
 注册
搜索
查看: 91496|回复: 369

[Mul] Crytek渲染师深度解析次世代_超多关于PS5的问题直面回答!

[复制链接]

精华
0
帖子
19608
威望
0 点
积分
19790 点
种子
1391 点
注册时间
2018-6-22
最后登录
2024-11-5
 楼主| 发表于 2020-4-6 11:35  ·  上海 | 显示全部楼层 |阅读模式
本帖最后由 诺基亚8800 于 2020-4-6 12:41 编辑

原文是https://vigiato.net/p/85342的最新阿拉伯文访谈,NG网友翻译成英文https://www.neogaf.com/threads/n ... 0978/post-257680235

我在此人肉翻译成中文,一些次要问题和赘述略过不翻,但是我保证翻译的部分一定忠于原文(但阿拉伯文转的英文有一定的错误不好理解也没办法),不会断章取义,不会春秋笔法,没有一句话的意思是我凭空添加的。我也不作主观划线,自己大家按各自的兴趣找重点。

以下皆为访谈翻译,不代表LZ本人观点,怼观点不要怼人(事实上普通玩家能有什么有价值的观点)

----------------------------------------------------------------------------------------------------------------------------------
INTRO

本次访谈的对象是Crytek的引擎渲染师Ali Salehi,他会作为专家回答次世代主机的问题。



以下访谈黑体为问,普通字体为答。提问者是Mohsen Vafnejad 和 Shayan Ziaei ,回答者是Ali Salehi,主题是关于PS5和XSX的硬件规格问题。

-Vijayato: 简单介绍下渲染工程师在一个游戏公司是做什么工作的?

Ali Salehi: 负责和每个游戏的视觉技术方面相关的工作。比如支持新的主机,优化现有算法,对现有问题排障,应用新技术和功能(如光线追踪)等等。

-Tflops到底重要性在哪里,是不是Tflops越高意味着主机就越强大?

Tflops显示的是在最理想的可能情况下,处理器能够达到的效率,这个数值是一个理想和理论的条件下的数字。然而在实际情况下,图像卡和主机是复杂的综合体,不同的单元必须协同工作以在不同组件之间传递输入输出,如果其中任何一个单元不能适当运作,那么其它部件的运行效率也会降低。举个好的例子就是PS3这台主机,因为PS3具备SPU,这台主机纸面上的数值比X360更强大,然而实际上,因为其复杂的结构以及内存瓶颈和其它问题,你没法达到其纸面上的峰值效率。大部分第三方跨平台游戏PS3相比360都表现孱弱,只有SONY自己的第一方工作室如顽皮狗可以发挥出更好的水平。

这就是为什么你不能太看重Tflops这个数值,除非XSX的所有部件都能在最优情况下工作并且GPU工作在其峰值模式,但是实际上这是不可能的(that's not possible in practice)。

此外,软件的差异也会导致运行效果的差别,比如Vulkan和DirectX 12,在同样的硬件上运行也会不同。这理论对主机也适用,SONY在PS5上运行其自己的操作系统,而微软将定制windows运行于XSX上。这两者是非常不同的。因为SONY已经为PS5开发的软件能够为开发者提供相比微软更多得多的能力,后者基本就是为主机照搬了DirectX PC。

-你对两台主机开发的工作体验是什么?如何评价它们?

我现在不能评价任何我自己的工作,但我会引述那些已经公开过信息的人。开发者说PS5是他们编程过的最简单主机,所以他们可以将主机性能推至峰值。从软件上说,在PS5上的编程极为容易(Extremely simple)并且具备很多功能来解放开发者的劳作。总体来说,PS5是更好的主机。

-如果我没理解错的话,Tflops难道不是优化GPU不同部分的标准吗?或者这些浮点数意味着什么?你怎么向不理解这些信息的用户描述它?

问题是公开宣布这些信息(Tflops)的人才应该来解释这个,但对普通用户来说这种技术信息没什么意义,也不是衡量的标准。

比如图形卡,假设有20个不同的部分组成,其中之一是计算单元(CU),CU执行的是处理功能。如果CU相邻的其它部分都以最佳方式运行,那么就不会产生限制,the battery does not boot(不懂),且只要处理器具备必须的信息,在此模式下的服务器可以每秒进行12次的浮点运算。所以在理想情况下,如果我们移除了所有的限制参数,这是可能的,但是现实里不是这样的。
Graphics cards, for example, have 20 different sections, one of which is Compute Units, which performs the processing. If the rest of the components are next to them in the best possible way, there are no restrictions, the battery does not boot, and as long as the processor has the necessary information, the servers in this mode can operate 12 times of floating-point operation per second. So in an ideal world where we remove all the limiting parameters, that's possible, but it's not.(这段技术有些句子不太懂,留下原文供参考)

一个好的例子就是XSX的硬件。微软将RAM分隔为两部分,这个错误在X1上他们也犯过。一部分内存带宽高而另一部分带宽低。显然,给这台主机编程就有点一言难尽,因为我们需要放进快内存的东西总数有那么多,这就有点让人烦恼了. 所以往往会有一些部件阻止图形卡达到那个标称速度。

-PS5有36 CUs, XSX有52 CUs,差别在哪里?

主要的不同点在于PS5的工作于一个远为更高的频率。这就是为什么,尽管在某些方面有差别,但这个差别不会很大。一个有趣的比喻来自于一个IGN记者,他形容XSX是一个标准的8缸引擎,而PS5类似一个涡轮增压的6缸引擎。

在PS5上提高时钟频率就我看来提供了一系列优点,因为比如内存,光栅器以及图形卡上的其它部件的运行性能和时钟相关。所以PS5 GPU的其余部分运行比XSX快,这些优点甚至会让PS5主机实际工作在高于其所宣称的10.28T之上。而对XSX来说,因为GPU的其余部分更慢,所以它也许在一般情况下运行于更低的Tflops,而仅仅在非常理想的条件下才会达到12 Tflops
这段很敏感,原文也写得不是完全清晰,我留下原文供纠错
The main difference is that the working frequency of the PlayStation 5 is much higher and they work at a higher frequency. That's why, despite the differences in some, they don't make much of a difference. An interesting example from an IGN reporter was that the Xbox Series X is very neat and tidy like an 8-cylinder engine, and the PlayStation 5 is turbocharged like a six-cylinder engine to the end. Raising the clock speed on the PlayStation 5 seems to me to have a number of good things to do, such as the memory, rasterizer, and other parts of the graphics card whose performance is related to this clock. So the rest of the PlayStation 5's GPU works faster than the X-Series. That's what makes the console work even more on the announced peak 10.28 Teraflops. But for the X-Series, because the rest of the sections are slower, it will probably work much lower on Teraflops in general, and only reach 12 Teraflops in highly ideal conditions.

-这个差异会不会到世代末期,开发者极度熟悉XSX硬件后就不产生影响了呢?

不,因为PS软件接口扩展性性一般更强,所以到世代末期SONY的主机会有更为惊艳的表现。例如在第七代主机,即使跨平台表现普遍在PS3上不佳,但神秘海域3和美国末日的表现你也看到了。我认为下一代主机也是如此。

但是如果讲到更高的原生分辨率,PS4也许会有些小麻烦,XSX可以显示更多的像素。

-Sony说数量越少,你越能整合任务,这是什么意思?

同时使用所有的CUs是有代价的。因为CU需要分配给图形卡的资源以运行代码,如果图形卡不能将所有的资源分配到所有的CU上以运行一个代码,那么可执行的CU数量将会下降。例如,对52个CU仅利用其20%,因为图形卡没有足够的资源在所有的时间支持所有的缓存。For example, instead of 52, use 20% of it because it doesn't have enough resources for all caches at all times.

觉察到这个问题后,SONY征用了一个更快而不是更大的GPU来减少制造成本。一个更突出的例子是SIP,你看AMD甚至Intel的超多核CPU不一定能工作得更好,在游戏中,4或8核但是单核频率更高的CPU往往在游戏中表现得更好。显然一个16或者32核得CPU具有更高的Tflops,但是在游戏中更少更快速得核心能做得更好。因为对开发者来说,在所有时间都利用到所有的核实在是困难的,他们更喜欢更少而更快的核心。

- XSX的CU包含3328 Shader. Shader是干什么的?3328 Shader意味着什么?

当开发者欲执行代码时,他们通过所谓的Wavefront单元进行。(下面看不懂,自己理解。。。)
When developers want to execute code, they do so through units called Wavefront. Multiply the number of shadows by the number of vipers. But it doesn't really matter, and everything I said about the CUs applies here. Again, there are limitations that make all of these shaders unusable, and having many of them all at once aren't necessarily good.

另外有一个重要的因素去考虑,就像马克塞尼所说,对不同架构来说,CU数量核Tflops的含义都不尽相同,所以你没法通过单纯比较Tflop来分辨不同系统间的优劣。所以你完全不能相信这些数字并以此为判断标准。

-安卓和苹果的比较现在被用来和主机进行类比,比如说安卓内存更多但性能却比苹果差,这个类比对主机靠谱吗?

硬件之上的软件栈决定了一切,SONY始终有更好的软件因为微软必须使用Windows,所以上述的类比是合适的。

-微软坚持XSX在任何环境下维持固定频率,但SONY采用了不同的方式,在功率定量下根据形势以可变频率使用,这两者有何区别,哪种对开发者更好?

SONY所做的更加符合逻辑,因为其根据处理负载,决定了在特定时间上是GPU频率更高还是CPU更高。例如,在一个读取页面,需要CPU而GPU基本不用。或在一个近景比如角色脸部特写,GPU为主使用而CPU贡献微小。当然从另一个角度说,XSX有一个好的散热系统可以保证维持恒定频率不会产生瓶颈这是一件好事,但是SONY这个设计提供的实用自由度绝对不可小觑。

-这个实用自由度是否会对开发者造成困难?

并不会,因为我们已经在引擎上这样工作了。例如,一些游戏使用的动态分辨率拉伸技术就在用不同的标准检测图形卡面临的压力,以及确定如何降低分辨率可以维持固定帧率,所以其实很容易将这些技术关联起来。

-PS5的Geometry Engine使用情况?

我不认为在头两年这个会很有用,我们可能在主机上的第二波游戏上看到更明显的变化,但开始不会大量使用。

-PlayStation的 SSD可以达到8-9 GB峰值速率,除了加载游戏之外,这个能力还能提供什么?

首先是移除游戏的读取画面。微软已经展示了在5-6秒内切换游戏的能力,这个时间在PS5上则将近乎于无(below zero),另外可期待的一件事是游戏菜单的变化,如果没有加载,那么你就不用看段视频等着游戏在后台加载了。

-作为一个程序猿和开发者,你认为哪个平台在开发和编程上最佳?PlayStation 5 or Xbox X series?

绝对是PS5.

作为一个程序猿,我要说PS5好得多,而且我不觉得你能找到觉得XSX表现比PS5好的程序猿(and I don't think you can find a programmer who can outperform the PlayStation 5 from the Xbox X-Series)。对XBOX来说,他们必须将Directx和windows搬上主机,这些东西历史悠久。而对于每一代SONY制造的主机来说,SONY可以随心所欲地重建软件和API,这同时符合他们和我们的利益。因为每件事只有一种做法,而他们提供的是尽可能地最好的做法。


精华
0
帖子
5077
威望
0 点
积分
5672 点
种子
1238 点
注册时间
2006-1-11
最后登录
2024-11-5
发表于 2020-4-6 11:45  ·  安徽 | 显示全部楼层
一切的一切等上市出游戏再说!

求败者

悟道者PSSR Fractured Mode

精华
0
帖子
21375
威望
0 点
积分
22955 点
种子
1597 点
注册时间
2011-1-1
最后登录
2024-11-5
发表于 2020-4-6 11:45  ·  广东 | 显示全部楼层
哈哈哈新材料来了

精华
0
帖子
1632
威望
0 点
积分
1738 点
种子
10 点
注册时间
2015-2-1
最后登录
2020-11-7
发表于 2020-4-6 11:46  ·  四川 | 显示全部楼层
本帖最后由 NaughtyHouse 于 2020-4-6 11:52 编辑

楼主解释得非常的全面了,RDNA2怎么能够吊打RDNA1呢!微软底层何能何能会比索尼牛逼呢!简直不符合常理!!!

精华
0
帖子
1994
威望
0 点
积分
2490 点
种子
80 点
注册时间
2009-12-22
最后登录
2024-11-5
发表于 2020-4-6 11:48  ·  江苏 | 显示全部楼层
Crytek渲染师 绝对是索尼员工

求败者

啊啊啊

精华
0
帖子
20082
威望
0 点
积分
20791 点
种子
883 点
注册时间
2011-9-18
最后登录
2024-11-5
发表于 2020-4-6 11:51  ·  北京 来自手机 | 显示全部楼层
已经经权威确认是rdna1.5了,然后只会超频等着烧,楼主不要挣扎,认清现实

精华
0
帖子
19608
威望
0 点
积分
19790 点
种子
1391 点
注册时间
2018-6-22
最后登录
2024-11-5
 楼主| 发表于 2020-4-6 11:54  ·  上海 | 显示全部楼层
光和影 发表于 2020-4-6 11:51
已经经权威确认是rdna1.5了,然后只会超频等着烧,楼主不要挣扎,认清现实

都说了不代表LZ观点,大家不看贴的么?

求败者

啊啊啊

精华
0
帖子
20082
威望
0 点
积分
20791 点
种子
883 点
注册时间
2011-9-18
最后登录
2024-11-5
发表于 2020-4-6 11:57  ·  北京 | 显示全部楼层
诺基亚8800 发表于 2020-4-6 11:54
都说了不代表LZ观点,大家不看贴的么?

调侃一下,翻译辛苦

精华
0
帖子
109
威望
0 点
积分
111 点
种子
12 点
注册时间
2011-7-28
最后登录
2024-11-3
发表于 2020-4-6 12:00  ·  浙江 来自手机 | 显示全部楼层
对不起,他们给的实在是太多了.jpg

精华
0
帖子
369
威望
0 点
积分
339 点
种子
12 点
注册时间
2017-6-8
最后登录
2024-1-21
发表于 2020-4-6 12:03  ·  美国 | 显示全部楼层
”When developers want to execute code, they do so through units called Wavefront. Multiply the number of shadows by the number of vipers. But it doesn't really matter, and everything I said about the CUs applies here. Again, there are limitations that make all of these shaders unusable, and having many of them all at once aren't necessarily good.“
当开发者想执行代码时候,他们通过波阵面单元进行执行。VIPERS的数量乘以阴影的数量。但是一般没那么重要,然后我前面说的CUs就应用在这。同时,有相关的限制会使所有着色器不可用,使他们没有期望的那么好
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|A9VG电玩部落 川公网安备 51019002005286号

GMT+8, 2024-11-5 16:09 , Processed in 0.246364 second(s), 22 queries , Redis On.

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

返回顶部