PS5前首席软件工程师：塞尔尼发言很棒；VRS这个话题不太好讲；有很多东西并没有公布

zctang305 · 发表于 2020-4-24 01:17 · 上海

亚里斯猫德发表于 2020-4-23 20:28
你挺的是DLSS
VRS之所以热并不是因为技术本身有多好
而是在目前的主机大战中能够被当做棋子 ...

这个和我挺不挺DLSS没有关系。有没有DLSS，VRS都是鸡肋。尤其将来还是光追的时代，VRS的作用更是微乎其微。微软公布XSX的时候说VRS如何如何云云，我就说这玩意没用。我已经给微软指了条明路，快学老黄去搞深度学习吧，你的DirectML是好看的吗？索尼也是一样的，自己没这个条件，那就赶快找个合作伙伴。收购估计是没戏的，这个圈子里有硬实力搞的，都是索尼收购不了的。
说到DLSS，任天堂搞不好下代主机就会用这玩意了，还能继续1080P战一个世代。

blackjtr · 发表于 2020-4-24 01:35 · 美国

zzkkmm 发表于 2020-4-23 19:09
GPU核心少，堆高频率对于降低游戏延迟有很大帮助，代价就是群众纷纷质疑功耗和散热能否抗住
有点类似的是 ...

并不是这样，cpu因为需要处理大量的逻辑计算，任务上有很多依赖性的问题，所以多核有时候并不能发挥优势。
gpu存粹是为了高并行，低逻辑计算而生的，规模越大越好。在这点上，跟cpu是完全反过来的。哪怕是同样的性能指标，低频高cu的实际性能大于高频低cu。

blackjtr · 发表于 2020-4-24 01:42 · 美国

el-melfes 发表于 2020-4-23 19:07
时钟频率上去不代表利用率能上去，CPU空载的情况也是很多的，GPU这边一样，而空载的时候实际功率还是会降 ...

4800h的gpu规模跟主机上的完全不能比，供电和散热都会是问题，7nm高密度库的积热现象很严重。

blackjtr · 发表于 2020-4-24 01:51 · 美国

亚里斯猫德发表于 2020-4-23 20:28
你挺的是DLSS
VRS之所以热并不是因为技术本身有多好
而是在目前的主机大战中能够被当做棋子 ...

你这是胡扯了，VRS跟阴面消除一样都是很取巧但是能实打实节省计算量的方法

亚里斯猫德 · 发表于 2020-4-24 06:07 · 浙江

blackjtr 发表于 2020-4-24 01:51
你这是胡扯了，VRS跟阴面消除一样都是很取巧但是能实打实节省计算量的方法 ...

按照gaf上的说法，VRS只是一项软件技术。RDNA2对类似VRS的功能有硬件支持。PS5不会有VRS，但是对索尼来说它对RDNA2的这块硬件可以有自己的software implementation，只不过名字不叫VRS，因此也不会是VRS。你怎么看

亚里斯猫德 · 发表于 2020-4-24 07:21 · 浙江

本帖最后由亚里斯猫德于 2020-4-24 07:29 编辑

blackjtr 发表于 2020-4-24 01:35
并不是这样，cpu因为需要处理大量的逻辑计算，任务上有很多依赖性的问题，所以多核有时候并不能发挥优势 ...

这里就是你跟塞尔尼的分歧所在了
从塞尔尼的发言以及实际设计方案来看，塞尔尼对次时代在图形表现上的定位可能比微软的设计者要保守一点——当然，由于主机有很高的定价压力，设计者需要根据他自己对未来游戏的展望来做出定位，并由此进行取舍，塞尔尼的发言里太多次提到了COST，以至于我认为他在这方面有很大的压力。用一句四平八稳的话来概括艰难的选择，那就是每个方案都有自己的长处和短处
从他的GDC发言来看，高频低CU的好处要大于低频高CU。不过他这么说是有前提的

If you just calculate teraflops you get the same number, but actually the performance is noticeably different because teraflops is defined as the computational capability of the vector ALU.

That's just one part of the GPU there are a lot of other units and those other units all run faster when the GPU frequency is higher at 33% higher frequency rasterization goes 33% faster processing the command buffer goes that much faster the 2 and other caches have that much higher bandwidth and so on.

About the only downside is that system memory is 33% further away in terms of cycles. But the large number of benefits more than counterbalanced that.

As a friend of mine says a rising tide lifts all boats.

Also it's easier to fully use 36CUs in parallel than it is to fully use 48CUs when triangles are small it's much harder to fill although CUs with useful work.

我对目前塞尔尼批评者的一个最大不满，并不是因为塞尔尼不可能错，你们说塞尔尼错了，于是你们有问题
而是在于，批评者全部是孤零零拎几个点出来批判。换句话说，在塞尔尼的两个发言里，他向我这个外行展现的是一个全景，依托这样的全景，它底下的每个部分都有着一个角色要扮演。要注意，当我为塞尔尼辩护的时候，我不是在说塞尔尼是对的。我说的是，通过塞尔尼的发言，他对每一个组件的角色定位，我都可以获得合理性说明——比如说为什么要设计可变频，为什么要用到smartshift，为什么要围绕SSD搞这么一大通设计，为什么他可以说哪怕用了smartshift，我依然可以确保CPU和GPU同时在高频运作。为什么塞尔尼说服我，并不是因为他说的一个个点很在理。因为他介绍的时候并不是用纯粹技术的语言来介绍，同时我是外行也不可能听懂纯技术的语言。而是在于他抛给我的是一幅全景图，在其中每一个他谈到的点都串起来了，这让我觉得很有意思。很多人其实没有弄清楚问题所在。对设计来说，不存在对错问题，而是一个合理性问题。因为设计的时候你需要取舍，有了取舍，那么被舍掉的一部分从它本身的角度来说，它就不是一个最优方案——比如说，按照你的逻辑，低频高cu比高频低cu方案来得好，于是塞尔尼的设计方案有问题。但这里的问题不是这样的。这里的问题是，当你从取舍的角度来切入技术设计分析的时候，那么你默认了在某些方面它就是没有按照最优的方案来处理。之所以没有最优，或者因为它被取舍掉了，或者要付出额外的代价，或者纯粹是因为设计者跟你有着不一样的方向理解，对产品覆盖的未来有着不一样的方向定位。在这个意义上，从我的角度来说，批评者如果没有一个前瞻性的以及全局性的着眼点，他很难让我这样的观众满足。是的，批评者完全可以像前面的人那样说，没有必要来说服我。但是，批评者没必要说服我，不等于我不能向批评者提要求。无非是，当大家都不让步的时候，大家都是在自说自话。批评者不满意为什么我去迷信塞尔尼。我不满意为什么批评者给不出有内容的批评。

反过来，不管是批评者也好还是游戏网站的那些介绍塞尔尼发言的编辑也好，他们的一个问题在于，他们在批评和介绍的时候，把那个全景图给拿掉了。所以，对于游戏编辑写的介绍文章来说，他们很容易出问题，比如说很多人没有办法去理解既然AMD在介绍smartshift的时候是一项在移动端上通过使CPU和GPU其中一方降频从而使得另一方获得额外性能的技术，现在到了PS5却不会必然导致两者降频。他们之所以会理解错，就是因为在介绍的时候，没有把握到塞尔尼展示出来的全景图。至于塞尔尼的批评者，他们在批判的时候自己没有提供一个相应的全景，以至于顺着他们的思路下来，塞尔尼的做法变得不可理喻。

我前面强调过很多次，我并不是不能接受错，事实上我很能接受错。不管错的是我还是塞尔尼。但是我需要的是批评者针对这里的错误有一个合理性解释。对塞尔尼来说，他在设计的时候是需要做出取舍，这就注定了他在某几个部分刻意地进行了牺牲。在这个意义上，我对批评者的要求是，批评首先要把对方在设计时的合理性思路给还原出来。正如我前面说的，数字背后是有逻辑的，设计背后是有逻辑的。哪怕公认的不成功案例，比如PS3，它背后在设计时，也是有合理性思路的。所以，在这个意义上，批评者的批判不是单纯指出他那里错了，而是要把设计时的合理性思路还原出来，然后再去指出它可能有什么问题

某种意义上，这就是我试图让批评者写长文的原因。因为不管你是谁哪怕你是顶尖业界大牛，你都无法用三言两语把整个设计逻辑讲清楚。用一句理工科人士常常说的话，你永远不可能违背物理法则。对文科来说，句子的表达能力就是文科的物理法则。你水平再强，句子携带的信息量永远是有限的，它是类似物理法则的限制。是的，你可以码一大堆字，但是没什么内容——正如一些人对我的批评，批评我总是一大堆字，但没什么东西。但反过来，你不可能字就一两句，然后把话都说清楚。你要多给出信息量，你就必须多说话。没有谁有能力有特权逃脱这一法则的束缚。

显示全部楼层 · 发表于 2020-4-24 08:34 · 未知

作为一个电脑硬件软件的外行，作为一个用着十年前的电脑的***，作为一个从来没亲手摸过独立显卡的PC硬件脑残，我觉得我们很多人都不可能比专业的工程师懂得更多。可是论坛里却有好多侃侃而谈的牛逼人物对索尼的设计说三道四。而根据就是一个：常识。动不动就“稍微有点常识”的什么什么的。我觉得吧，微软的主机貌似大部分时间的硬件性能都很强，可是这么多年，实际上怎样呢？微软硬件越强，索尼软件越给力，从这个角度来说，有了微软不是一件大好事么！喜欢哪个买哪个，全制霸又能花几个钱！

blackjtr · 发表于 2020-4-24 08:47 · 美国

本帖最后由 blackjtr 于 2020-4-24 09:12 编辑

亚里斯猫德发表于 2020-4-24 06:07
按照gaf上的说法，VRS只是一项软件技术。RDNA2对类似VRS的功能有硬件支持。PS5不会有VRS，但是对索尼来说 ...

VRS和隐面消除一样，都可以软件实现，sony可以用软件实现一个类似的然后封装到自家的图形库里，但是这样的做的代价就是损失性能和效率，那么获得的提升就不会像现在的结果了。就像1080ti也可以用gpgpu硬算光追，但是效能无法保证。
另外，谈到cu数量和频率之争，我觉得他说了废话。他所谓的33%的提升是基于未提频的而不是跟更高规格的硬件对比。
df在这之后默默做了视频，我觉得事实打了脸

最后还是那句话，我的判断基于我所学的知识而不是单纯的“逻辑“或者营销话术。我喜欢计算机的好处就在于，你给它多少资源它就能干多少活，没有什么玄学和信仰之说。

亚里斯猫德 · 发表于 2020-4-24 09:28 · 浙江

本帖最后由亚里斯猫德于 2020-4-24 09:53 编辑

blackjtr 发表于 2020-4-24 08:47
VRS和隐面消除一样，都可以软件实现，sony可以用软件实现一个类似的然后封装到自家的图形库里，但是这样 ...

所以这里的问题在于，RDNA2对类似VRS功能的硬件支持，是不是脱离微软的DX12U后就真不能用。
按照gaf上的观点，索尼是可以用的。因为VRS本质上只是软件，是一种“software implementation”。那么索尼当然可以对硬件有自己的software implementation。由于索尼它不用DX12U，那么它的技术当然不叫VRS并且也不会是VRS。发言者碰巧就是写那篇SSD文章的人

The feature was talked about to death already.
Some people just don;t listen, as always.

For everybody that pretends they are listening.

1. VRS is a software.
2. VRS is a software.
3. VRS is a part of a software DX12U API.
4. Hardware support that is needed for VRS-like functionality is there in all RDNA2-based chips.
5. PS5 won't have VRS. It will have a different software implementation of the same hardware tech.
6. What PS5 has cannot be called VRS. Because it's a different software implementation, that's not VRS.

WTF is it so hard to understand?

至于塞尔尼的发言，有一种观点认为，PS5和PS4的设计思路是一致的，也就是采用高频低CU的方案。比如塞尔尼在演讲中拿PRO设计来做比方。PRO有两种方案，48CU@0.75G vs 36CU@1G。然后他说了一通高频低CU的好处，到最后他说在某些场合中低CU比高CU更容易利用。单纯从文本分析的角度来说，其实这里存在怎么去理解塞尔尼观点的问题。塞尔尼的本意其实是，如果要实现同样的TF，那么高频低CU比低频高CU方案要来得好。

In general I like running the GPU at a higher frequency. Let me show you why.
Here's two possible configurations for a GPU roughly of the level of the PlayStation 4 Pro. This is a thought experiment don't take these configurations too seriously.
If you just calculate teraflops you get the same number, but actually the performance is noticeably different because teraflops is defined as the computational capability of the vector ALU.

所以剩下的问题是，塞尔尼的发言能不能放大，能不能放大成他是在认为通过超频能够突破方案本身（也就是你说的硬件规格）的局限。如果我们宽容地去看塞尔尼，其实他是在说，在他看来如果实现同样的TF，那么他更愿意采用高频低CU的方案，尤其是放在他的语境之下——因为他是在对比实现PRO 4.6TF的两种方案。这个时候他没有在说低规格硬件通过高频来强行跟高规格硬件平起平坐（就好比我们日常说的“超冒烟”也不会如何如何）。

某种意义上，你看到了，这其实是技术科普比较麻烦的地方。也就是如果你说少了，别人在理解你说的话的时候，会不自觉地脱离你的发言的合理范围。我鼓励对方多说话，除了话多信息量也多外，另一个原因是，你的话越多，你就越不容易被人误读

回过来谈TF。哪怕我们不去说DF是那RDNA1来类比RDNA2，我们可以直接在逻辑上指出DF实验的问题——也就是DF放大了塞尔尼的发言。但我觉得我们不是能够那么地来指责DF，一个原因是，他们是媒体，要靠吸引眼球来吃饭。另一个原因是，当DF把TF建构为同质化的数字以至于可以简单对比的时候，这样的TF模型必然会导致引发问题。

我前面说了，其实你真的跟大牛讨论，其实一点都不糟糕。因为大牛不会把你的发言放大，他会对你的观点有准确的定位，他知道你的观点在怎样的范围内成立，他不会要求你的观点要在范围外成立，他也不会因为你的观点在范围外不成立而否定你。大牛会根据你的思路，然后根据他对领域的全盘理解，来告诉你你的思路可能会有怎样的问题，是不是同样的限制条件下还有更好的思路和方案。交流之所以麻烦的一个问题在于，你的发言会不自觉地被对方放大，有的时候这是你的问题，有的时候这是对方的问题。有的时候是你表达确实没做到位，有的时候是对方没有以同情的眼光来看你。于是你也好，对方也好，不得不回过头来反复修正自己的发言。这样的交流是非常累的。某种意义上也是人与人不愿意交流的原因。

survivor77 · 发表于 2020-4-24 10:12 · 未知

本帖最后由亚里斯猫德于 2020-4-24 09:53 编辑

所以这里的问题在于，RDNA2对类似VRS功能的硬件支持，是不是脱离微软的DX12U后就真不能用。
按照gaf上的观点，索尼是可以用的。因为VRS本质上只是软件，是一种“software implementation”。那么索尼当然可以对硬件有自己的software implementation。由于索尼它不用DX12U，那么它的技术当然不叫VRS并且也不会是VRS。发言者碰巧就是写那篇SSD文章的人

至于塞尔尼的发言，有一种观点认为，PS5和PS4的设计思路是一致的，也就是采用高频低CU的方案。比如塞尔尼在演讲中拿PRO设计来做比方。PRO有两种方案，48CU@0.75G vs 36CU@1G。然后他说了一通高频低CU的好处，到最后他说在某些场合中低CU比高CU更容易利用。单纯从文本分析的角度来说，其实这里存在怎么去理解塞尔尼观点的问题。塞尔尼的本意其实是，如果要实现同样的TF，那么高频低CU比低频高CU方案要来得好。

所以剩下的问题是，塞尔尼的发言能不能放大，能不能放大成他是在认为通过超频能够突破方案本身（也就是你说的硬件规格）的局限。如果我们宽容地去看塞尔尼，其实他是在说，在他看来如果实现同样的TF，那么他更愿意采用高频低CU的方案，尤其是放在他的语境之下——因为他是在对比实现PRO 4.6TF的两种方案。这个时候他没有在说低规格硬件通过高频来强行跟高规格硬件平起平坐（就好比我们日常说的“超冒烟”也不会如何如何）。

某种意义上，你看到了，这其实是技术科普比较麻烦的地方。也就是如果你说少了，别人在理解你说的话的时候，会不自觉地脱离你的发言的合理范围。我鼓励对方多说话，除了话多信息量也多外，另一个原因是，你的话越多，你就越不容易被人误读

回过来谈TF。哪怕我们不去说DF是那RDNA1来类比RDNA2，我们可以直接在逻辑上指出DF实验的问题——也就是DF放大了塞尔尼的发言。但我觉得我们不是能够那么地来指责DF，一个原因是，他们是媒体，要靠吸引眼球来吃饭。另一个原因是，当DF把TF建构为同质化的数字以至于可以简单对比的时候，这样的TF模型必然会导致引发问题。

我前面说了，其实你真的跟大牛讨论，其实一点都不糟糕。因为大牛不会把你的发言放大，他会对你的观点有准确的定位，他知道你的观点在怎样的范围内成立，他不会要求你的观点要在范围外成立，他也不会因为你的观点在范围外不成立而否定你。大牛会根据你的思路，然后根据他对领域的全盘理解，来告诉你你的思路可能会有怎样的问题，是不是同样的限制条件下还有更好的思路和方案。交流之所以麻烦的一个问题在于，你的发言会不自觉地被对方放大，有的时候这是你的问题，有的时候这是对方的问题。有的时候是你表达确实没做到位，有的时候是对方没有以同情的眼光来看你。于是你也好，对方也好，不得不回过头来反复修正自己的发言。这样的交流是非常累的。某种意义上也是人与人不愿意交流的原因。

马克塞尼作为硬件总设计师，他的介绍是比较片段式的；他比较谨慎，只涉及了硬件特性本身，对于这些硬件新特性可能带来的软件新特性丝毫没有提及。只说了一个loading时间大幅度缩短。最能引起消费端兴趣的、就是未来游戏***现的新特性，大概要留给第一方开发者来展示了。这也符合sony内容优先的一贯风格。

		自动登录	找回密码
密码			注册

[业界] PS5前首席软件工程师：塞尔尼发言很棒；VRS这个话题不太好讲；有很多东西并没有公布