A9VG电玩部落论坛

 找回密码
 注册
搜索
查看: 7928|回复: 21

[业界] 地铁Dev:RT可通过计算实现,下一代主机RT硬件内核也不是唯一方法

[复制链接]

精华
0
帖子
1140
威望
0 点
积分
1158 点
种子
42 点
注册时间
2005-3-19
最后登录
2024-3-11
 楼主| 发表于 2019-2-19 07:12  ·  吉林 | 显示全部楼层 |阅读模式



Metro Exodus于上周五发布。根据首个英国销售数据,4A Games最新的第一人称射击游戏再次成为另一款表现不俗的游戏。
4A Games再一次发布了一款技术先进的游戏,如果你拥有GeForce RTX显卡,它将同时支持PC上的NVIDIA DLSS(深度学习超级采样)和RT(光线追踪)技术。虽然DLSS在游戏中因为图像质量模糊而受到批评(尽管NVIDIA承诺会改进),但这款游戏的光线追踪是我们所见过的最好的。
Eurogamer的DF昨天发布了一份对开发商的大量采访,在采访中,他们讨论了《地铁:离去》的引擎所做的各种改进。关于光线跟踪在没有专门的光线跟踪核心硬件上可用的可能性,例如下一代主机,渲染程序员Ben Archard说,快速计算核心也是一个可行的路径。

"这真的不重要——无论是专用的硬件或有足够的计算能力来做它在着色单位,我相信这将是可行的。是的,对于当前这一代,多种解决方案是可行的。

对于过去买过GeForce GTX 1080的人来说,这张卡并不过时。所以,这些卡需要几年的时间逐步淘汰,RT才会完全成为主流,你可以假设它就是主流。显然,在当前的游戏机上,我们需要在引擎中加入体素GI解决方案以及新的光线追踪解决方案。RT是游戏的未来,所以现在的主要焦点是RT。
就RT在下一代游戏机上的可行性而言,硬件不一定非得是RTX核心。当涉及到光线追踪时,这些核心并不是唯一重要的东西。它们是固定的功能硬件,可以加速与BVH交叉测试相关的计算。这些计算可以在标准计算中完成,前提是计算机内核数量足够多且速度足够快(我们相信它们将出现在下一代主机上)。实际上,任何运行DX12的GPU都能够“运行”DXR,因为DXR只是DX12的扩展。
其他真正影响RT速度的是一个非常快的BVH生成算法,它将由核心api处理,还需有非常快的内存。RT的讨厌之处和SSAO不同,是随机访问内存。SSAO将从纹理空间的局部区域获取大量texel数据,由于这些纹理的存储方式,在内存中非常接近(或相邻)的可能性相当大。同样,下一个像素上的SSAO将使用几乎相同的样本集。因此,您必须从内存中加载更少的数据,因为您可以缓存大量数据。
处理缓存中的数据会大大加快速度。不幸的是,光线并没有这种程度的相干性。它们可以随机访问几何图形集的任何部分,下一个像素的光线可以从同样随机的位置获取数据。因此,就像专业硬件加速光线交叉点的计算一样重要,快速计算核心和内存也是实时RT的可行路径。"

当AMD透露更多关于Navi GPU架构的细节时,我们可能会对通过计算进行光线追踪的可行性有更多的了解。

https://wccftech.com/metro-dev-ray-tracing-doable-compute/

精华
0
帖子
2206
威望
0 点
积分
2058 点
种子
2 点
注册时间
2017-9-20
最后登录
2021-3-25
发表于 2019-2-19 07:22  ·  广东 | 显示全部楼层
技术革新带来下一代游戏

精华
0
帖子
47891
威望
0 点
积分
48936 点
种子
3029 点
注册时间
2008-8-21
最后登录
2024-4-25
发表于 2019-2-19 10:33  ·  江苏 | 显示全部楼层
次世代主机还是有看头的

精华
0
帖子
13351
威望
0 点
积分
14119 点
种子
1090 点
注册时间
2015-3-23
最后登录
2024-4-24
发表于 2019-2-19 11:09  ·  广东 | 显示全部楼层
快速计算核心-穷人的rt单元

精华
0
帖子
578
威望
0 点
积分
652 点
种子
44 点
注册时间
2007-1-23
最后登录
2024-4-18
发表于 2019-2-19 11:15  ·  江苏 | 显示全部楼层
有钱靠硬件,没钱靠模拟

精华
0
帖子
2609
威望
0 点
积分
2646 点
种子
5 点
注册时间
2014-4-22
最后登录
2019-12-4
发表于 2019-2-19 11:34  ·  重庆 | 显示全部楼层
然而第二个方案可行性几乎没有,特别是对于游戏主机而言。主机为了保证尽可能的GPU基础图形性能,芯片宝贵的面积都尽可能的往GPU身上放(而且AMD的GPU本身对比NV就有点惨)。这意味着CPU的内存性能注定要被阉割,L3占用的面积太大了,L3对主机CPU来说几乎没有用上的可能。
给CPU上eDRAM?好像也没有可行性,这么做消耗的成本可不是小数目,我不认为索尼和微软会为了这东西给主机生产增加这么多成本。
唯一可行的方式还是只有用RT核心,理论上可以自己开发RT核心嵌入SOC或者用MCM封装(微软在天蝎座上面对AMD的GPU做的大幅更改说明主机商有心这事情他们是可以做的)。

精华
0
帖子
5889
威望
0 点
积分
6059 点
种子
42 点
注册时间
2008-3-29
最后登录
2024-4-25
发表于 2019-2-19 11:38  ·  上海 | 显示全部楼层
本帖最后由 atiufo 于 2019-2-19 11:40 编辑

前提是你的gpu基本性能要足够强还有余力去光追,然而navi不能指望太多,毕竟末代gcn架构再加上最近R7的平庸表现

精华
0
帖子
3036
威望
0 点
积分
3153 点
种子
20 点
注册时间
2013-7-13
最后登录
2023-10-5
发表于 2019-2-19 11:38  ·  四川 | 显示全部楼层
MINIGUN 发表于 2019-2-19 11:34
然而第二个方案可行性几乎没有,特别是对于游戏主机而言。主机为了保证尽可能的GPU基础图形性能,芯片宝贵 ...

在目前的AU架构中,相比给CPU上eDRAM,单独上RT核心的成本应该更高吧。

精华
0
帖子
2609
威望
0 点
积分
2646 点
种子
5 点
注册时间
2014-4-22
最后登录
2019-12-4
发表于 2019-2-19 11:43  ·  重庆 | 显示全部楼层
逍遥蜀客 发表于 2019-2-19 11:38
在目前的AU架构中,相比给CPU上eDRAM,单独上RT核心的成本应该更高吧。

要更低,因为RT核心可以自己控制一个合理的数目,而eDRAM还要有数据控制器,所以体积方面是很难进行压缩的(唯一的好处只是开发成本低)。
而且考虑到额外占用的CPU性能,用eDRAM始终是得不偿失的。

悟道者

现代视觉文化研究会

精华
1
帖子
47377
威望
2 点
积分
48647 点
种子
1015 点
注册时间
2008-9-3
最后登录
2024-4-25
发表于 2019-2-19 11:45  ·  上海 来自手机 | 显示全部楼层
本帖最后由 zctang305 于 2019-2-19 12:06 编辑

这段话就是直接摘取的eurogamers对4A开发组成员的采访。
本来就是看的算力。老黄现在是在通用单元之外做一个针对DXR硬件加速的专用单元而已。
如果之后能开发出既经济,又能满足DXR算力要求的通用单元,那现在的专用单元就会被放弃。AMD目前想搞的就是这方面的,不过难度很大的,当然老黄也不会闲着。

看文章还要看全文
https://www.eurogamer.net/articl ... odus-tech-interview

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|A9VG电玩部落 川公网安备 51019002005286号

GMT+8, 2024-4-25 14:30 , Processed in 0.181387 second(s), 18 queries , Redis On.

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

返回顶部