A9VG电玩部落论坛

 找回密码
 注册
搜索

DF专业人员:主机CPU瓶颈 降分辨率效果也很小

[复制链接]
该用户已被禁言

流放者(禁止发言)

因为这游戏难度太低所以不喜欢,因为不喜欢所以不打高难度。

精华
0
帖子
11215
威望
0 点
积分
11874 点
种子
1944 点
注册时间
2022-6-19
最后登录
2024-11-12
发表于 2024-3-10 12:39  ·  云南 | 显示全部楼层
P级1号机 发表于 2024-3-10 12:34
你真要想了解,你可以去把SIGGRAPH上最后生还者2底层优化演讲看一遍,再把其他跨平台游戏如何在Playstati ...

给个链接嘛,最好是不用翻--墙的,我这里没法科--学上网。

精华
0
帖子
1501
威望
0 点
积分
1522 点
种子
336 点
注册时间
2023-12-26
最后登录
2025-1-9
发表于 2024-3-10 12:40  ·  山东 | 显示全部楼层
021-04-12 16:28

​赞同 29​​8 条评论

​分享

​收藏​喜欢收起​



SaeruHikari

​

实践出真知

​ 关注

266 人赞同了该回答

玩家就乖乖玩游戏,喜欢光环枪车球就买 XBOX,喜欢索尼自家独占和日系游戏就买 PS5,都喜欢你就都买。

做游戏的写软件的把这些硬件玩明白的都没几个,你们玩家怎么可能争明白?性能这些问题往上层了说扯到优化做的咋样,往底层必扯到游戏机本身系统和架构。根本不是一个 GPU 核心这一丁点规模差距能左右的。我举两个例子:

同一个游戏,安卓和 ios 端即使芯片相当(就是 ps5 和 xsx 这种差了10%内)的情况下,你觉得游戏实机跑出来性能一定就相当吗?游戏机可不只有个 APU,这俩游戏机根本不止一星半点的异构架构差异,比安卓手机和苹果手机之间的差异巨大多了。头部搞开发的刚摸清楚一些,你们玩家啷个懂?

几个点:

虽然 PS5 规模确实差点,GPU 架构也是老的,但是数毛社真没那手段测浮点算力,他有 SDK?拿 SDK 搞这个,他想吃律师函?拿上世代移植游戏和 PC 对比估值罢了,基本等于“拿 psp 模拟器测 psp 性能”,根本没有什么准确性和实际价值,怎么就能确凿说它“就是真的只有9.2”呢?PS5 的 I/O 性能真的比 XBOX 强太多了,为什么总有人不信呢?真以为游戏机就是电脑,SSD 就是跟 PC 上那个一样 pcie 插根棍,走通用 NVMe 硬盘驱动就行的?4k 下面那点算力影响微乎其微,规模太大了,带宽是真瓶颈。即使有人开个万字长文解释为什么会这样,玩家能看懂什么是 wave?即使分析了这么多,性能各有优劣,对不同品类游戏在这俩机器上会有些上限差异(有些品类 XBOX 好点,有些 PS5 好点),但你顶得住渣优化或是定点优化吗?这俩完全不一套系统不一个SDK 架构细节都不一样的机器,比起这一点硬件性能差异更要命的就是软件优化。枪车球上 XBOX 卖得多,自然对 XBOX 优化会上心一点,性能就好一点。PS5 上独占游戏和日厂游戏也是同理。PS5 现在的游戏走的都是 PS4 的移植层,比起 XBOX 都走的 DX12,性能表现是明显吃亏的。这也不是为了洗白什么,只是阐述索尼游戏机的软件特点造成的一个客观事实。真的所有人看得懂这个 T 是什么单位,到底在软件里面具体有啥影响吗?

说白了闲的蛋疼才会论战这些,就像我现在半夜失眠闲着蛋疼才想抠点字解释这些东西一样。反正 SDK 保密,即使全部公开这些技术细节玩家也是看不懂,就像开发者也看不懂玩家这些怪异行为一样。

这种骂战本质就是电子斗蛐蛐,我这个巨大硬化的蛐蛐就是比你这个索之尼的蛐蛐牛逼。至于技术,管他的,傻之逼,一张嘴一梭问号一个流汗黄豆我就勇闯天涯了。玩游戏?我花这么多钱买个机器,只能玩游戏怎么行?垃圾锁狗给我等着,放学别走,我今天上班摸鱼上网必吹牛逼给你好看好吧

编辑于 2022-10-31 19:32

​赞同 266​

oz01

“ps5 的 io 性能真的比 xbox 强太多了,为什么总有人不信呢?真以为游戏机就是电脑,ssd 就是跟 pc 上那个一样 pcie 插根棍,走通用硬盘 pcie 驱动就行的?”

标准pcie4硬盘,只是要求连续读取必须超过5.5GB而已

至于啥解压缩加速芯片,pc可是有rar和7z的

2022-10-31 · IP 属地黑龙江

​回复​16



SaeruHikari

作者

关键词,NVMe 硬盘驱动,NVMe 队列填充。现在绝大部分 PC 游戏都没有装载 DirectStorage 技术,也就是说他们的理论 I/O 性能上限就是数十数百 MB/s,而且是未经过解压的 CompressedData。这也不是我说的,这可是微软说的。

2022-10-31 · IP 属地上海

​回复​20



SaeruHikari

作者

我也鉴定不来你是反串搞笑的还是敌军,游戏里撑死了连续读取几百KB,驱动队列都吃不满,不然微软也不会推 DirectStorage 了。而且 PC 只能软解压还必须走 CPU 核心的时钟时序,游戏机上面 ASIC 都是独立时钟并且时刻都是队列满载的,这根本没有可比性。

感兴趣可以去扒一下 xbox 关于 DStorage 一个 Talk,PC 上使用常规的文件操作 API,读取速度上限就是几十上百兆每秒这样,再算上解压延迟和吃掉的核心,实际性能根本就不是一个概念。

2022-10-31 · IP 属地上海

​回复​16

查看全部 15 条回复​



队友呢救一下对面



确实,而且以某些厂商PC版的优化水平,PC给18.4T都有可能不流畅。

2022-10-31 · IP 属地北京

​回复​6



SaeruHikari

作者

3080 跑 2k 都跑不明白的比比皆是,那个什么瘟什么说2,任务管理器 3D 队列都跑不到一半,浮点 CU 估计 80% 都在睡大觉。

2022-10-31 · IP 属地上海

精华
0
帖子
45
威望
0 点
积分
147 点
种子
166 点
注册时间
2023-2-11
最后登录
2023-2-11
发表于 2024-3-10 12:42  ·  广东 | 显示全部楼层
新来七只鸟 发表于 2024-03-10 12:39


给个链接嘛,最好是不用翻--墙的,我这里没法科--学上网。


没办法,你得在外面看
发自A9VG Android客户端

精华
0
帖子
1501
威望
0 点
积分
1522 点
种子
336 点
注册时间
2023-12-26
最后登录
2025-1-9
发表于 2024-3-10 12:42  ·  山东 | 显示全部楼层
2



SaeruHikari

作者

截止今年上半年,上的游戏基本都还是兼容层移植的。意思就是 ps4 游戏高清版,加点 ps5 的零碎针对优化。
也就是把机器当高性能版模拟器用,硬说 CU 占用率可能 60% 都难有,筋骨都还没活动开。

2022-10-31 · IP 属地上海

​回复


sdk没那么难拿到,这种注重性能的平台都有profile工具,各种指标一目了然

2022-11-01 · IP 属地北京

​回复​1



SaeruHikari

作者

虽然现在确实好拿狠多,XBOX 给钱就给发,但是不代表你可以拿着 SDK 为所欲为啊。接账号都要先签保密的大哥,你拿 SDK 之后在上面跑 benchmark 还乱发到网上,或者把架构细则对外暴露,都是要当被告的啊= =

2022-11-01 · IP 属地上海

​回复​3



SaeruHikari

作者

都不说 SDK 了,这两家主机的 DevKit 和 TestKit 都是禁止拍照的,大家网上能看到的图都是偷偷流出来也不敢署源头的。

2022-11-01 · IP 属地上海

​回复



oz01

“ps5 的 io 性能真的比 xbox 强太多了,为什么总有人不信呢?真以为游戏机就是电脑,ssd 就是跟 pc 上那个一样 pcie 插根棍,走通用硬盘 pcie 驱动就行的?”

标准pcie4硬盘,只是要求连续读取必须超过5.5GB而已

至于啥解压缩加速芯片,pc可是有rar和7z的

2022-10-31 · IP 属地黑龙江

​16

15 条回复



SaeruHikari

作者

我也鉴定不来你是反串搞笑的还是敌军,游戏里撑死了连续读取几百KB,驱动队列都吃不满,不然微软也不会推 DirectStorage 了。而且 PC 只能软解压还必须走 CPU 核心的时钟时序,游戏机上面 ASIC 都是独立时钟并且时刻都是队列满载的,这根本没有可比性。

感兴趣可以去扒一下 xbox 关于 DStorage 一个 Talk,PC 上使用常规的文件操作 API,读取速度上限就是几十上百兆每秒这样,再算上解压延迟和吃掉的核心,实际性能根本就不是一个概念。

2022-10-31 · IP 属地上海

​回复​16



SaeruHikari

作者

关键词,NVMe 硬盘驱动,NVMe 队列填充。现在绝大部分 PC 游戏都没有装载 DirectStorage 技术,也就是说他们的理论 I/O 性能上限就是数十数百 MB/s,而且是未经过解压的 CompressedData。这也不是我说的,这可是微软说的。

2022-10-31 · IP 属地上海

​回复​20



杨个毛

rar 和 7z 的优势是压缩率,可不是解压速度……

2022-11-01 · IP 属地北京

​回复​1



Hiteki

靠7z和RAR压缩游戏会变卡的吧。

2022-11-01 · IP 属地北京

​回复​喜欢



SaeruHikari

作者

Hiteki

一般会用 zstd,也有 oodle 之类的专有算法。但是异步解压肯定还要做的,要专门拿出一个 CPU 核心排队做这件事。
游戏机的话直接塞一个核心到芯片里面去了,队列流水线读取的时候就可以请求硬件解压。这样不需要任何 CPU 核心参与 I/O 工作,也可以帮助程序直接填满队列的同时进一步突破 SSD 的带宽限制。

2022-11-01 · IP 属地上海

​回复​喜欢



C.B

SaeruHikari

讲道理我现在开始觉得日系买ps5是刻板印象了。你要说ps4没问题,ps5我看了一圈也没啥日系独占啊。你要这么说至少也得等ff16出来吧

2022-11-01 · IP 属地北京

​回复​喜欢



SaeruHikari

作者

C.B

唉,这角度就太清奇太钻牛角尖了,实在懒得辩经了。

我意思就喜欢哪个买哪个呗,这也能搞正确啊。而且旧世代独占很多的呀,玩家没有自己游戏库的吗?我既然之前已经买了肯定继续在 PS5 玩呀。

2022-11-01 · IP 属地上海

​回复​2



C.B

SaeruHikari

讲道理其实旧时代独占也差不多无了,p5上pc,dq11s全平台,十三机兵上ns,ff7re上pc,伊苏也不用说了一直在pc。我没抬杠,只是感慨一下,因为我本来也打算买ps5(因为Sony终于把那个屎一样的ds4换掉了),但是作为日系玩家,我看了一圈也没看到什么新独占,所以感慨ps已经不再是那个日系专用机了

2022-11-01 · IP 属地北京

​回复​喜欢



SaeruHikari

作者

C.B

全平台是大趋势,sie的引擎都集体换地平线那个跨平台的了。但是发售日差异肯定还在,就这一点差异就很重要了,喜欢的人还是会做出自己选择的。

2022-11-01 · IP 属地上海

​回复​喜欢



C.B

SaeruHikari

所以我说等ff16出来再说,要说发售日差异,现在基本上都同步了,ns在日本统治地位日系游戏不可能不考虑这个平台。我的意思其实是要日系买ps已经是个刻板印象了,没必要和别人这么说,ps5现在真正优势也就在自家独占上,日系优势在ff16出来之前并不构成左右购买的因素。

2022-11-01 · IP 属地北京

​回复​喜欢



sky cannnan

SaeruHikari

问题是新一代xbox是支持DirectStorage的啊,索尼的叫法不一样但是也是一种技术思路。我看过一篇帖子,说的是两家采购的ssd的规格有所不同,索尼的ssd更加特化:降低了写速提升了读速,而微软没有这么做,这一点反应到体验上就是xbox有快速恢复功能,而ps5没有。
可能ps5会在超大规模开放世界类型游戏上有io优势,但是从目前来看还没有得到验证,因为在ue5的《山谷》《黑客帝国觉醒》Demo测试运行时硬盘io速率,最大读速要求也不超过190m/s,高于机械硬盘的速度,但是远低于xbox和ps5的ssd硬盘读速,所以ps5的超高速io可能是性能溢出了

2022-11-30 · IP 属地陕西

​回复​喜欢



sky cannnan

SaeruHikari

当然这个io测试是在4k分辨率上测试的,如果8k分辨率可能xsx真的会出现io瓶颈,但是这代的主机跑8k。。。嗯,索尼是这么宣传的,但是现在去不会真有人觉得这代主机的机能能做到吧?

2022-11-30 · IP 属地陕西

​回复​喜欢



SaeruHikari

作者

sky cannnan

不是采购规格这么简单,架构有不小差异,和 pc 天差地别。跟快速恢复也没关系,索尼没有快速恢复纯粹是因为系统本身不是 x 那样沙箱化的。
所以说没有拿到 sdk 开发过,都是纯猜测,游戏机异构的程度是非比寻常的。这个带宽不仅是硬件理论峰值更大,索尼的架构是可以帮助软件减少巨量的拷贝调度的。具体细则不能在这里说,但是大致的效果是 PS5 下的程序在理想状态下不会产生任何细碎的 MMU 映射,这个写过 vt 的程序员都知道意味着什么,爽死了好吧。
并且 VidMem 可以直接映射到磁盘的压缩资源上。注意是压缩资源,解压服务有自己的物理核心。
然后 DirectStorage 嘛就是解压上面差点,只是开放了 nvme 驱动队列,解压还是软的。写过游戏我也都知道这些又意味着什么。软解压线程的延迟,cpu 占用,带宽峰值和稳定性都逊一筹。
最后的最后我想说的是,这些东西说了这么多,都是理论峰值,x 的 gpu 也只是理论算力高了 10% 上下。
这两个机器运行的是完全不一样的系统,基本就是纯看优化。软件的性能普遍还是测试驱动的,测试则是版本驱动的。所以说白了还是看游戏在哪个平台的投入更大,而不是看这俩游戏机性能差了多少,尤其是这么接近的情况下。

2022-12-01 · IP 属地上海

​回复​喜欢



sky cannnan

SaeruHikari

按照微软公布的信息说xsx的解压和ps5一样也有硬件解压技术解压速度6g/s(至于是否是ps5那样的专用硬解模块没说,但我猜大概率不是,应该是一颗zen2核心调用direct storage直储API实现的,微软官方称只用了一颗zen2核心十分之一的算力),对比ps5的专用解压模块解压速度是8g/s。
而微软称自己的BCPack压缩算法有着不输Kraken的效率,所以最终两者io的差别还是在硬盘自身io原始吞吐上,鉴于xsx的2.4g/s对比ps5的5.5g/s确实差了一倍还多,微软为了弥补这个差距再xva架构里direct storage上又加了一个sfs采样反馈流技术只能加载纹理数据,按照微软的说法能使有效io提升2到3倍。

查过几个视频:
一个是xsx的这块sn530的顺读速度2800m/s,算是比较垃
一个是ue的官方人员称在4k分辨率下《黑客帝国觉醒》Demo的每帧数据流10m左右,现在这个demo在俩主机上只能跑不到30帧,所以算作300m/s
即便能跑4k分辨率60帧的数据流,距离xsx这块ssd德上限也有很大空间
所以这也就能说明为什么,即便是在新发售的游戏上,ps5的加载速度也体现不出优势来,即便是有也是游戏优化的问题,比如《法环》从1.16版本更新后xsx的加载速度就和ps5几乎一样了(个别游戏ps5还是有优势,比如《生化8》,但可能是因为ps5专用硬件解压模块的功劳)。

如果ps5包装盒广告宣称的:8k120帧的数据流来计算,xsx的这块显然就不够格,但是。。。

2022-12-01 · IP 属地陕西

​回复​喜欢



SaeruHikari

作者

sky cannnan

字太多实在懒得看了。不需要你猜,作为一个全平台项目实际负责引擎平台优化的工作者,我明确的告诉你,是存在速度差异的,而且并不小。这是基于实际 benchmark 的,而不是你各种道听途说这样推理得来的。
direct storage 我说过多次了,只是暴露了nvme队列而已,差距是很大的。而 ps 的异构是颠覆性的。
事不能靠推测,如果没有开发过,臆测出来的各种因为所以只能让人觉得不切实际且莫名其妙。

2022-12-05 · IP 属地上海

​回复

精华
0
帖子
45
威望
0 点
积分
147 点
种子
166 点
注册时间
2023-2-11
最后登录
2023-2-11
发表于 2024-3-10 12:43  ·  广东 | 显示全部楼层
新来七只鸟 发表于 2024-03-10 12:39


给个链接嘛,最好是不用翻--墙的,我这里没法科--学上网。


或者你可以在知乎找找陈文礼的相关文章
发自A9VG Android客户端
该用户已被禁言

流放者(禁止发言)

因为这游戏难度太低所以不喜欢,因为不喜欢所以不打高难度。

精华
0
帖子
11215
威望
0 点
积分
11874 点
种子
1944 点
注册时间
2022-6-19
最后登录
2024-11-12
发表于 2024-3-10 12:44  ·  云南 | 显示全部楼层
P级1号机 发表于 2024-3-10 12:42
没办法,你得在外面看

B站搜到了,纯英文,连熟肉都没有,没法看。
该用户已被禁言

流放者(禁止发言)

因为这游戏难度太低所以不喜欢,因为不喜欢所以不打高难度。

精华
0
帖子
11215
威望
0 点
积分
11874 点
种子
1944 点
注册时间
2022-6-19
最后登录
2024-11-12
发表于 2024-3-10 12:51  ·  云南 | 显示全部楼层
P级1号机 发表于 2024-3-10 12:43
或者你可以在知乎找找陈文礼的相关文章

你就随便两句话简单概括一下不就行了,不用说得多详细。

精华
0
帖子
45
威望
0 点
积分
147 点
种子
166 点
注册时间
2023-2-11
最后登录
2023-2-11
发表于 2024-3-10 12:51  ·  广东 | 显示全部楼层
新来七只鸟 发表于 2024-03-10 12:44


B站搜到了,纯英文,连熟肉都没有,没法看。


学习吧
发自A9VG Android客户端

精华
0
帖子
45
威望
0 点
积分
147 点
种子
166 点
注册时间
2023-2-11
最后登录
2023-2-11
发表于 2024-3-10 13:04  ·  广东 | 显示全部楼层
新来七只鸟 发表于 2024-03-10 12:51


你就随便两句话简单概括一下不就行了,不用说得多详细。



就简单截取一个PPT说一下关于蒙皮优化
正常开发者在计算蒙皮时时常会将骨骼数据读到LDS里来加速读取速度(你甚至可以认为一般第三方跨平台游戏都是这么做的),但在最后生还者2里,蒙皮的计算散落在不同的shader里,导致运行时wave不够,调度器会将不同shader的wave分配到不同的CU上,使得第一个wavefront的instruction cache miss次数提高很多。顽皮狗的优化是干脆不用LDS优化,绕个路直接从内存调度,这样反而使得蒙皮计算跑得更快。
发自A9VG Android客户端
该用户已被禁言

流放者(禁止发言)

因为这游戏难度太低所以不喜欢,因为不喜欢所以不打高难度。

精华
0
帖子
11215
威望
0 点
积分
11874 点
种子
1944 点
注册时间
2022-6-19
最后登录
2024-11-12
发表于 2024-3-10 13:09  ·  云南 | 显示全部楼层
P级1号机 发表于 2024-3-10 13:04
就简单截取一个PPT说一下关于蒙皮优化
正常开发者在计算蒙皮时时常会将骨骼数据读到LDS里来加速读取速度 ...

也就是说索尼第一方开发PS5游戏可以抄近路,其他第三方不行是这个意思不?

抄近路就省力嘛,同样的力气走路抄近路的就可以走得更远。(优化得更好),是这个意思吧。

那么问题来了,第三方为什么不能抄这个近路呢。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|A9VG电玩部落 川公网安备 51019002005286号

GMT+8, 2025-1-10 11:26 , Processed in 0.259203 second(s), 13 queries , Redis On.

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

返回顶部