A9VG电玩部落论坛

 找回密码
 注册
搜索
楼主: o_sharp

[硬件周边] 主机游戏技术普及。第一期完结

[复制链接]

精华
0
帖子
441
威望
0 点
积分
727 点
种子
35 点
注册时间
2010-11-16
最后登录
2019-7-23
发表于 2013-8-14 16:17  ·  上海 | 显示全部楼层
对显卡这方面不是很了解,问lz一个问题。显卡有指令集么?
如果有指令集这个指令集大概是什么样子?
显卡的驱动模型大概是怎么个样子?cpu是如何把要计算的东西传给显卡的?

精华
0
帖子
692
威望
0 点
积分
876 点
种子
14 点
注册时间
2010-12-1
最后登录
2024-11-12
发表于 2013-8-14 16:47  ·  甘肃 | 显示全部楼层
技术普及贴非常好

于是想问下lz对VITA的硬件如何看待的?
如果按照目前的硬件,画面效果能达到ps3的水准还是以后能出现超越ps3的画面的游戏?
现在的程序已经发挥vita多少性能了呢?
现在的vita cpu或者gpu频率真的被索尼锁定低频有限制么?

谢谢

精华
0
帖子
194
威望
0 点
积分
211 点
种子
5 点
注册时间
2009-12-29
最后登录
2024-6-6
发表于 2013-8-14 17:29  ·  浙江 | 显示全部楼层
本帖最后由 kdzx1121 于 2013-8-14 17:31 编辑
o_sharp 发表于 2013-8-14 15:03
可能有几个原因。

首先,你要完全排除cpu的原因。


cpu原因可以完全排除的,因为我用的是vbo生成的面片,面片的增加量完全是gpu运算量和显存容量,cpu唯一的工作只是调用vbo句柄而已,cpu增加的运算量几乎为0,cpu和内存我都是监视的,该程序的cpu占用率并没有上升,内存占用量也没变大。而我上面提到的帧数都是稳定时的帧率,并没有浮动。

我看了下你提供老外链接,按老外的说法,真37 用这种30-60帧之间浮动的表现方式略蛋,老外说宁可帧数锁30帧然后把多出来的性能提升画面效果。不过老外的“It's fair to say that we're not particularly fond of double-buffered v-sync with an unlocked frame-rate” 这句话感觉确实隐喻了这个情况是 双缓冲+垂直同步 造成的。

另外再看了些老外的其他论坛,大部分都表示 双缓冲+垂直同步 会使得游戏只在30,60之间跳转,但是也有不少人表示开了垂直同步帧数固定在40-50的情况,毕竟我自己试验的情况也是有40-50的情况,所以也没法完全赞同。

最后问下,按你说的gpu瓶颈时,帧率只会是60/n, 但是cpu瓶颈确不会,这就有些矛盾了, 按一般的机制,cpu完成数据准备,gpu才会开始渲染那些数据,反过来,gpu若是没有完成渲染,cpu也不会开始准备下一帧的数据,这样一来,那么就算是cpu瓶颈一样会是60/n的情况,你说的30-50是怎么得出来的,你指定cpu draw call是怎么样的机制?

精华
0
帖子
2900
威望
0 点
积分
3299 点
种子
19 点
注册时间
2006-5-13
最后登录
2024-5-14
发表于 2013-8-14 17:31  ·  河北 | 显示全部楼层
支持楼主,不知道楼主要做几期?

精华
0
帖子
4640
威望
1 点
积分
5284 点
种子
532 点
注册时间
2008-9-25
最后登录
2023-8-23
 楼主| 发表于 2013-8-14 18:26  ·  新加坡 | 显示全部楼层
kdzx1121 发表于 2013-8-14 17:29
cpu原因可以完全排除的,因为我用的是vbo生成的面片,面片的增加量完全是gpu运算量和显存容量,cpu唯一 ...

我觉得我们之间有沟通问题。我现在把我的想法用最简单的方法说出来。

首先,V-sync+double buffering当然可能出现40的帧数,但是时间很短,不可能稳定。只有在非常苛刻的条件下才会稳定40帧,仅仅为理论上的可能。

然后,根据老外测算的数据,356的帧数会在极少数情况下出现40帧,所以不可能是你说的引擎来限制成30帧或者60帧。

我正文里的表述有点绝对,我今天会改一下。但是我的意思是对的。

精华
0
帖子
5420
威望
0 点
积分
6543 点
种子
1104 点
注册时间
2011-5-19
最后登录
2024-11-15
发表于 2013-8-14 18:40  ·  陕西 | 显示全部楼层
签到啦                    

精华
0
帖子
4640
威望
1 点
积分
5284 点
种子
532 点
注册时间
2008-9-25
最后登录
2023-8-23
 楼主| 发表于 2013-8-14 18:45  ·  新加坡 | 显示全部楼层
本帖最后由 o_sharp 于 2013-8-14 19:17 编辑
kdzx1121 发表于 2013-8-14 17:29
cpu原因可以完全排除的,因为我用的是vbo生成的面片,面片的增加量完全是gpu运算量和显存容量,cpu唯一 ...


针对cpu bound的情况,为什么我说是30-50呢?考虑两个极端,就是gpu任务非常繁重和gpu非常空闲两种情况。边界值是30和50。中间任何情况都有可能。

以最常见的方式来说,cpu issue commands与实际的运算是并行的,我们可以大致理解为运算和显示之间没有同步。这也是最容易理解的一种情况。

以上在实际测算中也可以证明。

虽然我们的思考方式有很大的差异,但还是很感谢你。希望你以后也多多的质疑,指出问题~

征服者

埃尔达精灵

精华
0
帖子
7365
威望
0 点
积分
7711 点
种子
12 点
注册时间
2007-5-10
最后登录
2024-11-10
发表于 2013-8-14 18:45  ·  北京 | 显示全部楼层
为什么这帖子看着这么费劲?图片这么难读

求败者

PSN/XLIVE:aamatrixboy

精华
0
帖子
22173
威望
1 点
积分
23143 点
种子
512 点
注册时间
2010-10-15
最后登录
2024-11-14
发表于 2013-8-14 19:14  ·  北京 | 显示全部楼层
1000L的目标快了~~~~~~~~~~~~~~~打卡

精华
0
帖子
194
威望
0 点
积分
211 点
种子
5 点
注册时间
2009-12-29
最后登录
2024-6-6
发表于 2013-8-14 19:23  ·  浙江 | 显示全部楼层
本帖最后由 kdzx1121 于 2013-8-14 19:24 编辑
o_sharp 发表于 2013-8-14 18:45
针对cpu bound的情况,为什么我说是30-50呢?考虑两个极端,就是gpu任务非常繁重和gpu非常空闲两种情况。 ...


如果机制是cpu issue commands与实际的运算是并行的话,那确实就是你说的那样了,会是30-50这种结果了,不过也有一些机制是串行的,这样就是另一个结果了。
另外,我的那个程序是稳定在40帧的,而且如何减少面片都不会超过60帧,所以垂直同步是肯定锁了的,用了双缓冲这也是肯定的。但是看了很多老外说的,双缓冲+垂直同步 确实会造成不足60直降30,这点我也比较疑惑。

对我来说啊,只有和别人多交流才能了解自己的不足和浅薄,所以碰我问题我就会直接问,若是您能耐心的解答我的各种疑问我会非常感激。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|A9VG电玩部落 川公网安备 51019002005286号

GMT+8, 2024-11-15 12:49 , Processed in 0.190960 second(s), 17 queries , Redis On.

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

返回顶部