A9VG电玩部落论坛

 找回密码
 注册
搜索
查看: 46595|回复: 201

[业界] 浮点运算PS4级别,PowerVR 7GPU架构深度解析:明年iOS设备可能搭载

[复制链接]

精华
0
帖子
988
威望
0 点
积分
1061 点
种子
5 点
注册时间
2004-5-3
最后登录
2014-11-17
 楼主| 发表于 2014-11-13 00:51  ·  日本 | 显示全部楼层 |阅读模式
本帖最后由 huntx 于 2014-11-13 10:00 编辑

PowerVR 7架构解析
本质上来说,PowerVR 7的架构还是“Rogue”,已经引入两年。该架构有着先进的着色器流水线体系,没什么明显缺点,短期内还无需彻底翻新,只要局部增强、完善就可以提升效率和性能了,包括强化指令集。

image.jpg image.jpg image.jpg image.jpg
当然,它还需要不断加入新的功能特性,尤其是新的API。OpenGL ES 3.1早就支持了,但是苹果的Metal来势汹汹,作为回击的Google Android Extension Pack现在是不能少的,还加入了可选项Direct3D 11.1(通俗地说就是DX11.1)。
但是注意7XT上这两个都是标配,7XE上的AEP只是可选项,Direct3D则只到10.0。
这次唯一增加的新模块就是“曲面细分协处理器”(Tessellation Co-Processor),可配合顶点数据管理器(Vertex Data Master)实现完整的曲面细分支持,但注意为了节省功耗,它是个固定功能单元,不可编程。
曲面细分、ATSC纹理压缩、几何着色、纹理着色,这些就是支持AEP的基础。
其他模块没有大变但都有所增强,比如说顶点数据管理器(几何前端)的几何性能翻了一番,计算数据管理器(Compute Data Master)则提速了最多三倍,尤其适合处理大量的小内核。
粗纹理调度器(Coarse Grain Scheduler)降低了内部区块关联性,可以更快地向空闲核心(着色器簇/USC)发送指令,而不必等待其他核心完成工作。
USC核心本身变动很小,FP16/FP32 ALU、浮点单元都没变,但是特殊功能单元(SFU)有了两处明显变化。首先也是最重要的,SFU可以原生处理FP16、FP32操作了(上代会全部推给FP32),因此在处理FP16数据集的时候不必进行无谓的高精度操作,自然能节省功耗,而且因为SFU本身已经很大了,原生FP16带来的功耗节约会很明显。
另外虽未明说,但极有可能FP16、FP32 SFU单元已经分离成了独立的两个(架构图显示一个),当然即便如此它们也不能同时使用。
第二个增强是SFU操作可以和ALU操作并发了,也就意味着两个单元可以同时工作。Imagination表示,SFU代码比预期得来得更快,因此并发会大大提高性能,为此指令集也做了相应的扩展。
此外,PowerVR 7系列还可选支持FP64操作,按照设计每核心有一个FP64 ALU。
最后是个非图形功能,硬件加密区,使用虚拟化技术创建最多8个区域,彼此完全隔离,可进行不同的安全操作,并与CPU、GPU互联。7XT会标配它,7XE上则是可选。
CPU上早就有了类似的功能,GPU上则一直是软件模拟,效率低下,而且安全性不足。
7XT/7XE:高低双雄细节探究
7XT是高端型号,但也有很多技术特性是可选的。FP64操作、OpenCL 1.2 Full Profile是面向高性能计算用途的(默认仅支持FP32、OpenCL 1.2 Embedded Profile),Direct3D 11则适合Windows Phone、Windows RT平台设备(默认是Direct3D 10),但是曲面细分已经是标配。
通过灵活配置这些特性,SoC厂商可以精确满足自己和客户的需要,同时更好地控制面积和功耗。
其实相比于性能,能效才是7XT系列提升的重点。Imagination没有给出任何具体数据(提升了百分之多少),只是说7XT可以更低的功耗提供与6XT持平的性能,同时给了一张幻灯片,号称自己有着全球最高的GPU能效。
证据就是自己的PowerVR长时间运行也几乎不会降频,竞争对手的则会降低40-60%。
当然了,这能否实现还得看SoC厂商的设计,Imagination只能提供最基本的建议。人家非要把CPU、GPU频率弄得很高,跑着跑着就会过热降频,你也没辙。
7XT系列的核心可选2-16个,比上代最多翻了一番,具体型号分别是:双核心GT7200、四核心GT7400、六核心GT7600、八核心GT7800、十六核心GT7900。
很有意思的命名吧?Imagination甚至说GT7900的性能已经可以超越入门级笔记本独显GeForce GT730M。GT7400/GT7600则是上代主机Xbox 360、PS3的水平。
用途方面,2-4个核心的适合手机,6-8个可用于平板机、汽车、超极本,16个的只有笔记本、机顶盒、游戏机、服务器才敢用——512个FP32 ALU单元差不多可以媲美入门级桌面独立显卡了。
目前的6XT系列里,iPhone 6用到的GX6450是四个核心,iPad Air 2里的特殊定制版GXA6850旗舰型号八个核心。
7XE定位于入门级,规格、成本都很低,并且更强调面积上的效率,而不是功耗。
7XE其实也有着7XT相同的架构改进,可以支持7XT的几乎所有技术,但绝大部分都是可选项,包括DirectX 11、曲面细分(AEP自然也是可选了)、纹理压缩、HEVC/H.265解码、10-bit YUV色彩输出、虚拟化安全。OpenCL 1.2 FP都直接不可选。
7XE有两个版本,一个核心的GE7800面向低端手机和电视,半个核心的GE7400则面向最便宜、最简单的设备,以及可穿戴设备。
Imagination声称,7XE的功耗满载也不会超过1W,待机时几乎可以忽略不计。
性能咋样?
真正使用PowerVR 7系列的处理器、设备要明年底才会出现,而我们都知道,ARM、Imagination他们都只是卖CPU、GPU授权,具体什么样子还得看SoC芯片厂商的选择,包括核心数量、技术特性、制造工艺、运行频率等等,因此现在是无法说清性能的,只能有一个大概的预估。
Imagination宣称,在同样核心数量、同等频率下,7XT系列的性能可比6XT系列提升35-60%,如果真能实现是很猛的,但这也意味着功耗会增加很多,因此最终在考虑功耗的前提下,性能提升绝对不会这么高,而且这只是理论测试,实际应用中又会打个折扣。
而在能效方面站出来的是7XE,官方号称相比6XE提升幅度少则40%,多则可以超过100%。
结语:
PowerVR 7系列可以配置出各种不同的版本,最高最低相差32倍,因此理论上适合各种各样的设备,从智能手表、手环到笔记本甚至是服务器计算集群。
PowerVR 6系列是CES 2014大展上宣布的,最近才刚刚投入实用,iPhone 6/Plus、iPad Air 2就是典型代表。PowerVR 7系列的零售产品预计会在一年后面世,正好就是下一代iPhone、iPad发布的窗口,而按照苹果与PowerVR的一贯良好合作关系,iPhone 7(6S)几乎必然会用PowerVR 7,而且说不定会有6个核心。
ARM Mali-T800、高通Adreno 400、NVIDIA麦克斯韦……明年的移动GPU,注定会精彩异常。
http://m.mydrivers.com/newsview.aspx?id=329019&cid=1
http://www.imgtec.com/news/detail.asp?ID=933
http://blog.imgtec.com/powervr/p ... compute-performance

审判者

流放者

精华
0
帖子
12744
威望
0 点
积分
14045 点
种子
163 点
注册时间
2004-2-22
最后登录
2025-2-7
发表于 2014-11-13 00:57  ·  四川 | 显示全部楼层
6S都还没~就来7了~~~~~~~~~

精华
0
帖子
988
威望
0 点
积分
1061 点
种子
5 点
注册时间
2004-5-3
最后登录
2014-11-17
 楼主| 发表于 2014-11-13 00:58  ·  日本 | 显示全部楼层
PowerVR Series7XT系列具有100GFLOPS至1.5TFLOPS的浮点运算性能。

精华
0
帖子
988
威望
0 点
积分
1061 点
种子
5 点
注册时间
2004-5-3
最后登录
2014-11-17
 楼主| 发表于 2014-11-13 00:58  ·  日本 | 显示全部楼层
暗黑の破坏熊 发表于 2014-11-13 00:57
6S都还没~就来7了~~~~~~~~~

就是6S,明年的iPhone。

审判者

群青日和

精华
0
帖子
12999
威望
0 点
积分
15398 点
种子
444 点
注册时间
2007-8-28
最后登录
2025-2-1
发表于 2014-11-13 00:59  ·  北京 | 显示全部楼层
版区谢绝PC相关内容,倒是没见拦着手机硬件大局观,嗯。

审判者

T.T.T.E....

精华
0
帖子
17059
威望
1 点
积分
19387 点
种子
14 点
注册时间
2009-10-23
最后登录
2025-2-6
发表于 2014-11-13 01:11  ·  江苏 | 显示全部楼层
功耗散热电池续航怎么办...

精华
0
帖子
4191
威望
0 点
积分
4245 点
种子
199 点
注册时间
2013-8-19
最后登录
2021-12-4
发表于 2014-11-13 01:17  ·  辽宁 | 显示全部楼层
拿来查攻略看看通关视频不错         

精华
0
帖子
1283
威望
0 点
积分
1288 点
种子
5 点
注册时间
2004-1-1
最后登录
2017-10-29
发表于 2014-11-13 01:23  ·  广东 | 显示全部楼层
在这么小的一个屏幕上画面超越ps4应该不是难度,至少不用抗锯都不会看到狗牙

精华
0
帖子
2687
威望
0 点
积分
2914 点
种子
27 点
注册时间
2004-11-13
最后登录
2024-9-29
发表于 2014-11-13 01:26  ·  北京 | 显示全部楼层
价格***倍了

精华
0
帖子
988
威望
0 点
积分
1061 点
种子
5 点
注册时间
2004-5-3
最后登录
2014-11-17
 楼主| 发表于 2014-11-13 01:27  ·  日本 | 显示全部楼层
johnnyelf 发表于 2014-11-13 01:26
价格***倍了

iPad Air价格还好吧。那个最高16核心的考虑到功耗散热,iPad Air3有戏。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|A9VG电玩部落 川公网安备 51019002005286号

GMT+8, 2025-2-8 06:04 , Processed in 0.196041 second(s), 17 queries , Redis On.

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

返回顶部