A9VG电玩部落论坛

 找回密码
 注册
搜索
查看: 8593|回复: 37

与当今的PC CPU相比,其实它并不强:XBOX360 CPU简要分析

 关闭 [复制链接]

精华
0
帖子
2785
威望
0 点
积分
2788 点
种子
0 点
注册时间
2005-4-30
最后登录
2023-10-16
 楼主| 发表于 2006-9-28 01:57  ·  湖北 | 显示全部楼层 |阅读模式
  目前市面上的PC和XBOX360的CPU谁更强,且让我们来看看。

1 先看INTEL: Conroe(Intel即将上市的新CPU):

解码和调度:乱序执行,单周期发射5条指令
执行资源:
3个64bit的整数ALU、2个128bit的FPU(分别处理加法、乘除法)、3个128bit的SSE执行单元、3个Load/Store单元。

2 再来看AMD: K8(AMD Athlon 64系列CPU):

解码和调度:乱序执行,单周期发射3条指令
执行资源:
3个整数执行单元,3个地址生成单元,3个浮点、SSE单元,还有Load/Store的缓冲队列。

3 最后看XBOX360  XENON(IBM为XBOX360专门设计的CPU):

90nm工艺,1.65亿个晶体管,85W
解码和调度:顺序执行,单周期发射2条指令,SMT
执行资源:
整数单元(Integer Uint)、加载/存储单元(Load/Store Uint)、分支单元(Branch Uint)
Scalar浮点单元(Scalar Floating Point Unit)
VMX浮点单元(VMX Floating Point Unit)、VMX置换单元(VMX Permute Unit)、VMX简单单元(VMX Simple Unit)

--------------------------------------------

  Xenon还是在频率就是一切的时代设计出来的,高频高功耗。为了简化设计和压缩成本,采用了简单的顺序执行控制逻辑。


  顺序执行和高频率意味着要为流水线阻塞或排空付出高昂的代价。IBM的解决方案是采用SMT,SMT说穿了就是和Pentium4上的超线程一样的技术。在一个线程阻塞等待时,调度另一个线程执行,避免执行资源的浪费。但是SMT对性能的帮助有限,20%已经是峰值了,大多数情况下都达不到。Xenon还有两条短腿拖着SMT。一是Xenon的执行资源本来就不富裕,数数有7个,但其中3个是VMX向量执行单元,真正能用于通用计算的只有4个,这4个里面,分支和Load/Store还占去了两个。二是Xenon的缓存太少,只有1M,6个线程平均下来太少了。所以,Xenon的SMT的作用非常有限。

  顺序执行也使得Xenon的2发射超标量设计大打折扣。因为这要求指令流的相邻两条指令必须满足一定的并行条件才能同时发射。而乱序执行不受此限制,可以充分发掘指令流中的指令并行性。

  分支预测和数据预取也是x86的强项,预测的准确性对性能的影响极大,10%的预测错误会造成30%的性能损失。

  影响Xenon性能的另一个不利因素是和Xenos显示芯片之间的连接,这种连接应该是类似AMD Hypertransport的基于包的串行总线,其特点是高带宽高延迟。这是很不好的设计,见下文对Cell+XDR的分析。

  总评一下,Xenon的单个核心的设计相当于Pentium的水平,Pentium也是2发射。Pentium的架构即使做到3.2G,性能也是很差的。单个Xenon核心甚至比3.2G Pentium还差,因为其流水线比Pentium深多了。Xenon的流水线深度未知,估计和Cell差不多,Cell的PPE整数流水线深度为21级。太深了,和Pentium4有的一比。

  Pentium4的指令发射、乱序执行、分支预测等控制逻辑还是相当强大的,只不过因为流水线太深了,阻塞和排空的性能惩罚过大,造成整体性能不佳。而Xenon的控制逻辑:顺序执行、较差的分支预测和数据预取,比Pentium4差得多,可以推测其性能比Pentium4要差得多。


  所以,并非像IBM说的那样,复杂的乱序执行核心只能放下两个,因而采用了简单的顺序执行核心。事实的真相是:用高频顺序执行核心的无用理论峰值运算能力欺骗消费者;而单核心的性能太差,IBM不得不集成了3个核心。

  总结一下,Xenon是一个廉价、高频、高功耗、低能的CPU,设计非常不平衡,到处都是瓶颈,理论峰值性能和实际性能相去甚远。两核心的Conroe能把Xenon打得满地找牙。

  Cell是一种非常规矩的设计,不过PPE的架构和Xenon差不多,做通用处理的性能半斤八两。Cell的PPE也只有512kB二级缓存,而且分支预测和数据预取和Xenon一样差。这使得Cell配备XDR成了个笑话,XDR的高带宽高延迟特性要有强劲的分支预测和数据预取,和大容量高效率的Cache才能发挥作用。否则高带宽就会被高延迟毁了,而PS3正是这么设计的。Cell的细节在ISSCC上披露时,一片质疑声。



  IBM为什么采用这么差的设计?原因很多。但一个不能忽视的原因是IBM的研发资源不够,未能掌握复杂的乱序执行设计。通用CPU业界有竞争力的公司现在只剩3家,按实力排序是:Intel、AMD、IBM。DEC被compaq、hp收购,hp在高端CPU上和intel合作,指望Itanium,整个Alpha开发团队都归intel了。而且Alpha CPU在市场份额上从来没能获得成功。SUN的SPARC在CPU性能竞赛的长跑中被越拉越远,已经失去了竞争力,而且SUN公司在.com泡沫破灭后,面临严重的危机,无力持续投入。SGI的MIPS,不用说了,SGI都要破产了。从这个局面中可以看出,为什么三大主机厂都选择IBM设计CPU,因为他们想和PC/x86保持距离,前两强都是x86,只能选择老三IBM。

  IBM的实力很强,但那是多领域综合实力的强,在CPU领域比不上Intel和AMD,市场份额和营业收入差得很远。即使是CPU领域,IBM真正强的是服务器和大型机的Power处理器,桌面CPU的PowerPC与Intel和AMD相比,竞争力差一个档次。

  Apple公司抛弃IBM,就是看穿了IBM在桌面CPU的竞争中无力跟上Intel和AMD,不愿陪着PowerPC走进坟墓。Intel和AMD的业务专一,而且CPU特别是桌面CPU是核心业务,投入的资源比IBM多得多。这是conroe和K8的设计比PowerPC复杂先进的重要原因。

Xenon的高热也让微软吃了不少苦头,估计现在正在忙着改成65nm的设计。

  游戏主机的CPU属于桌面级的通用CPU,实际上还是选择x86 CPU更符合消费者的利益。x86 CPU更复杂先进,硅片面积更大,但其生产规模巨大,规模的成本优势足以抵消硅片面积的上升,结果就是更便宜且性能更强劲的CPU。

  不过,现在游戏机的性能竞争主要集中在显示处理上,物理计算也可以用显示芯片做。CPU强一些,弱一些差别不大。也许要到未来AI成为游戏性的重要内容的时候,CPU的重要性才会上升。.

精华
1
帖子
34400
威望
2 点
积分
35977 点
种子
0 点
注册时间
2006-3-10
最后登录
2013-6-24
发表于 2006-9-28 02:00  ·  北京 | 显示全部楼层
来了一个专家,继续观察

精华
0
帖子
378
威望
0 点
积分
379 点
种子
0 点
注册时间
2005-11-8
最后登录
2012-6-30
发表于 2006-9-28 02:01  ·  广西 | 显示全部楼层
其实这文章忽略了游戏机的封闭统一架构在开发游戏上的优势,PC游戏为了在不同CPU与显示芯片上都能运行,程序内核是没有对特定架构编写优化的,可以说整个程序是个庞大的***站,哪个硬件需要哪段代码就拿去运行,效率可以用非常低来形容,目前360上很多游戏就是PC移植,也存在这种执行率低的问题,所以比较CPU什么的毫无意义!

精华
0
帖子
646
威望
0 点
积分
656 点
种子
10 点
注册时间
2006-5-25
最后登录
2025-10-1
发表于 2006-9-28 02:05  ·  海南 | 显示全部楼层
厉害 果然厉害 看来偶还是个农民- -

征服者

魔鬼蛇,Big Boss的最终克隆体

精华
3
帖子
5868
威望
1 点
积分
6000 点
种子
5 点
注册时间
2004-5-23
最后登录
2019-12-8
发表于 2006-9-28 02:06  ·  上海 | 显示全部楼层
执行效率,要比就比这个...........................而且,再比游戏.................

精华
0
帖子
1589
威望
0 点
积分
1704 点
种子
0 点
注册时间
2004-7-31
最后登录
2012-3-21
发表于 2006-9-28 08:34  ·  广东 | 显示全部楼层
现在的360游戏还未用到XO的三个核,能有这个效果我就很满足了,到时那些要用到三核心的游戏是咋样呢?

精华
0
帖子
180
威望
0 点
积分
182 点
种子
0 点
注册时间
2006-8-21
最后登录
2009-10-13
发表于 2006-9-28 08:36  ·  上海 | 显示全部楼层
转天极的吧




.

圣骑士

无情年代 只恋不爱

精华
0
帖子
3364
威望
0 点
积分
3421 点
种子
25 点
注册时间
2006-5-15
最后登录
2025-9-6
发表于 2006-9-28 09:30  ·  云南 | 显示全部楼层
下面是引用帝王于2006-09-28 02:00发表的:
来了一个专家,继续观察
只要有GOOGLE 任何人都可以成为专家~
该用户已被禁言

精华
0
帖子
259
威望
0 点
积分
277 点
种子
0 点
注册时间
2006-8-2
最后登录
2017-9-23
发表于 2006-9-28 09:54  ·  广东 | 显示全部楼层
3000快的机器你配一台比XO还强的,配来看看

终结者

帮主

精华
0
帖子
9910
威望
0 点
积分
10169 点
种子
20 点
注册时间
2004-12-28
最后登录
2025-10-12
发表于 2006-9-28 09:57  ·  江西 | 显示全部楼层
为什么又来了这种毫无疑意义的比较
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|A9VG电玩部落 川公网安备 51019002005286号

GMT+8, 2025-10-14 21:33 , Processed in 0.213832 second(s), 21 queries , Redis On.

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

返回顶部