Mark Cerny不希望与过去、现在或将来的任何硬件进行比较,而是提出了一种有趣的假设方案—— 一个36个运算单元的图形核心以1GHz运行,与一个48个运算单元其中部分以750MHz运行。两者均提供了4.6TF的计算性能,但Cerny说游戏体验将会有所不同。他解释说:“性能明显不同,因为'teraflops'被定义为ALU的计算能力。这只是GPU的一部分,还有很多其它的单元——当GPU频率更高时,这些其它单元都运行得更快。频率如果提高了33%,光栅化的速度会3%,命令缓冲区的处理速度会大大提高,L1和L2缓存也会有高得多的带宽,以此类推。唯一的缺点是系统内存在周期方面相差33%,但其带来的好处远不止于此。正如我的一个朋友所说,水涨船高。此外,与完全使用48个CU(运算单元)相比,完全并行使用36个CU要容易得多,当三角形较小时,要用有用的工作来填充所有这些CU要困难得多。” 红字部分是Mark Cerny的解释。