越南海关数据狂泄NS2详细规格：12+256

显示全部楼层 · 发表于 2024-5-12 19:53 · 广西

blackjtr 发表于 2024-05-12 17:12
本帖最后由 blackjtr 于 2024-5-12 17:20 编辑

spe连个完整的核心都算不上，算个屁的大核。
simd一路进化，到现在avx512的宽度是512bit，可以一次性处理16个单精度浮点，128bit那是初代avx了，你不会以为这个寄存器宽度等同于指令长度吧？然后你不会以为指令长度跟编程难度挂钩吧？写过程序吗？

此外，核心内置simd的好处是可以跟cpu共享l2/l3 cache，而不是跟**spe一样走额外总线通信或者dma访问主内存。当年ps4演示里有一幕吹的就是利用jaguar的avx1配合havok引擎搞高性能物理模拟。

另外，你写过simd的程序吗？用过ispc之类编译器吗？核心内simd设计之所以广泛用于所有现代cpu，就是因为使用方便，现在用gcc开o3优化甚至可以做到编译器自动进行部分向量化。还tm模仿，intel 99年就出了sse1了，amd 98年出了3Dnow，那年cell连个ppt都不是,就这还来碰瓷？amd现在一样走多核心+simd，你以为大家都一样蠢？

还有，cell这套连现代gpu的尾气都看不到，别tm来碰瓷了。给你说个你听得懂的：但凡cell这货有一丝前景，资本家也不会宁可舍弃掉所有研发的成本，都要如此干净利索地彻底把它扔进垃圾堆。

最后，别回复我了，对于你这种没有受过正经教育，一天到晚在论坛里大放厥词、胡搅蛮缠，连一丁点基本技术常识都没有的民科，多看你一眼算我晦气。

SPE面积这么大你看不见

笑你SIMD认知就局限pc
1024bit不奇怪可拼4096
CELL是2001年初代AVX？
Larrabee的AVX是2009了

SPE有自己缓存池近存计算
AVX的物理光追矩阵后面学

你不知PPE就有VMX SIMD
Xbox360都用源自intel pc？

笑你急得颠三倒四就为踩PS3

连pc微软Xbox360小偷也踩塌

就剩一股怨气在死撑落后架构了

显示全部楼层 · 发表于 2024-5-12 20:05 · 广西

ningren-2008 发表于 2024-05-12 16:21
是不是因为兼顾了主机模式，所以都带风扇?玩掌机的时候有个风扇在里边转这事这么多年了确实还是适应不了

他们都是口径一致的
为洗皮衣烂芯吹散热

不惜反掌机轻便传统

神盾手柄掌机大发热
被迫强加风扇带出来

超笨重600克大毒瘤

显示全部楼层 · 发表于 2024-5-12 20:16 · 福建

blackjtr 发表于 2024-5-12 17:12
spe连个完整的核心都算不上，算个屁的大核。
simd一路进化，到现在avx512的宽度是512bit，可以一次性处理 ...

我顶楼就在召唤他表演了，就等他见任天堂继续和英伟达合作后的样子

我接下来说的话才是每个人都能听得懂：
真正懂行的人，IP地址不会在广西。

显示全部楼层 · 发表于 2024-5-12 20:38 · 广西

tgbcat 发表于 2024-05-12 20:16

我顶楼就在召唤他表演了，就等他见任天堂继续和英伟达合作后的样子
我接下来说的话才是每个人都能听得懂：
真正懂行的人，IP地址不会在广西。

你猜龙芯之母是哪的

看你坑老任捧最烂芯

el-melfes · 发表于 2024-5-12 21:14 · 奥地利

blackjtr 发表于 2024-5-12 04:49
这个精髓本质上走的是错误的路线，spe类似于强化了向量计算性能的简陋核心，在那个多核刚开始展露头角的 ...

SPE是强化了浮点性能的简化核心才是，向量都是以整数为主，PS3后期能玩延迟渲染就是靠的SPE的浮点性能而不是什么向量

SPE和后续GPU的统一渲染管线也很接近，牙膏当年也有从CPU构架出发的Larrabee，目的都是为了提高图形计算的灵活性

虽然cell和larrabee在当时失败了，但是现在GPU的构架都在提高核心的复杂程度来降低对CPU的依赖，实际上就是从另外一个方向来实现同一个目的

显示全部楼层 · 发表于 2024-5-12 21:18 · 广西

本帖最后由水滴梦幻于 2024-5-12 22:11 编辑

tgbcat 发表于 2024-05-12 20:16

我顶楼就在召唤他表演了，就等他见任天堂继续和英伟达合作后的样子
我接下来说的话才是每个人都能听得懂：
真正懂行的人，IP地址不会在广西。

C-GPU就在加州圣迭戈高通总部

背景全是AMD/ATi 高通 intel

结合CELL到Larrabee

苏妈是IBM CELL领导后晋升AMD老大

基尔辛格是Larrabee领导现intel老大

当年与皮衣互骂咒骂GPU必亡好剧

WSE-3背后基金阿联酋穆巴达拉是AMD老友

拉来高通逼微软投资又来偷好笑

重演微软急着挤进游戏机偷CELL救命一幕

笑他苦撑的GPU败局定于几十年前剧本改不了的

不屈 · 发表于 2024-5-12 21:21 · 浙江

leon234512 发表于 2024-05-10 13:53
这性能能否移植第三方游戏？！不要又成三坟机了

第三方又不是只有欧美3a。

显示全部楼层 · 发表于 2024-5-12 22:01 · 广西

el-melfes 发表于 2024-05-12 21:14

SPE是强化了浮点性能的简化核心才是，向量都是以整数为主，PS3后期能玩延迟渲染就是靠的SPE的浮点性能而不是什么向量

SPE和后续GPU的统一渲染管线也很接近，牙膏当年也有从CPU构架出发的Larrabee，目的都是为了提高图形计算的灵活性

虽然cell和larrabee在当时失败了，但是现在GPU的构架都在提高核心的复杂程度来降低对CPU的依赖，实际上就是从另外一个方向来实现同一个目的

CELL还好起码有PS3和走鹃

Larrabee追老任微软留遗憾

统一VS PS更好编程学SPE

GPU不是未来多级缓存费电

C-GPU超灵活高效反向GPU

blackjtr · 发表于 2024-5-13 00:04 · 美国

本帖最后由 blackjtr 于 2024-5-13 00:20 编辑

el-melfes 发表于 2024-5-12 21:14
SPE是强化了浮点性能的简化核心才是，向量都是以整数为主，PS3后期能玩延迟渲染就是靠的SPE的浮点性能而 ...

向量化跟整数/浮点没有直接关系，我们说的向量化，本质上指的是把需要进行相同运算的数据打包，经由特性的硬件在一个cycle内完成所有运算以大幅度提速。
类似如果你要计算0.5 + 1.5， 2.3 + 1.8 ... （假设共有8组这类运算）
这个时候你可以把加号两侧的数据load成两组1x8的浮点向量，扔进硬件单元中一次性算完，这样算力就等同于乘8了。spe中的加速实现方式也属于simd，跟现在的cpu类似，寄存器宽度128bit （avx1一样的宽度），一次可以算8个int16或者4个float32，如果没有这一层，spe根本谈不上什么加速。

现代GPU属于SPMD，一个最小处理单元只能处理一个数据的计算，但是可以通过流处理器的组合扩展出成千上万的执行宽度，这是gpu得天独厚的优势。所以cell这套来搞gpu辅助运算本身就是一个落后的产物，就好比我们现在不会去用cpu辅助光追计算一样，不是不能，但是最后加速比可能是个负数。

如果只是不能替代gpu，但是能给cpu加速那也是好的。但是对比现代cpu，cell的spe理念有几个重要的缺陷：
1. spu（不是spe）本身太简陋，如果把复杂调度扔给其自身管理，会因为spu的瓶颈而无法充分利用计算加速硬件。
2. spe跟ppe/spe之间的交互只能走总线或者dma，一是因为总线问题，单个ppe能够挂载的最大spe数量是有限制的，二是延迟和带宽则会随着规模的上涨成为大问题。

这时候也许有人会想，如果加强spu（提高spe独立调度的能力），设计更好的总线使得单die上的spe数量可以更高，让spe之间可以共享高速缓存，同时保留单个spe内的数据计算加速性能，那么是不是就完美了？恭喜你，获得了一个现代cpu的设计（完整核心+单核心自带高性能simd单元+核心间共享大cache，5800x3d就是这个理念下的终极产物）。所以才说，cell这种奇葩的设计本身就是在当初多核cpu不完善的时代的试错产物罢了。

没事干的某周 · 发表于 2024-5-13 00:06 · 江西

继续围观表演，但凡是真给力皮衣黄也不至于塞了一大坨其他各种实现单元的情况下传统性能还能在同功耗下吊打农企，还SPE巴拉巴拉，去问问用过的当年阿育的或者是其他几家的这玩意是个啥情况就知道了。

		自动登录	找回密码
密码			注册

[业界] 越南海关数据狂泄NS2详细规格：12+256

浏览过的版块