A9VG电玩部落论坛

 找回密码
 注册
搜索
楼主: 紫色世界

[硬件周边] 英伟达T239处理器:任天堂NS2的新心脏?

[复制链接]

精华
0
帖子
8308
威望
0 点
积分
8592 点
种子
1474 点
注册时间
2022-9-13
最后登录
2024-10-24
发表于 2023-11-15 15:17  ·  广西 | 显示全部楼层
Akamen 发表于 2023-11-15 14:50


就是2:0,之前一个周期是1:1,可以发送一条浮点指令,一条整型指令,现在可以选择发送2条浮点指令,更灵活了。统计cuda确实会有问题,因为cuda是算的浮点单元,现在整型单元也有浮点能力,但考虑到浮点整型使用率是2.77:1,影响并没有那么大


你这是空想

实际不可能
发自A9VG Android客户端

精华
0
帖子
8308
威望
0 点
积分
8592 点
种子
1474 点
注册时间
2022-9-13
最后登录
2024-10-24
发表于 2023-11-15 15:21  ·  广西 | 显示全部楼层
Akamen 发表于 2023-11-15 14:52


原来的浮点单元还是负责浮点,改的是整型单元,除以2只是下限,但面积可是实打实除以2了


你完全错

概念混淆

整数单元依然保留

占面积并没有减小

反而会多加晶体管来转换
发自A9VG Android客户端

精华
0
帖子
8308
威望
0 点
积分
8592 点
种子
1474 点
注册时间
2022-9-13
最后登录
2024-10-24
发表于 2023-11-15 15:30  ·  广西 | 显示全部楼层
Akamen 发表于 2023-11-15 14:59


所以肯定会定制,老黄手上没有合适的芯片,不定制就没东西用


定制就个名号实际没有
忽悠老任入套整个世代
黑皮衣值得信?
要定下来早公布了
何必遮遮掩掩
看看前几代
明显多方案还没定

别家5nm4nm出两年了

皮衣还在纠结8nm7nm
发自A9VG Android客户端

精华
0
帖子
315
威望
0 点
积分
480 点
种子
242 点
注册时间
2019-2-26
最后登录
2019-2-26
发表于 2023-11-15 15:52  ·  上海 | 显示全部楼层
水滴梦幻 发表于 2023-11-15 15:21


你完全错

概念混淆

整数单元依然保留

占面积并没有减小

反而会多加晶体管来转换


这里是我记错了,重新看了下设计图,单元加了一组fp32,但数据通路还是两个,但2:0是没啥问题,图灵及之前一个sm只能并行执行一条fp32指令一条int32指令,现在可以同时执行两条fp32指令
发自A9VG iPhone客户端

精华
0
帖子
8308
威望
0 点
积分
8592 点
种子
1474 点
注册时间
2022-9-13
最后登录
2024-10-24
发表于 2023-11-15 15:58  ·  广西 | 显示全部楼层
Akamen 发表于 2023-11-15 15:52


这里是我记错了,重新看了下设计图,单元加了一组fp32,但数据通路还是两个,但2:0是没啥问题,图灵及之前一个sm只能并行执行一条fp32指令一条int32指令,现在可以同时执行两条fp32指令


你还在纠结理论

整数要是不必要

早就全整成浮点

你大大看轻整数
发自A9VG Android客户端

精华
0
帖子
315
威望
0 点
积分
480 点
种子
242 点
注册时间
2019-2-26
最后登录
2019-2-26
发表于 2023-11-15 16:06  ·  上海 | 显示全部楼层
水滴梦幻 发表于 2023-11-15 15:21


你完全错

概念混淆

整数单元依然保留

占面积并没有减小

反而会多加晶体管来转换


至于面积小,是跟同样多fp32单元的其他架构比,安培一个sm有两组fp32,算cuda又是只算浮点单元,所以规格会虚高,但如果其他架构同样cuda数量比,规格会更小,你算一下就知道了
发自A9VG iPhone客户端

精华
0
帖子
315
威望
0 点
积分
480 点
种子
242 点
注册时间
2019-2-26
最后登录
2019-2-26
发表于 2023-11-15 16:19  ·  上海 | 显示全部楼层
水滴梦幻 发表于 2023-11-15 15:58


你还在纠结理论

整数要是不必要

早就全整成浮点

你大大看轻整数


算了吧,整数使用率和浮点是1:2.77,按实际场景都是fp32:int32是1:1的情况算,3060ti浮点算力应该是6t不到,而6750xt是13t,就输10%,这架构优势还不大?如果这叫看轻整数,rdna3跟什么?
发自A9VG iPhone客户端

精华
0
帖子
8308
威望
0 点
积分
8592 点
种子
1474 点
注册时间
2022-9-13
最后登录
2024-10-24
发表于 2023-11-15 19:53  ·  广西 | 显示全部楼层
Akamen 发表于 2023-11-15 16:06


至于面积小,是跟同样多fp32单元的其他架构比,安培一个sm有两组fp32,算cuda又是只算浮点单元,所以规格会虚高,但如果其他架构同样cuda数量比,规格会更小,你算一下就知道了


整数单元也是规格

你完全在偷换概念
发自A9VG Android客户端

精华
0
帖子
8308
威望
0 点
积分
8592 点
种子
1474 点
注册时间
2022-9-13
最后登录
2024-10-24
发表于 2023-11-15 20:14  ·  广西 | 显示全部楼层
Akamen 发表于 2023-11-15 16:19


算了吧,整数使用率和浮点是1:2.77,按实际场景都是fp32:int32是1:1的情况算,3060ti浮点算力应该是6t不到,而6750xt是13t,就输10%,这架构优势还不大?如果这叫看轻整数,rdna3跟什么?


你玩多标忽悠自己
太好笑
完全不知你在说啥

3060Ti 晶体管174亿
6750XT晶体管172亿
不少还给了缓存
核心晶体管更少

你巨大架构优势
怎么没省一半晶体管啊
发自A9VG Android客户端

精华
0
帖子
8308
威望
0 点
积分
8592 点
种子
1474 点
注册时间
2022-9-13
最后登录
2024-10-24
发表于 2023-11-15 20:40  ·  广西 | 显示全部楼层
Akamen 发表于 2023-11-15 16:19


算了吧,整数使用率和浮点是1:2.77,按实际场景都是fp32:int32是1:1的情况算,3060ti浮点算力应该是6t不到,而6750xt是13t,就输10%,这架构优势还不大?如果这叫看轻整数,rdna3跟什么?


RDNA3更近PS系架构

加入解耦时钟

前端与着色器频率分开

游戏瓶颈在前端更高频

实际索尼主导了RDNA
发自A9VG Android客户端
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|A9VG电玩部落 川公网安备 51019002005286号

GMT+8, 2024-11-16 22:43 , Processed in 0.211057 second(s), 12 queries , Redis On.

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

返回顶部