华硕大叔托尼发布了RTX5090/D的详细测评和液氮超频视频,视频中还特别展示了RTX5090/5090D使用的GB202。
这是我第一次看到GPU核心的图片。
GB202采用台积电4NP工艺的升级版制造。与上一代AD102中使用的4N相比,它是增强版。事实上,两者都属于5nm级别,但都是由NVIDIA单独定制的。——这个名字已经够让人困惑的了。
GB202拥有922亿个集成晶体管,超过AD102
763亿增加了约21%,而面积从616平方毫米增加到761平方毫米,幅度约23.5%。换句话说,密度略有下降。
GB202仍有12组GPC,但每组GPC内的TPC数量已从6组增加到8组。每组TPC中仍有两组短信,每组短信仍有128个CUDA核。全血核心总数为24756个CUDA核心,腾讯通
5090/5090D都阻断了11组TPC,幅度约为11%。
可以确认的是,RTX5090D并没有删减Tensor核心数量,还是680个,因此推测是通过底层软件限制了AI算力——不知道是否有可能破解?
计算单元中间的大片区域是缓存。GB202的一级缓存从16MB增加到21.5MB,二级缓存从72MB增加到96MB,都和CUDA核心增加比例相同,也就是同步扩大。
计算单元中间的垂直长区是编解码器。全血芯拥有4套第九代编码引擎NVENC、4套第九代解码引擎NVEDC、RTX
5090/5090分别开放3组和2组。
底边为PCIe5.0x16
PHY物理层和5个视频输出接口,上、左、右边缘是GDDR7内存控制器,每个都是32位,总共16组组成了512位宽。
超频部件,Tony大叔将RTX5090核心频率超到了3390MHz,显存等效频率则是34GHz。
测量3DMarkTimeSpyExtreme超过3万分(世界第三),FireStrikeUltra接近3.7万分,排名世界第一,港口
罗亚尔拥有超过4.3万元人民币,位居世界第一。