CPU缓存与内存延迟测试,相信大家都有所耳闻,但是GPU同样的测试却几乎没人做过。
Chips And Cheese就做了一次特别的测试,对比考察了AMD、NVIDIA GPU架构的缓存、显存迟问题。
首先是AMD RDNA2、NVIDIA Ampere两家最新架构的比拼,代表是RX 6900 XT、RTX 3090,前者在几乎所有阶段都完胜。
RNDA2架构创新地加入了Infinity Cache无限缓存,提升带宽的同时,延迟也可圈可点,二级缓存命中率上只增加了大约20ns的延迟,明显低于Ampere。
更惊人的是,RDNA2显存延迟和Ampere几乎一模一样,但是别忘了,Ampere只有两个层级的缓存,RDNA2却有四个。
Ampere的缓存架构更加传统,SM阵列私有一级缓存到二级缓存要增加超过100ns的延迟,RDNA2从零级缓存到二级缓存则只增加了约66ns。看起来,GA102核心面积过大,也直接增加了延迟。
这正好可以解释AMD RDNA2架构在低分辨率下能效更优秀,因为二级缓存、三级缓存延迟很低,更适合执行较小的负载。Ampere则相反,高负载下优势明显,比如说4K分辨率。