随着AMD的全新7nm制程工艺的RDNA架构推出,代表着AMD在未来的GPU市场上将有一番大作为,在过去的几代中,AMD的GPU已经利用了很久的基于GCN架构的计算单元。GCN多年来一直很好地服务于AMD,并且非常适合各种工作负载,但是对于Radeon RX 5700系列和Navi核心,AMD的GCN架构已经不能继续满足了,因此他们推出了全新的RDNA(Radeon DNA)架构。
RDNA架构采用台积电的7nm制程工艺,GDDR6显存,支持PCI Express 4.0接口。GPU还采用了新的Radeon Media和Radeon Display引擎,以更好地满足流媒体和内容创作者的需求,并引入一系列新的显示技术。
Navi核心中的新COMPUTE UNIT(CU单元)设计具有多级缓存层次结构和简化的图形管道,不仅可以提高每时钟性能,还可以提高时钟频率。新的CU提供双倍的GCN指令速率,并且具有两倍的标量单位数和调度程序数。通过资源池,两个CU可以协调并充当工作组处理器。例如,64个线程可以分组为两个Wave32指令,并在单个时钟中执行。CU的灵活性和集中资源的能力提高了单线程性能,GPU利用率和效率。
Navi还具有新的缓存层次结构。AMD为其增加了一个新的L1缓存,并将L0缓存的负载带宽加倍到ALU。新的缓存层次结构减少了每个级别的缓存延迟,并提高了有效带宽。
Navi中的DCC(Delta Color Compression,增强色彩压缩)算法也得到了改进,并且也可用于缓存子系统的更广泛部分。使用Navi,着色器现在可以读取和写入压缩的颜色数据。新的显示单元还可以读取帧缓冲器中的压缩数据,而无需先对其进行解压缩。最终结果是整个GPU的有效带宽更高。
Navi核心中的整个图形管道也已得到改进,可提高效率,实现更好的每时钟性能,并且GPU还具有更高效的时钟门控功能,可提高整体电源效率。相对于GCN,RDNA提供超过50%的每瓦性能提升和25%更好的整体性能提升。据AMD称,超过50%的改进来自架构优化; GPU的7nm工艺和频率改进也得到了提升。
根据AMD的说法,Navi的40 CU设计性能比Vega64提高了约14%,功耗降低了23%。并且具有小得多的芯片尺寸。(Navi 10的面积为251平方毫米,作为对比Vega 64上面的那颗为495平方毫米。)
最后,我们来看看采用完整的RDNA架构的GPU核心里面都有什么呢?40个RDNA计算单元,包括80个标量处理器,2560个流处理器和160个64位双线性滤波器单元。GPU具有4MB L2缓存,512K L1和双倍VSL0负载带宽,支持整个芯片的DCC(Delta Color Compression,增强色彩压缩)。简化的图形引擎具有新的几何引擎,64像素单位和4个异步计算引擎。
而在未来,当RDNA架构的显卡核心从251mm2扩大、乃至翻倍后,带来更多的流处理器和晶体管,想必会让AMD在高端乃至旗舰市场上大发神威。而在入门级显卡上,RDNA架构则拥有较GCN架构更好的能耗比,能够更好的控制功耗与发热,移植到移动端上也非常有可能,从而打破竞争对手在移动端显卡上的一家独霸!(7340979)