JEDEC发布GDDR7图形内存标准 更多技术细节曝光

站长云网 2024-03-06 站长云网

据BusinessWire报道,JEDEC已发布GDDR7内存标准规范。下一代内存将用于显卡,AMD、美光、NVIDIA、三星和SK海力士都参与了此事。我们预计GDDR7将成为高端RDNA4和BlackwellGPU的首选内存,据传它们将于明年推出,并在我们的最佳显卡排行榜上争夺一席之地。

自第一款显卡开始支持GDDR6内存以来,已经过去了近六年的时间。这就是NVIDIA于2018年9月推出的RTX20系列图灵架构。首款采用GDDR6的RTX2080和RTX2080TiGPU的内存时钟频率为14Gbps(14GT/s),每台设备可提供56GB/s的速度。后来的解决方案(例如AMD的RX7900XTX)的时钟速度高达20Gbps,速度为80GB/s。

NVIDIA帮助创建了更快的GDDR6X替代方案,在RTX3080中的速度为19Gbps,最终在最新的RTX4080Super中高达23Gbps。按照官方说法,美光GDDR6X芯片的速率高达24Gbps,每台设备的速率可达96GB/s。

GDDR7将大幅增加带宽。JEDEC的规格最终将达到每台设备192GB/s。计算得出,内存速度为48Gbps,是最快GDDR6X的两倍。然而,它达到该速度的方式与之前的内存解决方案不同。

GDDR7将使用三个级别的信令(-1、0、+1)每两个周期传输三位数据。这是GDDR6中使用的NRZ(不归零)信号的变化,GDDR6在两个周期内传输两位。仅这一变化就使数据传输效率提高了50%,这意味着基础时钟不必是GDDR6的两倍。

其他变化包括使用独立于核心的线性反馈移位寄存器训练模式来提高准确性并减少训练时间。GDDR7的独立通道数量将增加一倍(GDDR6为4个,而GDDR6为2个),并且将使用PAM3信令。

这些都不是新信息,三星去年7月透露了许多关键的GDDR7细节。然而,JEDEC标准的发布标志着一个重要的里程碑,并表明GDDR7解决方案的公开可用性和使用迫在眉睫(相对而言)。

NVIDIA的下一代Blackwell架构预计在推出时将使用GDDR7。我们可能会在2024年末推出Blackwell的数据中心版本,但它将使用HBM3E内存而不是GDDR7。消费级产品很可能会在2025年初上市,并且像往常一样,这些部件将会有专业版和数据中心版。AMD也在开发RDNA4,我们预计它也将使用GDDR7——不过,如果两家公司的低端部件出于成本原因仍然选择坚持使用GDDR6,也不要感到惊讶。

无论哪种情况,AMD或NVIDIA在最高速度下使用GDDR7都可能使用当今最宽的384位接口提供高达2,304GB/s的带宽。我们真的会看到这样的带宽吗?也许不是,例如NVIDIA的RTX40系列GPU(配备GDDR6X)都使用略低于最大时钟的时钟。尽管如此,我们仍然可以轻松地看到即将推出的架构的带宽翻倍。

这些什么时候才能真正到达?我们不排除在2024年末推出的可能性。NVIDIA的RTX30系列于2020年秋季推出,RTX40系列于2022年秋季推出。AMD的RX6000系列同样于2020年底推出,RX7000系列于2022年底推出。如果保持同样的两年节奏,我们可以在年底前看到GDDR7显卡。但不要抱太大希望,因为我们仍然认为2025年初的可能性更大。

JEDEC发布GDDR7图形内存标准

微电子行业标准制定的全球领导者JEDEC固态技术协会很高兴地宣布发布JESD239图形双倍数据速率(GDDR7)SGRAM。JESD239GDDR7提供的带宽是GDDR6的两倍,每台设备的带宽高达192GB/s,可满足图形、游戏、计算、网络和AI应用中对更多内存带宽不断增长的需求。

JESD239GDDR7是首款使用脉冲幅度调制(PAM)接口进行高频操作的JEDEC标准DRAM。其PAM3接口提高了高频操作的信噪比(SNR),同时提高了能效。通过使用3个级别(+1、0、-1)在2个周期内传输3位,而不是传统的NRZ(不归零)接口在2个周期内传输2位,PAM3提供了更高的数据传输速率。循环,从而提高性能。

其他高级功能包括:

具有眼图掩蔽和错误计数器的核心独立LFSR(线性反馈移位寄存器)训练模式可提高训练准确性,同时减少训练时间;

独立通道数量翻倍,从GDDR6中的2个增加到GDDR7中的4个;

支持16Gbit至32Gbit密度,包括支持2通道模式以使系统容量加倍;

通过整合最新的数据完整性功能,包括带实时报告的片上ECC(ODECC)、数据中毒、错误检查和清理以及带命令阻塞的命令地址奇偶校验(CAPARBLK),满足RAS(可靠性、可用性、可维护性)的市场需求;

JEDEC董事会主席MianQuddus表示:“JESD239GDDR7标志着高速内存设计的重大进步。“随着向PAM3信号的转变,内存行业有了一条新的途径来扩展GDDR设备的性能并推动图形和各种高性能应用的不断发展。”

“GDDR7是首款不仅专注于带宽,而且通过整合最新的数据完整性功能来满足RAS市场需求的GDDR,这些功能使GDDR设备能够更好地服务云游戏和计算等现有市场,并扩展到AI、JEDECGDDR小组委员会主席MichaelLitt说道。

AMD计算和图形首席技术官兼企业研究员JoeMacri表示:“今天推出的突破性GDDR7内存标准代表着释放下一代消费、游戏、商业和企业设备潜力的关键一步。”“通过利用GDDR7的变革力量,我们可以共同开启变革计算和图形可能性的新时代,为创新和发现塑造的未来铺平道路。”

“美光在通过JEDEC定义图形DRAM标准方面有着悠久的历史,并且在与我们的合作伙伴和客户一起推动GDDR7标准化活动方面发挥了关键作用,”美光计算和网络部门的首席架构师兼杰出技术人员FrankRoss说道。业务单位。“利用多级信令的GDDR产品的开发有助于确定满足未来不断增长的系统带宽需求的途径。通过添加领先的RAS功能,GDDR7标准可满足远远超出传统图形市场的工作负载要求。”

NVIDIAGPU产品管理副总裁KaustubhSanghani表示:“NVIDIA很高兴我们与JEDEC的合作帮助PAM信号成为GDDR7的基础技术,帮助客户充分发挥GPU的性能。”

三星执行副总裁兼内存产品规划主管YongCheolBae表示:“人工智能、高性能计算和高端游戏需要高性能内存来以前所未有的速度处理数据。”“GDDR732Gbps将实现1.6倍的性能提升,同时具有最高的可靠性和成本效益。”

“随着每一代图形内存的出现,业界始终致力于实现同时确保最高速度和提高能效的宏伟目标。SK海力士很荣幸能够作为JEDEC成员参与GDDR7标准工作,并很高兴能够为客户提供最高速度和出色功效的内存。再次实现标准工作将成为业界扩展内存生态系统的新机遇。”SK海力士产品规划副总裁SangKwonLee表示。

GDDR7更多技术细节曝光:

36Gbps与PAM3编码

当三星前年10月嘲笑GDDR7内存的持续开发时,Cadence没有透露即将推出的规范的任何其他技术细节。但他们最近透露了有关该技术的一些额外细节。事实证明,GDDR7内存将使用PAM3和NRZ信号,并将支持许多其他功能,目标是达到每个引脚高达36Gbps的数据速率。

简短的GDDR历史课

在较高的层面上,近年来GDDR内存的发展相当简单:更新的内存迭代提高了信号速率,增加了突发大小(burstsize)以跟上这些信号速率,并提高了通道利用率。但是这些都没有显着增加存储单元的内部时钟。例如,GDDR5X和后来的GDDR6将其突发大小增加到16字节,然后切换到双通道32字节访问粒度。虽然每一代技术都面临着挑战,但最终行业参与者已经能够通过每个版本的GDDR提高内存总线的频率,以保持性能的提升。


但即使是“简单”的频率增加也越来越变得不那么简单了。这促使该行业寻找除了加快时钟之外的解决方案。

借助GDDR6X,美光和NVIDIA将传统的不归零(NRZ/PAM2)编码替换为四级脉冲幅度调制(PAM4)编码。PAM4使用四个信号电平将有效数据传输速率提高到每个周期两个数据位,从而实现更高的数据传输速率。实际上,由于GDDR6X在PAM4模式下运行时具有8字节(BL8)的突发长度(burstlength),因此在相同数据速率(或者更确切地说,信号速率)下它并不比GDDR6快,而是设计为能够达到比GDDR6可以轻松实现的更高的数据速率。

四级脉冲幅度调制在信号丢失方面优于NRZ。对于给定的数据速率,由于PAM4需要NRZ信号传输波特率的一半,因此产生的信号损失显着减少。随着更高频率的信号在通过导线/走线时衰减得更快——而且按照数字逻辑标准,内存走线的距离相对较长——能够在本质上是较低频率的总线上运行,最终使一些工程和走线更容易实现更高的数据速率。

权衡(trade-off)是PAM4信号通常对随机和感应噪声更敏感;为了换取较低频率的信号,您必须能够正确识别两倍的状态。实际上,这会导致给定频率下的误码率更高。为了降低BER,需要在Rx端进行均衡,在Tx端进行预补偿,这会增加功耗。虽然它未用于GDDR6X内存,但在更高频率(例如PCIe6.0)下,前向纠错(FEC)也是一项实际要求。

当然,GDDR6X内存子系统需要全新的内存控制器,以及用于处理器和内存芯片的全新物理接口(PHY)。这些复杂的实现在很大程度上是四级编码直到最近才几乎完全用于高端数据中心网络的主要原因,在这些网络中有支持使用这种尖端技术的利润。

GDDR7:PAM3编码高达36Gbps/pin

考虑到上述在使用PAM4信号或NRZ信号时的权衡,事实证明支持GDDR7内存标准的JEDEC成员反而采取了一些折衷的立场。GDDR7内存设置为使用PAM3编码进行高速传输,而不是使用PAM4。

顾名思义,PAM3介于NRZ/PAM2和PAM4之间,使用三级脉冲幅度调制(-1、0、+1)信号,允许它每个周期传输1.5位(或者更确切地说是3位以上)两个周期)。PAM3提供比NRZ更高的每周期数据传输速率——减少了迁移到更高内存总线频率的需要以及由此带来的信号丢失挑战——同时需要比PAM4更宽松的信噪比。总的来说,GDDR7承诺比GDDR6具有更高的性能,同时比GDDR6X具有更低的功耗和实施成本。

对于那些记分的人来说,这实际上是我们看到的第二个使用PAM3的主要消费技术。出于类似的技术原因,USB4v2(又名80GbpsUSB)也在使用PAM3。那么PAM3到底是什么?


PAM3是一种数据线可以承载-1、0或+1的技术。该系统所做的实际上是将两个PAM3传输组合成一个3位数据信号,例如000是一个-1后跟一个-1。这变得很复杂,所以这里有一个表格:


当我们将NRZ与PAM3和PAM4进行比较时,我们可以看到PAM3的数据传输速率处于NRZ和PAM4的中间。在这种情况下使用PAM3的原因是为了在没有PAM4需要启用的额外限制的情况下实现更高的带宽。


话虽如此,三星承诺的具有36Gbps数据传输速率的256位内存子系统将使用多少功率还有待观察。GDDR7规范本身尚未获得批准,硬件本身仍在构建中(这正是Cadence等工具发挥作用的地方)。但请记住,AI、HPC和图形的带宽需求量很大,带宽将永远受到欢迎。

优化效率和功耗

除了提高吞吐量外,GDDR7有望采用多种方式来优化内存效率和功耗。特别是,GDDR7将支持四种不同的读取时钟(RCK)模式,以便仅在需要时启用它:

始终运行:始终运行并在睡眠模式下停止;

禁用:停止运行;

StartwithRCKStartcommand:主机可以在读出数据之前通过发出RCKStart命令来启动RCK,并在需要时使用RCKStop命令停止。

StartwithRead:当DRAM收到任何涉及读出数据的命令时,RCK自动开始运行。它可以使用RCKStop命令停止。

此外,GDDR7内存子系统将能够并行发出两个独立的命令。例如,BankX可以通过在CA[2:0]上发出Refreshperbank命令来刷新,而BankY可以通过同时在CA[4:3]上发出读取命令来读取。此外,GDDR7将支持线性反馈移位寄存器(LFSR)数据训练模式,以确定适当的电压电平和时序,以确保一致的数据传输。在这种模式下,主机将跟踪每个单独的眼睛(连接),这将允许它应用适当的电压以更好地优化功耗。

最后,GDDR7将能够根据带宽需求在PAM3编码和NRZ编码之间切换。在高带宽场景中,将使用PAM3,而在低带宽场景中,内存和内存控制器可以切换到更节能的NRZ。

虽然GDDR7承诺在不大幅增加功耗的情况下显着提高性能,但技术观众最大的问题可能是新型内存何时可用。由于没有来自JEDEC的硬性承诺,因此没有预计GDDR7发布的具体时间表。但考虑到所涉及的工作和Cadence验证系统的发布,预计GDDR7将与AMD和NVIDIA的下一代GPU一起进入现场并不是没有道理的。请记住,这两家公司倾向于以大约两年的节奏推出新的GPU架构,这意味着我们将在2024年晚些时候开始看到GDDR7出现在设备上。

当然,鉴于如今有如此多的AI和HPC公司致力于带宽需求高的产品,其中一两家可能会更快发布依赖GDDR7显存的解决方案。但GDDR7的大规模采用几乎肯定会与AMD和NVIDIA的下一代图形卡的量产同时发生。

相关文章:

JEDEC公布下一代图形内存标准GDDR7AMD和NVIDIA也参与其中

责任编辑:站长云网