前言
我们在《浅谈DDR和LPDDR的渊源》一文中简单介绍了DRAM和以DRAM为存储介质的标准DDR和移动DDR两类标准,还有一类图形DDR所应用的领域也渗透到我们生活的方方面面,早期图形DDR更多的是支持桌面渲染和一些图形相关的应用程序,当下在AI的带动下已经成为数据中心加速用于云端训练和推理的硬件生产力工具,那我们今天就来聊一聊GDDR和HBM。
GDDR的演进历史

GDDR是Graphics Double Data Rate的缩写,为显存的一种,GDDR是起初为了显卡而特别设计的高性能DDR存储器规格。后续逐渐发展到一些数据密集型系统(游戏控制台和高性能计算,包括汽车、AI 和深度学习)的应用。GDDR 标准 (GDDR6X/6/5X) 被架设为点对点 (P2P) 标准,能够支持高达 21Gbps 的速率。目前市面上能看到搭载GDDR2-GDDR6/6X所有类型的显卡产品,GDDR更新迭代的速度很快,GDDR5/5X还没全面铺开,最高端显卡已经应用到GDDR6/6X的产品。
GDDR6X在GDDR家族中首次应用了PAM4信号调制方式,提升了信号传输的效率,能够以更低的时钟频率达成同样的等效频率。GDDR6X与GDDR6相比,能够提供更高的能效比。美光提供的数据显示,同样的8颗显存,等效频率为21Gbps的GDDR6X显存的能效比跟14Gbps的GDDR6显存在每比特能耗上要低15%。要知道,在此同时GDDR6X还提供了多50%的显存带宽。
HBM的演进历史

HBM 是 GDDR 存储器的替代品,目前主要用于 GPU 和加速器。GDDR 存储器旨在以较窄的通道提供更高的数据速率,进而实现必要的吞吐量,而 HBM2E存储器通过 8 条独立通道解决这一问题,其中每条通道都使用更宽的数据路径(每通道 128 位),并以 3.6 Gbps 左右的较低速度运行,HBM3标准则使用16条独立通道(每通道64位),速度在翻倍。因此,HBM 存储器能够以更低的功耗提供高吞吐量,而规格上比 GDDR 存储器更小。HBM2/2E 是目前该类别中主流的标准,应用HBM3标准的产品则将在2023年下半年问世。
HBM作为显存的后起之秀,从2013年面世至今已经走过了4代标准,主要需求的客户也是英伟达、英特尔和AMD等国际GPU巨头。HBM的主要供应商竞争格局依旧延续了DRAM三巨头的竞争态势,根据TrendForce数据,2022年全年SK 海力士占据了 HBM 出货量的 50%,其次是三星,占 40%,美光占 10%。TrendForce 预测,今年海力士将巩固其地位并控制 HBM 出货量的 53%,而三星和美光的份额将分别下降至 38% 和 9%。实际上HBM 市场仍处于起步阶段,因为 HBM 直到 2022 年才开始在 AI 服务器中正式实施,但是随着技术快速迭代适应商业化落地,高性能内存模块市场预计将快速增长。
HBM和GDDR,谁更适合这个时代?

图3:HBM和GDDR最新标准对比

图4:目前推出的搭载HBM和GDDR的GPU产品
从图3可见,HBM per stack和GDDR per chip的标准参数对比之下,从单体可扩展容量、带宽、功耗上HBM整体优于GDDR。海力士HBM3也开始支持片上ECC纠错,显著提高了可靠性,相对于GDDR,HBM主要有以下几个优点:
1.可扩展更大容量:HBM具有可扩展更大容量的特性。HBM的单层DRAM芯片容量可扩展;HBM通过4层、8层以至12层堆叠的DRAM芯片,可实现更大的存储容量;HBM可以通过SiP集成多个HBM叠层DRAM芯片,从而实现更大的内存容量。
2.更低功耗:由于采用了TSV和微凸块技术,DRAM裸片与处理器间实现了较短的信号传输路径以及较低的单引脚I/O速度和I/O电压,使HBM具备更好的内存功耗能效特性。
3.更小体积:在系统集成方面,HBM将原本在PCB板上的DDR内存颗粒和CPU芯片一起全部集成到SiP里,因此HBM在节省产品空间方面也更具优势。
从图4可见,GDDR主要应用于桌面渲染GPU,终端是PC领域的传统游戏和专业可视化应用。随着人工智能(AI)训练和推理以及高性能计算的发展,我们看到数据中心对最快内存、高带宽内存(HBM)的使用越来越多。海力士第一版HBM3或许只是过渡方案,达不到最高6.4Gbps,但是哪怕采用GDDR6X的3090 Ti显卡已经突破1TB/s的大关,但是与马上面世的HBM3产品还是有5倍的差距。
奎芯布局LPDDR和HBM接口IP
奎芯科技致力于提供新款选型方案,从IP到Chiplet,加速推动集成电路产业进程,这一直是奎芯的产品愿景。在DDR类接口IP领域,针对实际应用场景和下游客户需求,奎芯以LPDDR和HBM为切入点,以LPDDR产品来满足移动设备、汽车电子以及终端AI推理的新增需求,以HBM产品来解决存储墙瓶颈,满足日益增长的AI训练算力增长需求。此外,继LPDDR4X成功流片后,奎芯科技LPDDR5X IP于今年5月份已正式提交流片。