基于IP的SoC设计如何推动动态的、多样性的HPC需求实现全面增长

Synopsys Editorial Staff

Sep 22, 2021 / 1 min read

在芯片设计领域

在芯片设计领域,使用经硅验证IP是一种行之有效的做法。

事实上,这种既能节省时间又能提高质量的复杂片上系统(SoC)开发方法的使用范围越来越广,普及率越来越高。特别是在高速增长的动态细分市场中,基于IP的设计已被证明是一种可以显著缩短开发时间、确保输出更高质量的产品、以及提高工程人员工作效率的手段,便于工程人员专注于独特的增值和差异化工作。

这一点尤其适用于快节奏的高性能计算(HPC)领域。

过去几年

过去几年,芯片开发人员找到了更高效的创新方法将更多的动力封装到体积更小、能效更高的芯片和互连程度更高的硅架构中,导致HPC的作用范围不断扩大。曾经专属于大规模、超高端计算领域的HPC应用现已出现在各个市场领域,从企业到消费者再到汽车、甚至边缘应用。

HPC市场增长的主要推动力是数据消耗量巨大且增长迅速。

超大规模企业纷纷建设大型数据中心来管理数字流量的巨幅增长,便是简单直接的证明。但这是一种渗透到我们超级互联社会各个方面的趋势。我们看到在线协作、智能手机和其他物联网设备、流媒体、AR/VR应用以及互联人工智能(AI)设备都带来了数据流量的大幅增长。

所有类型的芯片开发商 — 包括直接提供数据中心资源的公司 — 都在努力开发新的芯片架构来满足这些数据密集型需求,尤其是在那些必须扩展到前所未有的水平能满足需求的传统关键领域,例如计算、存储和网络等。除此之外,数据消费正在推动其他新兴领域对创新方法的需求。例如,将云服务扩展到网络边缘需要新的计算和存储模式。再例如,广泛部署AI来处理海量数据并从中提取洞察的趋势,也在推动提高芯片性能、容量和互联水平。此外,随着机器对机器通信、流媒体视频、AR和VR以及其他应用所生成的数据量不断增加,您必须重新审视整个云基础架构。

所有这些都在推动开发商开发新一代的方法,以便在更大限度地减少数据移动的同时尽量加快数据在两个位置间的传输速度,无论是长距离传输还是服务器内的芯片间传输。

无论在何种情况下,SoC和系统开发人员都希望借助经验证、可扩展且能够快速集成的IP来获得关键能力,以满足高级HPC应用中固有的数据处理、组网、存储和安全需求。SoC 的设计人员需要高性能和低延迟 IP 解决方案的组合来提供性能体检,以便帮助为不同的应用领域的 HPC 提供总系统吞吐量等优势。

以下是IP可以帮助HPC实现的一些关键功能…

计算处理 — 尤其是在数据服务器中

数据量的增加要求在服务器内部和之间传输数据的服务器接口不断提速。任何障碍或不佳连接都会产生不理想的延迟,从而对用户体验产生诸多不良影响。尽可能减少数据移动并在需要时提供高带宽、低延迟接口来转移数据是超大限度地提高性能和减少延迟与功耗的关键。

可以利用IP来满足这些要求的一些重要领域包括:

  • 实施正在向6400 Mbps演进的DDR5接口
  • 支持PCI Express (PCIe)接口从16 GT/s PCIe 4.0到32 GT/s PCIe 5.0再到64 GT/s PCIe 6.0的演进
  • 简化NVMe SSD从PCIe 3.0升级到PCIe 5.0实现4倍带宽的过程
  • 利用Compute Express Link (CXL)允许多个处理器/加速器高效共享数据和内存,从而减少需要在系统中移动的数据量
  • 利用56 Gbps和112 Gbps的新型高速SerDes技术,以便借助PAM4编码和支持协议来加快设备间的接口速度,包括裸晶、芯片、加速器和背板

除上述接口外,各类内存也可以满足HPC用例的容量、功率和性能要求。当内存容量是主要考虑因素时,DDR5就是理想的选择。当内存带宽是非常重要的考虑因素时,HBM2E可以提供对内存中数据的高速访问。

网络基础设施

数据创建和消费量的增长要求加快网络速度。以太网已成为现代HPC应用(尤其是数据中心)中服务器间通信的标准。以太网数据帧通过各种通道和介质类型在服务器单元中传输。将MAC和PHY集成在以太网系统中可以缩短设计周期并提供差异化​​性能。许多数据中心都在努力将服务器与置顶式(ToR)交换机之间的网络接口速度从25 GbE提高到100 GbE,并在ToR交换机与Spine-Leaf(分布式)交换机之间以及数据中心设施之间安装400-GbE基础设施。

领先的以太网交换机供应商已经开始开发基于112G SerDes的800-Gbps交换机,随着数据量的不断增加,未来几年内可能会推出1.6-Tbps以太网。支持400 Gbps以太网端口的基础设施交换机可通过56G x 8或112G x 4 SerDes电接口实现。

所有这些都推动了对可靠IP的需求,以提高设计人员的效率。为此,新思科技提供了具有PC、PMD、PMA和自动协商功能的全套200G/400G和800G以太网控制器和PHY IP解决方案。

安全性

除了更快的接口和更高效的内存外,保护数据对云计算来说也是至关重要的。为了严格保护授权用户数据的机密性、完整性和可用性,标准组织正在将安全要求纳入数据接口协议。在这些高速接口中为了实施必要的安全算法需要:用于数据加密和解密的高质量加密IP、用于实施高速安全协议的安全协议加速器IP、以及用于提供信任根和安全密钥管理的可信执行环境。

新思科技提供一个广泛的、高度集成的安全IP解决方案组合,这些解决方案使用一组基于标准的通用构建块和安全概念,可在HPC应用中实现更高效的芯片设计和更高级别的安全性。这些安全IP解决方案有助于防止联网设备中不断演变的各种威胁,如盗窃、篡改、侧信道攻击、恶意软件和数据泄露等。

存储

当下存储技术正在推动增长的数据量得到良好管理,同时促进使用加速器来处理数据,推动了计算存储、持久性内存、持久性存储的缓存一致性接口、以及旨在加快数据传输速度的下一代NVMe接口的使用。

基于NVMe的固态硬盘(SSD)可以利用PCIe接口直接连接到服务器CPU并用作缓存加速器,从而以极快的速度缓存频繁存取的数据或“有效”数据。基于PCIe的高性能NVMe SSD具有极为高效的输入/输出性能和低读取延迟,可以提高服务器效率并防止必须通过外部存储设备访问数据。

在存储应用中使用缓存一致性接口允许多个设备跨越共享内存来保持缓存一致性,从而提高性能并减少数据移动。其中CXL就是这样的接口。CXL 2.0基于PCIe 5.0构建,允许缓存、内存和I/O设备以32 GT/s的速度传输数据。NVMe存储设备采用PCIe 5.0接口,将SSD吞吐量提高到每PCIe通道4 GB/s,是x86服务器中迄今为止常用的PCIe 3.0接口的4倍。

新思科技的 DesignWare Interface IP产品系列支持PCIe、USB和DDR等高速协议并经过优化处理,以帮助设计人员满足云计算存储应用的高吞吐量、低功耗和低延迟连接需求。

视觉计算

云应用经过不断发展演进,现已覆盖更多的视觉内容。因此,支持视觉计算 — 包括用于商业应用和娱乐(的流视频以及图像分析)— 已经成为云基础设施的一项附加功能。视觉计算作为一项云服务以推动供应商将高性能GPU集成到了云服务器中,同时通过高速加速器接口与主机CPU基础设施相连接。

嵌入式视觉应用通常会带来与数据中心用例相似的独特的功耗和成本挑战。它们需要具备一定程度的灵活性来满足快速发展的市场、用例和标准需求。

新思科技可提供一套完全可编程和可配置的IP核心,这些核心已经针对嵌入式视觉应用进行了优化处理,兼备软件解决方案的灵活性与硬件的低成本和低功耗优势。嵌入式视觉处理器集成了可选的高性能深度神经网络(DNN)加速器,用于快速准确地执行卷积神经网络(CNN)或递归神经网络(RNN)。视觉处理器可以轻松集成到SoC平台中,可与任何主机处理器一起使用,并与主机一起运行。

边缘基础设施

使计算更接近数据是HPC领域的增长趋势之一。这不仅能够提高效率和性能,而且还能带来安全优势。为此,云服务提供商正在与电信公司合作,在多接入边缘计算(MEC)平台中提供云服务。然而,在边缘基础设施中部署云服务需要运行云服务的设备能够适应边缘环境。边缘位置的物理空间、环境控制能力或电源可用性可能无法与典型的云数据中心相提并论。因此,延迟容忍度越低,越需要靠近边缘部署服务,服务对功耗的容忍度可能也越低。

用于上述关键计算、网络、存储和内存功能的新思科技IP产品已经过优化处理,能够满足边缘应用的性能、低延迟和低功耗要求。

机器学习和AI加速器

专为边缘计算设计的AI加速器旨在更大限度地减少延迟和功耗,同时提供了AI所需的卓越计算能力,包括了大规模矩阵乘法和张量运算。

PCIe和CXL提供高带宽通道,将加速器与应用处理器相连接,从而避免高强度计算操作。对于边缘系统和云系统,单个加速器裸晶通常不具备负载处理所需的性能,因此需要安装多个加速器。56 Gbps/112 Gbps SerDes和HBI并行接口等高速芯片间接口使AI加速器解决方案能够通过扩展来满足这些需求。

开放计算项目(OCP)组织正在推动芯片间互连的标准化工作,以期简化和提高加速器扩展接口的互操作性。其目的是为异构“小芯片(chiplet)”提供通用接口,以支持通用功能构件的SOC。如果一旦被业界采纳,这项工作将通过减少开发时间和相关成本来简化加速器SOC的开发过程。

基于IP的设计能够满足HPC应用需求

强大且经过验证的处理、接口和基础IP产品已经过优化处理,能够满足任何HPC应用的高性能、低延迟和低功耗需求。新思科技提供全面的高质量硅验证IP产品组合,使设计人员能够开发当今和未来HPC应用的SoC。

Continue Reading