DesignWare ARC HS 32 位处理器系列


“我们当时需要为SSD 控制器 寻找高性能、低能耗的处理器……Synopsys 经过硅认证的 ARC HS38 处理器只需消耗同类处理器一半的能耗,就能实现更好的性能,是最能满足我们要求的解决方案。” ~ Starblaze 科技

嵌入式应用的最大性能

DesignWare® ARC® HS 32 位处理器系列以可扩展的 ARCv2 指令集架构 (ISA) 为基础,并以经优化实现了最大性能效率(DMIPS/mW 和 DMIPS/mm2),使其非常适合需要高速数据和信号处理的嵌入式应用。所有的 HS 处理器都可在单核、双核和四核配置中使用。

ARC HS3x 系列包括支持多内核的 HS34、HS36HS38 处理器。HS34 是一款高性能、无缓存的处理器,而 HS36 则包括多达 64KB 的指令和数据缓存。HS38 针对运行 Linux 的应用进行优化,配备功能完整的存储器管理单元 (MMU),支持 40 位物理地址空间且页面大小可达 16 兆字节,能让设计人员对 1 TB 字节的存储器进行直接寻址,实现更快的数据访问和更高的系统性能。

ARC HS4x/HS4xD 系列包括 HS44、HS46、HS48、HS45D 和 HS47D 处理器,实施双指令超标量体系结构,提供每核高达 6000 DMIPS(典型条件为 16ff)的性能。HS46 和 HS48 提供指令和数据缓存(每个缓存高达 64 KB),完全支持一级 (L1) 缓存一致性。HS48 还包含 8 MB 的 2 级 (L2) 缓存和功能全面的内存管理单元 (MMU),该单元支持对称多处理 (SMP) Linux。HS45D 和 HS47D 还支持 150 多个优化的 DSP 指令,提供高性能控制和高效数字信号处理的独特组合。为了加速数学函数的执行,HS45D 和 HS47D 为设计人员提供了实施硬件整数分频器的选择,还提供了适用于 64 位乘积、乘积累加 (MAC)、向量加减和可配置 IEEE 754 兼容浮点单元(单精度、双精度或两种精度)的指令。ARC HS4xD 处理器与超低功耗 ARC EmxD 处理器兼容,并具有与其相同的指令集,因而在两个处理器系列间可以轻松迁移代码。

所有的 ARC HS 处理器均具有高度可配置性,能让设计人员在 SoC 上定制每个 HS 处理器实例以实现性能、功耗和面积的最佳平衡。

所有的 ARC HS 系列均受到软件和硬件开发工具构成的强大生态系统的支持,其中包括 MetaWare 开发套件(一套用于开发、调试和优化 ARC 处理器上嵌入式软件的完整解决方案)、MQX 实时操作系统 (RTOS) 以及业内领先的供应商通过 ARC Access Program 提供的第三方工具、操作系统和中间件的产品组合。

性能、功耗和面积 (PPA) 效率

ARC 优势:利用最小的面积和功耗达到最高性能

ARC 处理器内核经过优化,可实现嵌入式 SoC 行业最佳的性能/功耗/面积 (PPA) 效率。针对功耗敏感的嵌入式应用程序全新设计,ARC 处理器采用 Harvard 架构,通过同时进行的指令和数据存储器访问实现更高性能,并通过高速标量流水线实现最大功率效率。32 位 RISC 引擎提供 16 位/32 位混合指令集,提高嵌入式系统中的代码密度。

ARC 的高度可配置性和指令集架构 (ISA) 可扩展性使其具备了行业最佳的 PPA 效率。设计师能够添加或去除硬件功能,以便针对目标应用优化内核的 PPA - 杜绝浪费。ARC 用户还能够对内核添加自定义指令和硬件加速器以及紧密连接的存储器和外设,同时在处理器和系统级别上大幅提高性能和功率效率。

完整而可靠的商业和开源工具链专门针对 ARC 处理器进行优化,为 SoC 设计师提供了所需的开发环境,用来高效地开发满足所有 PPA 目标的基于 ARC 的系统。

可配置性

ARC 优势:仅实现您需要的硬件,以便优化 PPA

ARC 处理器具有高度可配置性,使设计师能够仅实现自己需要的硬件,从而优化 SoC 上每个处理器实例的性能、功耗和面积。ARChitect 向导具有内核拖放配置功能,包括以下方面的选项

  • 指令、程序计数器和循环计数器宽度
  • 寄存器文件大小
  • 计时器、重置和中断
  • 字节排序
  • 存储器类型、大小、分区、基地址
  • 电源管理、门控时钟
  • 端口和总线协议
  • 乘法器、除法器和其他硬件功能
  • 可获许可的组件,如存储器保护装置 (MPU)、浮点运元 (FPU) 和实时跟踪 (RTT)
  • 添加/删除指令

可扩展性

ARC 优势:添加用户定义的指令,以便加快代码执行并降低功耗

ARC 处理器扩展套件 (APEX) 技术使 ARC 用户可以轻松地对处理器添加自定义硬件,从而针对目标应用大幅提高性能和/或降低功耗。ARC 处理器支持以下扩展:

  • 用户定义的指令
  • 用户提供的硬件(例如 Verilog RTL)
  • 内核寄存器
  • 辅助寄存器
  • 条件和状态代码
  • 存储器映射块和紧密连接的外设

ARC 处理器扩展套件可使用户大幅改善性能、功耗和面积。例如,用户定义的指令可加快软件执行速度,使同样的代码运行的周期数大大减少(或者能利用同样的能量执行更多操作),这样可降低时钟频率要求,从而减少能耗。这还减小了代码尺寸,降低内存要求,从而节约更多成本和耗能。 

APEX 接口还可以让 ARC 用户将存储器和外设紧密连接到处理器,因此无需额外的总线基础架构。由此所得的"无总线"设计可进一步减少面积和延迟,在降低成本的同时,提高系统级别性能。

文章