可扩展的高性能RISC-V 内核IP

2020年02月28日

SiFive推出的SiFive U8系列核心IP是一种面向现代SoC设计具有可扩展性、高性能的微架构。SiFive U8系列是当今商用化基于RISC-V指令集架构中性能最高的内核IP,它具有超标量乱序流水线,可对流水线深度及发射队列宽度进行配置。 SiFive U8系列内核IP专为对性能和延迟敏感的市场而设计,例如汽车、数据中心、AI边缘和终端深度学习SoC

当今社会对于采用深度学习和实时低延迟处理来解决问题的需求正在不断地增加企业的工作量,这些任务被最终转移到了边缘和终端设备上。特定领域的SoC被用于本地化运算,以减少延迟,提高工作负载的性能和效率。对于现代SoC的需求包括可扩展的处理器内核,这些处理器内核应该涵盖当前的处理技术,支持可配置的设计并允许被定制。

基于开放、免费可用的RISC-V指令集架构,SiFive U8系列内核IP可以很好地应对这些挑战。SiFive U8系列微架构是完全参数化的,可生成大量配置参数,从而使得客户能够在设计界面上进行操作,并根据所需工作负载对性能指数进行精细调整。

一,SiFive U8系列标准内核

SiFive将提供SiFive U8系列的两款标准内核IP。标准内核产品正是针对功耗和面积进行了优化的SiFive U84内核,以及具有矢量处理功能的SiFive U87内核。专注于优化效率的SiFive U84是一款业界领先的标准内核。有关SiFive U87的更多详细信息将在以后发布。

二,完美高效的性能

从以往的内核来看,SiFive U84内核的性能竟然比广受欢迎的SiFive U74标准内核高出3.1倍,每个时钟的指令(Instruction Per ClockIPC)增加了2.3倍,最高频率性能增加了1.4倍。如下所示,采用7nm工艺的SiFive U84性能比SiFive U54采用的隔离工艺高出5.3倍。而与采用28nm工艺的SiFive U54标准内核相比,SiFive U84标准内核性能高出7.2倍。

三,面积效率处于优势地位

一个四核SiFive U84 CPU搭载了2MBL2高速缓存,在7nm工艺制程技术中仅需要2.63mm2,同时能够以高达2.6GHz的时钟速度运行。不含L2缓存的单个SiFive U8系列CPU内核的版图面积仅为0.28mm2。在不影响性能的情况下,缩减了如此大的面积可降低整体解决方案的成本,亦或者允许将这些硅面积用于新的运算功能。

Arm®Cortex®-A72处理器相比,SiFive U84标准内核的面积效率提高了2倍,每瓦特性能提高了1.5倍。

四,卓越的可扩展性能

SiFive U8系列内核IP可适用于从大众市场到前沿技术的各个工艺节点。在如此广泛的代工选项中,具有新型高性能CPU特性的SiFive U8系列IP通过了适应性验证,这使得SiFive U8系列在设计目标和SoC设计支持方面的可扩展性处于市场领先地位。

SiFive U8系列可扩展性不止于此,SiFive客户还可以在整个乱序设计的超平面空间内配置选项。SiFive U84标准内核不仅配置了12级流水线和3发射功能,而且其流水线深度,发射队列数和其他选项均可以进行调整,以完全适配目标市场的应用。

SiFive U8系列微架构可扩展性选项包括当浮点队列为空时,从整数单元到浮点单元交叉发射的功能。当与发射队列数量的设计伸缩性与设计中的浮点单元结合使用时,这种灵活性就可以根据工作量显著提高性能。

SiFive U8系列核心IP还具有可组合的缓存,并可提供实时操作支持。对于需要低延迟,确定性行为的市场而言,具备了配置高性能OoO内核来实现稳定的运行,同时保持微小面积的优势和卓越效率的能力,使得SiFive U8系列当仁不让地成为汽车行业、企业、边缘或终端AI市场的首要选择。

五,SiFive 混合+匹配

SiFive支持由不同类型内核组成异构内核群组(heterogeneous core complexes)的功能。SiFive Mix + Match通过混合多个内核来设计处理器内核群组,从而为目标工作负载提供适当级别的处理能力。最重要的是,SiFive自定义指令扩展(Custom Instruction Extensions)允许通过新指令启用任何内核,从而使工作负载加速变得简单且容易。来自第三方的自定义加速器IP(Custom Accelerator IP)可以完全包含到SiFive TileLink 相干高速互联(coherent fabric)中,用于核与核之间的通讯,或者将其完全包含到SiFive ChipLink相干高速互联中,用于芯片间的通讯。

SiFive还提供高带宽存储器接口IP,用以支持SiFive TileLink和行业标准协议,这种接口IP针对SoC设计,或面向存储器密集型工作负载需要具备最新的HBM2E+存储器功能的小芯片(chiplet)类型设计。随着目前正在进行的7nm12nm的工艺制程验证,SiFive正在将高性能DRAM功能从现有的16nm工艺扩展到前沿技术。

总结

今天,对新型高性能SiFive U8系列内核IP的介绍开启了现代SoC设计的新篇章。性能、面积效率和能效是芯片设计人员的关键指标,而SiFive U8系列在各个方面都表现抢眼。SiFive这种独有的可配置方法可根据客户需求对IP进行精细调整,从而为追求高性能应用处理器内核的市场释放出下一代SoC的全部潜力。

补充说明

1,基于具有L2高速缓存的SiFive U84内核每平方毫米功率和SPEC Int/GHz per Watt16nm工艺的Arm® Cortex®-A72进行的内部评估。

2,基于与使用等时和等频方法的SiFive U7系列进行比较的内部评估。

©2019 SiFive保留所有权利。本文引用的所有商标均属于其各自公司。 PCI-SIG®,PCIE®和PCI HOT PLUG设计标志是PCI-SIG的注册商标和/或服务商标。Arm和Cortex是Arm Limited(或其子公司)在美国和/或其他地方的注册商标。Arm字样和logo是Arm Limited(或其子公司)在美国和/或其他地方的商标。

本文源自SiFive Blog,作者:James Prior, Senior Director of Product Marketing Communications SiFive。经翻译整合之后进行转载,其目的在于传递更多信息,版权归原作者所有。

原文链接:

https://www.sifive.com/blog/incredibly-scalable-high-performance-risc-v-core-ip

返回