ARM提供了一些关于其下一代架构,即DynamIQ的见解(图1).该架构改进了64位、多核Cortex-A与硬件加速器的集成。这将允许开发者整合针对人工智能应用的片上加速单元。
这样做可以在这些应用程序中提供50倍的提升,与现有的架构相比,处理集群和硬件加速器之间的通信响应时间提高了10倍。关于这个巨大的改进是如何实现的细节仍然是模糊的,但ARM确实揭示了系统性能为什么会增强的一些原因。
1.ARM的下一代DynamIQ架构针对的是人工智能应用。
DynamIQ体系结构是围绕8核集群构建的(图2)与当前的4核集群方法相比。它重新设计了内存子系统,将与新的ARMv8.2 Cortex-A内核一起工作,并与DynamIQ兼容。还有一个新的硬件加速器接口,可以连接到集群。
2.DynamIQ体系结构在一个集群中最多支持8个核心,这些核心可能都是不同的配置。
DynamIQ扩展了大。小方法(图3)通过允许集群中的每个核心是不同的。这允许以最佳方式利用每个核心。大。LITTLE操作系统支持通常用于现有系统,这些系统通常有两种不同的核心类型,通常位于不同的集群中。该系统还将允许更细粒度的速度控制和电源管理。核心可以独立管理。
3.DynamIQ扩展了大。小方法allowing each core to be used in an optimized fashion as prescribed by the operating system and applications.
该架构将包括一些支持新功能的新指令,并与加速器集成,包括增强机器学习(ML)和人工智能(AI)的指令。它还旨在促进对ASIL D解决安全关键应用的支持,如汽车高级驾驶员辅助系统(ADAS)和自动驾驶汽车。
内存子系统的重新设计提供了改进的、紧密耦合的内存。内存块可以单独管理以节省电力,而且缓存系统已经被重组以更好地处理多级缓存设计。
加速器接口将是一个开放的标准,就像ARM目前的AMBA接口一样。供应商可以创建兼容的设计,允许开发人员轻松地合并第三方硬件。