手臂继续用最新的三核(包括Cortex-A55和Cortex-A75 cpu)挑战极限(图1)和马里-G72 GPU。这些利用ARM最近宣布的优势Dynamiiq架构.这一组合的目标是高端移动领域,以及利用机器学习和增强、混合和虚拟现实(AR/MR/VR).
核心集群有私有L2缓存和一个4mb的共享、16路集合关联的L3缓存,最多可以划分为四个组。重新分区可以在运行时由操作系统或管理程序完成。DynamIQ L3 cache snoop control unit (SCU)由集群中的所有内核共享。SCU是DynamIQ共享单元(DSU)的一部分,除了高级电源管理支持外,该共享单元还包括用于紧密耦合加速器的低延迟接口。
群集可以包含最多8个CPU内核的任何组合(如典型的4到4大.Little配置)到更多设备特定平台(如一个Cortex-A75和七个Cortex-A55S,反之亦然)。这允许开发人员选择最适合其应用程序的组合。最新组合支持Dynamiq Energy Inview Schoiling(EAS)支持。
Cortex-A75提供了50%的性能,即其Cortex-A72和Cortex-A73 Siblings。同样,Cortex-A55比Cortex-A53在Cortex-A72和Cortex-A73中发现的Cortex-A53,Cortex-A55比Cortex-A53更高的高功率效率为2.5倍。Cortex-A55建于ARMv8.2规范。有序CPU具有非常小的芯片尺寸,高度节能。Cortex-A75的面积比Cortex-A55更大2.5倍,但比Cortex-A73快20%以上。
该系统允许从单独控制内核到缓存管理的细粒度电源管理。当需要时,L3缓存的部分也可以关闭,例如在大部分系统可以关闭时执行音频或视频播放。
Cortex-A75和Cortex-A55在早期平台上提供了许多增强功能。这包括对Type 2管理程序(如Linux的KVM)的虚拟主机扩展(VHE)的需求。它支持原子操作、扩展缓存存储和更宽的256位AMBA 5接口。清除到持久内存特性是为将来的非易失性内存层次结构设计的。
INT8面向的DOT产品针对神经网络和机器学习应用。基本上,深神经网络(DNN)非常适合使用较小的重量值,并且8位通常超过足够。这允许CPU有效地处理这些矩阵操作。还调整GPU以处理此代替较大的整数或浮点数。
ARM还提供了新的分支预测支持,采用类似神经网络的方法。这不是第一次使用这种方法。amd的ryzen.还使用神经网络结构来支持分支预测。
一个典型的系统通常包括Mali-G72 GPU,以及其他已经可用的显示和视频支持,比如Mali-V550视频子系统(图2).Mali-G72 GPU扩展了ARM的Bifrost架构,提供了1.4倍于早期子系统的性能。它还得到了增强,以支持dnn。它的通用矩阵乘法(GEMM)比早期的Mali gpu节能17%。
Mali-G72 GPU还针对具有多视图绘制支持的AR / MR / VR空间。多视图支持是呈现两个几乎相同的图像,每只眼睛一个。支持AR / MR / VR的软件可以利用此硬件加速度,允许更高的帧速率降低开销和较低的功率要求。
GPU包括额外的AR / MR / VR增强功能,例如多采样,抗锯齿和FOVEATED渲染。这是在眼睛聚焦的区域上完成更高清晰度处理的地方。这是通过跟踪眼睛在寻找的地方来完成的。
Mali-G72 GPU还具有自适应可扩展的纹理压缩(ASTC)支持。事务消除(TE)支持在16乘16像素块上工作,以识别两个连续呈现的目标之间的相同块。智能成分功能将TE扩展到用户界面组合系统的每个阶段。它消除了读取和处理相同信息的需要。
高保真度游戏市场也得到了Mali-G72的支持。与malig - g71相比,它节省了87%的带宽。这由像素本地存储(PLS) G-Buffer处理。
Cortex-A55、Cortex-A75、Mali-G71可以单独使用,但都是集成设计的。它们可能最终会成为移动领域的高端系统级芯片(SoC)解决方案。