去年,手臂交付了第一个Neoverse解决方案针对企业和云计算。Neoverse N1和E1平台现在已经上市(图1).N1体系结构应用于亚马逊的引力子处理器,它在许多AWS安装中使用。
现在,Arm发布了下一代系统——代号为Zeus的Neoverse V1和代号为Perseus的Neoverse N2平台。与现有的Neoverse N1实现相比,V1和N2分别提供了50%和40%的性能提升。
这一领域由英特尔平台主导,但Neoverse解决方案凭借其能效给它们带来了相当大的竞争。数据中心正在发生重大变化,从合并fpga SmartNICsgpgpu到机器学习(ML)加速器。
新的Neoverse平台通过bFloat16支持和可伸缩向量扩展(SVE)来解决ML和高性能计算(HPC)应用程序。SVE在更宽的矢量单元上处理SIMD整数、bfloat16或浮点指令(图2).SVE的一个关键特性是编程模型与数据宽度无关。向量可以是128位到2048位。除了提供更高的性能外,这还简化了编程。
虽然云计算和高性能计算环境是Neoverse架构的主要用途之一,但它并不是Arm的唯一目标。高性能优势是Neoverse的强项,尽管它的内核更少(图3).从积极的方面来看,功耗要求也降低了。5G边缘基础设施可以受益于Neoverse架构能够带来的大量节能核心。
根据应用的需要,不同的配置可以填充机架空间。Neoverse V1似乎将大量的HPC内核打包到一个芯片中,而Neoverse N2则将更多的内核打包到一个芯片中(图4).一个典型的双插座主板将容纳数百个核心。
v系列通过更大的缓冲区、缓存和队列提供最大的性能。n系列优化了性能和功率,而e系列优化了功率效率和面积。目前,N2带有双128位SVE管道,而V1有两个256位SVE管道。
CCIX(发音见6)和CXL是两个基于PCI express的处理器间通信链路(图5).Neoverse的早期版本支持CCIX;最新的版本支持两者。CXL被用来分割内存扩展,而CCIX提供一致的、异构的多核互连。
Neoverse已经入侵了数据中心。NXP的LX210A基于neoverse的系统芯片(SoC)等平台瞄准5G RAN解决方案。这批最新的新架构可能会改进这些现有解决方案。