3月底,Arm正式发布了Armv9指令集,号称十年来最重要的创新,在兼容现有Armv8的基础上,重点强化了安全性、矢量计算、机器学习、数字信号处理,同时继续加强性能,IPC提升幅度高达30%。
今天,Arm又发布了第一个基于Armv9指令集架构的平台“Arm Neoverse N2”,在安全性、能耗、性能等方面都有全面的提升,可为新一代基础设施核心铺平道路。
Neoverse N系列平台最为注重性能的扩展性、平衡性,特别针对单位功耗、单位面积的性能,以及单位功耗、面积的核心数。
相比主要搭档7nm工艺的上代平台N1,新一代N2最佳搭档是5nm,两相对比在保持相同水平的功率、面积效率的基础上,N2的IPC同频性能(约等于单线程性能)可提升达40%,而频率也可以提高10%。
N2平台可以横跨从高吞吐量计算到功率与尺寸受限的边缘、5G应用场景,且性能提升明显,例如在云端上提升1.3倍的NGINX,在5G和边缘应用上提升1.2倍的DPDK数据包处理,以及提升1.4倍的SPECint2006。
N2平台内部集成了Armv9.0-A CPU核心、指令集单元、64KB一级指令缓存、64KB一级数据缓存、512KB/1MB ECC二级缓存、异步桥接(Async Bridges)、AMBA 5 CHI直接连接、CoreSight等模块,微架构全方位改进,重点增强基准测试、实际服务器工作负载。、
而在外部系统连接中,它可以支持DDR5内存、PCIe 5.0总线、HBM3高带宽内存,等等。
N2还是第一个具备SVE2功能的平台,可为云到边缘的性能效率带来巨大的提升,比如机器学习、数字信号处理、多媒体、5G等场景中,还具备编程简易性、可移植性等优势。
SMT同步多线程是如今处理器架构设计的一个核心要素,不过另一方面,在云端等共享环境中,专属内核可以提供更具可预测性、确定性的性能,而且更有利于抵御常见的侧信道攻击,这也是N2的理念。
同时,它维持了相同的功耗、面积效率,加入了性能定义功耗管理(PDP)。
N2平台起步就是32核心32线程,最多可以做到128核心128线程,对比N1平台翻了一番,同时比传统架构的64核心128线程更具竞争力。
生态方面,Marvell美满电子已经发布了基于Neoverse N2平台的OCTEON系列网络解决方案,预计2021年底前试产,相比上代性能提升高达3倍。
阿里云在即将上线的Arm架构ECS实例上已经完成测试,SPECjbb测试数据表现惊艳,而且基于Arm架构运行的DragonWell JDK性能提高了 50%。
腾讯也在硬件测试和软件支持方面持续投入,云应用上已经可以采用Arm Neoverse技术。