Computex 2017:ARM要Cortex-A75、Cortex-A55与Mali-72带来AI革命

ARM 今年在 Computex 所宣布的三项 IP 架构是相当重要的一个里程碑,因为对于 ARM 而言,全新的架构不仅是带来更强大的运算力,同时更是以人工智慧世代所需所规划,全新的 Cortex-A75 以及 Cortex-A55 所支援的 DynamiQ 可使工作负载更为最佳化,而 Mali-G72 则更进一步提升深度学习的性能,稍早也与 ARM 的技术专家针对昨天所发表的三项架构进行探讨。

DynamIQ 的特性先前已经进行多次的介绍,简单的说就是透过 Cluster 层的全新设计,使得单一 Cluster 能够容纳最多 8 核心,且同 Cluster 可容纳大核与小核,每个核心的时脉与电压更能独自管理,同时透过 Cluster 共用 L3 的方式提升协作性能;由于单一 Cluster 核心增加加上可针对不同应用的性能分化,对于人工智慧相关应用更能进行有效率的多工分配。

不过在日前所发出的资讯中, Cortex-A75 即便在 DynamIQ 设计下,仅能在单一 Cluster 具备最多 4 核心,若要达到 8 核心就需要搭配 4 核心的 Cortex-A53 ,但 Cortex-A53 则能在单一 Cluster 中配置 8 核心,其中的原因, ARM 副总裁 Nandan Naampally 也做出回答。

Nandan 表示,在单 Cluster 内仅能提供最多 4 核心的 Cortex-A75 的关键,是有实际情境以及架构设计双重考量;由于在行动装置应用最多仅能应用到四核心,而在运算系统中多半是以四核心作为一个单位的设计,若是在大型架构中,仍是可透过多 Cluster 串接多个 4 核心的 Cortex-A75 Cluster 。

在架构设计方面的考量,由于 Cortex-A75 属于高效能层级的核心,故对于频宽的需求也较高,若在单一 Cluster 中规划超过 4 核心,则会对共用记忆体的频宽产生较高的负担;其次是 Cortex-A75 的能耗与发热也较高,单一 Cluster 内若全为 Cortex-A75 则也会对能耗管理产生不利。

关于在今年即将发酵的 Windows on ARM 计画, Nandan 表示相当乐观其成,在微软与开发商的努力下,不少主流软体开发商将会针对 ARM 进行最佳化,并可在 Windows Store 提供原生支援 ARM 的新版软体,至于旧版 x86 软体则可透过模拟器的方式让 CPU 可支援,至于 GPU 则不需进行转译,故若执行旧版软体的效能会依照软体对 CPU 与 GPU 负担的权重而定。

至于 Mali-G72 则是 Bifrost 架构的第二款高效能 GPU ,不同于当初 Mali-G71 是针对行动装置设计, Mali-G72 锁定的范围更广泛,也包括工业相关领域如机器视觉以及自动驾驶应用,影像处理器事业部资深产品经理 Espen Oybo 表示, Mali-G72 不仅是从架构方面着手,同时也与业界如游戏引擎、演算法进行深度结合,使其在娱乐与深度学习领域有更高的效能。

不过目前 Mali-G72 的应用领域并非更深入往高效能运作发展,仍是以偏向行动装置以及嵌入式应用为主,而相较于 Mali-G71 , Mali-G72 的基础效能也再度提升 40% ,同时针对深度学习语法强化,亦可使在行动装置上使用深度学习应用如影像、语音辨识有更好的速度,而 Mali-G72 的最大核心则可堆叠到 32 核( MP32 )。

ARM 也在展示区展示其基于深度学习的影像辨识,这项应用中透过 CPU 、 GPU 与 Neon 彼此协作,并藉由具备测距的相机镜头,可针对物体的尺寸与类别进行分辨,能够判读如桌上的苹果、柳丁、葵花子等的质量以及卡路里。

 

本文经Cool3C授权转载

Source :

About author