1. EdgeAITech首页
  2. 项目

详解ARM近期发布的物联网设备边缘AI芯片Cortex-M55

2月11日,软银集团旗下芯片设计公司ARM正式发布了针对物联网设备的AI芯片设计——Cortex-M55。
Cortex-M55是一款面向嵌入式市场的芯片设计,是首款基于ARM Helium技术的处理器核心架构的方案,全新架构让Cortex-M55拥有了执行SIMD指令的能力,得益于此,它的数字信号处理能力提升了5倍之多,而机器学习的性能提升高达15倍。

2020-02-27T00:53:01.png

此外ARM还发布了一款神经处理单元Ethos-U55,Ethos-U55 NPU旨在加快机器学习,而U55的设计将更加精简,且只能与较新的Cortex-M处理器(如M55、M33、M7和M4)协同工作,其处理单元的规模也是可扩展的,最小只有32个MAC引擎,最大可以配置到256个MAC引擎。

这样的设计旨在实现本地运行人工智能软件所需特殊类型的数学运算,将人工智能功能植入诸如用于检测人类语音或其他数据流的传感器等微型设备。

ARM高级副总裁兼汽车及物联网业务总经理Dipti Vachani表示,让人工智能在相对低功耗的设备上运行,而不是必须与基于云的数据中心保持持续通信,这对数据安全和隐私至关重要。目前,大多数人工智能的工作负载都在这些数据中心中运行。

ARM强调,这些芯片技术功耗相当之低,只要一块电池就能工作数年,并且只有在有需要时才会进行联网。

搭载该设计的芯片产品将于2021年上市。

过去几年,机器学习技术的应用已变得相当普及,可见其在广泛的行业和各种系统中。ARM 认为终端 AI 市场会在未来几年中迎来爆炸性增长,新 IP 就是为此做准备。

2020-02-27T01:00:06.png

首先介绍下 Cortex-M55,它是与 M33 联系更加紧密的新一代 IP,引入了体系架构上的新改进,能够在机器学习和矢量指令方面实现较大的性能和灵活性改进。

Ethos-U55 是专用的 microNPU 推理加速器,可与 Cortex-M 系列 CPU 结合使用,带来专门面向于 NPU 的性能与能效提升。

2020-02-27T01:00:48.png

与 Cortex-M 系列内核一样,Ethos-U55 的空间占用也比较少。至于 Cortex-M55,则是首款具有 Helium / 定制指令能力的 CPU 内核。

Helium 特指 M-Profile Vector Extension(简称 MVE),属于 M 系列 CPU 中的新矢量扩展和专用矢量执行单元,使之成为该范围内首款具有单指令多数据流(SIMD)功能的产品。

2020-02-27T01:02:40.png

新增功能使得新内核的 DSP 性能提升了 5 倍,结合针对机器学习工作负载的优化指令和 MVE,整体表现可提高至 15 倍。

整体微架构方面,新 IP 算是继承了 M33 和 µarch 。在频率提升的加持下,它将标量工作负载的性能提升了大约 20%,具体取决于供应商的配置。

2020-02-27T01:02:58.png

新内核的设计重点,同样体现在带宽上。其启用了需要带宽的新 MVE 和机器学习工作负载,因此对内存子系统进行了改进,比如 4×32-bit 接口与紧密耦合内存(TCM)。

尽管 ARM 进入 NPU 领域的时间相对较晚,但新推出的 Ethos-U55 microNPU,还是较嵌入式市场有着独特的意义。与移动 SoC 上更大的 Ethos-N 系列相比,它的面积和功耗要低得多。

2020-02-27T01:03:15.png
Ethos-U55 是一种小型 NPU,可从 32 路扩展到 256 MAC、且需要与 Cortex-M 系列 NPU 耦合。

ARM 未提及微体系架构的主要细节,但可知它是一种非常精简的设计,注重的是面积和能源效率、具有较小的内存占用量,其中包含我们在 N 系列产品中见到的一些特性,如 Weight Decompression 。

2020-02-27T01:03:28.png

即便如此,它与 N 系列在功能上并没有太大区别,因为该 IP 已包含 M 系列 CPU 。据说其架构与 NPU 有所不同(与更大的兄弟无关),且是专门为低功耗用例而设计。

就面积大小而言,U55 最小的 32 MAC 实现,约为 M55 的 2 倍。这里没有绝对的数字提供,实际上讨论的是平方毫米的分数。

2020-02-27T01:03:36.png

与上一代解决方案相比,使用 M55 和 U55 的此类系统,其性能改进意味着相当重要的步进功能提升。与基于 Cortex-M7 的系统相比,ARM 带来了包含 50 倍的性能提升、以及 25X 的能效改进。

至于新 IP 的可用领域,ARM 展望了各式各样的嵌入式系统(主要是现有的芯片子系统)。比如在移动设备上,厂商可在手机的指纹传感器、语音助理(实时监听指令)、甚至在 RF 系统中(如天线调谐)使用它来优化工作负载。

当今的移动设备中,有数百种 M 系列 CPU 可从机器学习功能中获益,且其中大多数功能对用户来说是完全透明的。

目前 ARM 已向主要合作伙伴开放 M55 和 U55 的授权,并将在未来几个月内向更广泛的客户群开放,预计最终产品可在厂商二次开发的两年后走向市场。

ARM所发布的芯片技术功耗非常之低,这使得诸如传感器之类的相应设备只需要一小块电池即可工作数年时间,并且只有在需要时才会连接到互联网。ARM高管表示,减少网络连接有助于保护隐私,公司芯片技术采用的方法是在本地处理数据,只将必要的数据发送到远程服务器。

ARM汽车和物联网业务高级副总裁兼总经理凡卡妮(Dipti Vachani)表示,医疗保健等许多领域更多是在本地处理数据,很少或根本不需要将结果发送回远程服务器。“你可能不希望这些数据四处移动,”凡卡妮说。她还表示,新技术“将为你提供低功耗芯片,在你想要保存数据的最适合地方处理数据。”

Arm主要向高通等移动芯片供应商和苹果等移动终端制造商提供芯片架构技术。近年来,该公司一直在寻求客户群的多样化,并开始将部分业务转移到自动驾驶汽车等市场。Arm的业务也延伸到物联网等领域,涉及交通或网络变压器及自动化设备农业灌溉系统。

原创文章,作者:xgl,如若转载,请注明出处:https://edgeaitech.com/102

发表评论

登录后才能评论