最佳体验请使用Chrome67及以上版本、火狐、Edge、Safari浏览器 ×

创建银行
创建开票

    Arm发布最小的CPU

    编者:武花静@芯闻道 阅读78 来源: theregister 2025/02/28 01:52:34 文章 外链 公开

    Arm 预测 AI 推理很快就会无处不在。为了给设备提供所有神经网络处理所需的动力,该公司正在通过首款针对边缘工作负载的 64 位 Armv9 CPU 内核增强其嵌入式平台。


    软银旗下的英国芯片设计公司表示,人工智能发展正在迅速,并声称几年前网络边缘机器学习工作负载要简单得多,专注于基本的降噪或异常检测。


    Arm 物联网业务线高级副总裁兼总经理 Paul Williamson 表示:“以不起眼的门铃为例。”他补充说,它从一个简单的蜂鸣器发展成为一个基本的摄像头查看器,现在又发展成为一个更智能的人工智能驱动设备,能够确定它是否在检测人,甚至识别特定的个人。


    为了解决这一问题,该处理器设计公司推出了Cortex-A320 CPU 内核,旨在与 Arm 的嵌入式神经处理单元 (NPU) 加速器 Ethos-U85 搭配用于边缘 AI 片上系统 (SoC) 设计。它可以配置为四个内核的集群,以扩展并满足各种性能需求。


    Arm Cortex-A320 在边缘平台中的应用


    据称,A320 是“最小的 Armv9 实现”,提供 AArch64 指令集,是一个相对简单的单发射、有序、八级核心,L1 缓存高达 64KB,L2 缓存高达 512KB。很高兴看到 RISC-V 让 Arm 保持警惕。


    为了表明事物发展的速度,Arm 推出了一个边缘 AI参考平台,将 Ethos-U85 与微控制器级 CPU 核心设计 Cortex-M85 配对,迄今还不到一年。


    相比之下,Cortex-A320 是 Arm 全功能应用处理器系列的一部分,尽管它是一款“超高效”的处理器,基于较新的 Armv9 架构,并具有各种增强功能。Williamson 声称,新组合的机器学习性能是去年平台的八倍以上,并且能够处理超过十亿个参数的大型 AI 模型。


    Arm 支持 1B 参数


    威廉姆森说:“对于高效执行更大网络的硬件的持续需求正在推动内存大小的要求,因此具有更好内存访问性能的系统对于执行这些更复杂的用例变得非常必要。”


    “Cortex-A 处理器解决了这一挑战,因为它们比基于 Cortex M 的平台对更多可寻址内存具有内在支持,并且在处理多层内存访问延迟方面更加灵活。”


    在 Armv9 处理器系列中,Cortex-A320 被认为是迄今为止最节能的处理器,据称它仅使用 Cortex-A520(一些参考设计中使用的高效内核)的一半功率。


    转向 Armv9 带来了该架构中引入的安全功能,例如用于捕获内存异常的内存标记扩展,而对于 AI 处理,它还具有可扩展矢量扩展 (SVE2) 和对 BFloat16 数据类型的支持。


    软件开发也至关重要,Arm 在其 Arm Kleidi 库中为新的边缘硬件提供支持。其中包括用于构建 AI 框架的一组计算内核 Kleidi AI 和用于计算机视觉应用的 Kleidi CV。


    据威廉姆森称,这还支持 Armv9 中的优化,例如 Neon 和 SVE2,并集成到 llama.cpp、ExecuTorch 和 LiteRT 等流行的 AI 框架中。


    Cortex-A320 还能够使用 FreeRTOS 和 Zephyr 等实时操作系统运行应用程序,并支持 Linux。


    与其他 Arm 产品一样,授权商将负责围绕新的 Cortex-A320 和 Ethos-U85 构建芯片。该公司表示,预计明年将推出该芯片,但未透露将使用该芯片的具体合作伙伴或产品。


    除了网络边缘应用之外,其低功耗设计还使其适用于各种用途,包括智能手表和可穿戴设备。Williamson 表示,Cortex-A320 还可能是“服务器和基础设施中基板管理控制器的理想 CPU”。




    声明:本网站部分内容来源于网络,版权归原权利人所有,其观点不代表本网站立场;本网站视频或图片制作权归当前商户及其作者,涉及未经授权的制作均须标记“样稿”。如内容侵犯了您相关权利,请及时通过邮箱service@ichub.com与我们联系。
     0  0

    微信扫一扫:分享

    微信里点“+”,扫一扫二维码

    便可将本文分享至朋友圈。

      
    
    
    分享
     0
      验证