本文是一部分Techxchange.:在边缘
机器学习(ml)只是动态可重新配置处理器(DRP)的任务之一瑞萨可以接受。DRP将在REZ / A2M微处理器等RENESAS平台中找到,该平台托管Cortex-A9,DRP为基于IOT边缘的ML应用程序进行了大量提升。
DRP由一系列处理元件(PE)组成,旨在有效地处理ML神经网络推理核心中常见的8个和16位数据(图。1)。系统还有多个MAC。一组FIFO通过系统管理数据流,DMA控制器将数据和配置信息的移动处理到与主处理器共享的系统内存。
1. Renesas的动态可重新配置处理器包括一系列处理元素,MAC和内存块;DMA控制器将数据流移动到主存储器。
renesas工具占用C代码并编译它以配置DRP。大多数ML应用程序的挑战是模型太大,无法在一次通过中处理。诀窍是DRP旨在从一个配置到另一个配置。
它实际上适用于两个级别:1 ns内的第一个交换机(图2),使用包含在本地存储器中的数据有几个级别。这种改变通常修改系统的一部分,允许包含在本地存储器中的多个配置。其他类型的交换机从系统存储器移动配置数据。此开关通常需要小于1毫秒,但可以加载多个配置。
2.当信息包含在本地存储器中时,DRP可以在1 ns中切换其配置。完整的固件交换机在系统内存中提出了不到1毫秒的位置。
第一类型的上下文将允许一次在神经网络内进行一层,以便一次处理部分,因为许多这些层的处理不适合一些DRP实现。短开关将在部分之间发生。
处理ML模型只是DRP可以编程的一部分。它能够管理许多流处理琐事,并且通常需要进行许多处理和后处理的琐事。在系统内存中具有这些,允许它们在处理所需的内容中交换。
使用DRP时,开发人员必须考虑时间,但其灵活性将使系统能够处理更广泛的应用程序。由于时间和容量限制,系统无法处理每个应用程序,但是快速切换的能力允许它解决许多超出了灵活系统范围的许多。
3. Renesas'AI RoadMap显示DRP给出边缘节点A 10x性能提升,未来版本提供类似的改进。
RZ / A2M只是来自瑞萨的基于DRP的解决方案中的第一个。Cortex-A9将为DRP配置和支持DRP,但DRP将用于提供高速流处理。这将DRP技术置于Renesas的AI支持的最前沿,目前的迭代在其基于软件的E-AI支持方面提供了十倍的改进(图3)。
重新配置系统的能力应允许瑞萨开发人员处理当前和最新的神经网络模型。RZ / A2M系列将能够支持许多ML应用程序,这些应用程序将带来大多数Cortex-A解决方案。
阅读更多关于此主题的文章Techxchange.:在边缘