韵律将其机器学习(ML)扩展为Tensilica DNA 100深神经网络处理器(见图),它包含Tensilica DSP支持来处理新的网络层。它针对诸如自主车辆,机器人,无人机,监控系统和增强和虚拟现实的终端节点应用程序,其中采用神经网络推理系统。
Tensilica DNA 100架构可扩展为0.5至12 TMAC(千年乘法累积)-CAN提供高达3.4 TMACS / W.其稀疏计算引擎提供高MAC利用率,同时降低功率要求。稀疏计算发动机支持可以加倍,没有修剪或三倍,具有修剪,系统的吞吐量。
Tensilica DNA 100的稀疏计算引擎在降低功耗的同时提供了高MAC利用率。
系统通过权重和激活值压缩来减少带宽需求。为了减少计算量,它只需要处理非零的MAC计算。提供了加速器来处理非卷积层支持,包括池化和Eltwise操作。系统是可编程的,包括DSP支持,以处理新的软件需求;体系结构层是可定制的。该系统兼容Tensilica指令扩展(TIE)和DNA 100有自己的直接内存访问(DMA)支持。
可以使用芯片上的多个DNA 100处理器构建较大的系统。这些链接在一起使用芯片(NOC)配置;芯片片(C2C)链路可用于跨芯片缩放。
“Our customers’ neural-network inference needs to span a wide spectrum, both in the magnitude of AI processing and the types of neural networks, and they need one scalable architecture that’s just as effective in low-end IoT applications as it is in automotive applications demanding tens or even hundreds of TMACs,” says Lazaar Louis, senior director of product management and marketing for Tensilica IP at Cadence. “With the DNA 100 processor and our complete AI software platform and strong partner ecosystem, our customers can design products with the high performance and power efficiency required for on-device AI inferencing.”
软件支持包括与先前Cadence ML平台合作的Tensilica神经网络编译器。该系统包括网络分析器和量化器到8或16位权重,网络优化器,DMA和图块管理器以及特定于目标的库选择。该体系结构也与Android神经网络应用程序兼容。