脑壳已揭示其Akida神经形态系统(NSOC)的架构,其基于尖峰 - 神经网络(SNN)技术。独立的处理系统,专为嵌入式应用程序而设计,也可以作为协处理器。可以组合多个芯片以处理更大的SNN以及多个SNN。
尖峰神经网络是另一种选择到近年来非常流行的卷积神经网络(cnn)(图1).SNNS在其操作,培训和推理过程功能中与CNN不同。但是,在高水平,它们非常相似。培训的推理引擎可以识别输入并提供指示作为网络模型的一部分配置的特性的输出。输出是概率,但很高的概率是正确识别的良好指示。
1.尖峰神经网络为卷积神经网络提供了替代品,这已经变得非常受欢迎。
CNNS和SNNS具有输入层和输出层,其中介于其中一个或多个隐藏图层。CNN接受输入,数据流过由与层内的神经元相关联的重量修改的网络。通过训练模型来确定权重。这可能需要一段时间并需要大量的样本。
snn将数据转换成尖峰流,这些尖峰流也在神经网络中流动。这些是离散事件,而不是CNN的值数组。微分方程实际上定义了尖峰的作用。SNN的要求之一是将输入数据转换为spike流。数据-脉冲转换器可以在硬件或软件中完成。
snn也需要培训,但开销明显更少,允许现场培训,这对CNN来说是不切实际的。与CNN相比,snn还需要更少的计算能力,这有助于降低与CNN相比的功率和性能要求。
仔细看看NSoC
大脑芯片是秋田NSoC(图2)包括一个传统的处理器,使系统可以作为一个独立的设备使用。它可以处理外设和通信,但芯片的其余部分专门用于SNN支持。通信接口包括PCI Express、usb3.0、以太网、CAN和串口。秋田NSoC本质上有120万个神经元和100亿个突触。芯片可以处理训练和推理工作。
2.BrainChip公司的秋田NSoC是一种独立的芯片,带有传统处理器和秋田神经元结构。
该系统支持一系列传感器输入,包括模拟,数字,音频,像素和动态视觉传感器(DVS)。后者是一种摄像机,只能在帧中的变化与整个帧发送。这是识别对象和手势的方便。NSOC的DMA引擎旨在处理这些输入,这些输入提供数据 - 峰值转换(DSC),反过来递送由神经网络结构中的SNN模型存储的SNN模型存储的尖峰流。硬件内置了许多常见的DSC,包括支持图形像素数据,音频数据和DVS数据。
高速串行芯片对芯片接口可用于将多达1024个芯片连接到一个更大的网络中。数据和峰值通过这些连接,所以每个芯片只需要大约6个串行连接。不需要额外的交换机。多芯片系统中有一个统一的地址系统。
虽然价格和最终配置还没有确定,但每个芯片的价格在10美元左右。同样,电源要求与传统SoC类似,这使得snn可以在工业物联网(IIoT)节点的边缘运行,或者作为独立的系统运行。
在创建其架构时,BrainChip专注于一系列设计方面。固定神经元模型允许更紧凑的记忆-约6mb -以及使用可编程训练和触发阈值。经过优化的神经处理器核心可以进行卷积运算,并通过织物完全连接起来。一个全球spike总线连接到所有的核心。
3. Akida NSOC在复杂性方面以120万神经元和100亿个突触在多芯片系统中向上移动梯子。
神经网络已经走了很长的路,但还有很多改进空间(图3).然而,由于它们的存在,许多重要的应用现在已经变得切实可行。使用ssn的神经形态计算的目标应用程序,如视觉系统、网络安全,甚至金融系统。要达到12亿个神经元,需要多个芯片,但一个芯片就足以处理许多SNN杂务,如视频处理。
芯片尚未使用;但是,使用仿真完成了测试。它表明,芯片与CIFAR-10这样的常见数据集非常好,这是针对神经网络硬件和软件的常见测试(图4).该芯片可以以6kframe /s/W的速度处理Cifar-10型号。
4. Akida与流行的CiFar-10数据集非常好。识别10个常见物体的CiFar-10使用的功率较低,并且显着昂贵。
该芯片由BrainChip公司支持Akida开发环境.基于python的平台可以用来为Akida执行引擎和Akida SoC等软件平台生成模型。该系统将处理监督学习和非监督学习。