Cs21 7nm Planview Dinner

大脑系统公司为巨型人工智能芯片筹集2.5亿美元资金

2021年11月15日
此次融资使该公司迄今为止的总融资额达到7.2亿美元,估值约为40亿美元。在2019年11月的一轮融资后,该公司的估值为24亿美元。

开发出世界上最大的人工智能芯片的初创公司Cerebras Systems又筹集了2.5亿美元的风险投资,旨在扩大招聘和吸引新客户。

这笔资金使其迄今筹集的总资金达到7.2亿美元,使其拥有更大的财务实力,能够在用于数据中心培训和推理的人工智能芯片领域与英伟达(Nvidia)和英特尔(Intel)抗衡。Cerebras表示,F轮融资对该公司的估值约为40亿美元,高于2019年E轮融资后的24亿美元。

这家硅谷初创公司正在开发其第二代芯片WSE-2,该芯片跨越整个硅片,集成了基于台积电7纳米节点的2.6万亿个晶体管。Cerebras表示,根据工作负载的不同,WSE-2芯片的运行速度可以达到与英伟达(Nvidia)和英特尔(Intel)竞争的芯片的1000倍,而耗电量仅为后者的一小部分。它还能更有效地利用数据中心的空间,Cerebras说。

它没有将WSE-2直接卖给服务器制造商,因为冷却和连接如此巨大的硅芯片是一个挑战。相反,这家初创公司开发了一个名为CS-2的服务器平台,里面有一个WSE-2。

该公司首席执行官兼创始人安德鲁·费尔德曼(Andrew Feldman)表示,这笔投资将帮助为Cerebras的全球扩张提供资金,并将其CS-2系统部署到新客户。在本轮融资之后,Cerebras表示,计划在明年年底前将员工人数从400人增加到600人。这家初创公司表示,将把重点放在招聘工程师,以推动其硬件和软件开发,并支付其产品的生产成本。

该公司最近在日本东京和加拿大多伦多设立了新办事处,将业务拓展至美国以外的地区。

像Graphcore、Samba Nova和Groq一样,Cerebras是众多在人工智能硅领域雄心勃勃的初创公司之一。但它为WSE-2设计的独特架构使其脱颖而出,WSE-2代表晶圆规模引擎2。

传统上,数十或数百个芯片被烧在一块硅片上,然后被切成单独的处理器。Cerebras采用的是一种非常不同的方法:这家初创公司将所有芯片都放在同一个300毫米的硅片上,而不是将它们切成更小的芯片。任何夹在圆片弯曲边缘的不完整的芯片都将被去除,导致模具面积为46,225毫米2

Cerebras表示,它与芯片制造商台积电(TSMC)密切合作,以其独特的架构解决了许多制造挑战,如连接、冷却、电力传输、封装和产量。

WSE-2内部的数万亿个晶体管被排列成85万个核,高于上一代WSE-1的40万个核,是英伟达(Nvidia)最先进图形芯片内核的100多倍。据Cerebras介绍,该芯片的核心是专门为运行神经网络核心的操作而设计的,神经网络是机器学习的基本构件。

WSE-2还采用了40gb的高速板载SRAM,均匀地分布在晶圆表面。这是英伟达旗舰产品安培GPU的1000倍,后者只有40mb内存。

“大脑”芯片被超级计算机网站使用,如阿贡国家实验室和劳伦斯利弗莫尔国家实验室,他们用它们来试图理解宇宙的起源和开发更好的电池化学。葛兰素史克(GlaxoSmithKline)和阿斯利康(AstraZeneca)等公司也使用WSE芯片对潜在药物进行更快的预测。芯片制造设备巨头东京电子是另一个买家。

为了匹配大脑芯片的性能,客户将不得不使用多达数百个gpu,这些gpu必须通过电线和电缆共享数据并相互协调,从而导致计算延迟。

但在WSE-2中,数据不需要在不同的服务器之间传输,而只需要在晶圆上从一组核传输到另一组核。更短的距离减少了可能损害芯片性能和功率效率的延迟。这些核心与一个专有的互连方案捆绑在一起,以220 PB/s的速度在核心之间移动数据。这使得WSE-2能够更快、更有效地执行人工智能工作负载。

Cerebras与台积电合作推出了一种完全独特的互连技术,使晶圆上每个伪晶片中的核心能够快速通信,并具有较高的功率效率。

几十万个ai核心由12个100 gb以太网端口提供,总传输速度为1.2 TB/s。

WSE-2的突出之处在于它的40gb SRAM。大型机器学习模型通常存储在单独的内存池中,因为运行工作负载的芯片无法容纳所有的数据。数据必须离开芯片到单独的存储库进行处理,这会影响性能。但WSE-2有足够的内存,可以让机器学习模型在一个芯片上处理数据。

由于所有的通信和存储都在一块硅片上,数据可以畅通无阻地传输。WSE-2将数据从内存传输到核心,内存带宽约为20pb /s,比英伟达的gpu和英特尔的cpu快数千倍,是WSE-1芯片的两倍多。WSE-2的大量内存使数据接近AI核,因此内存带宽不再是瓶颈。

Cerebras将利用这笔资金进一步投资于它的硅和硬件,以及使它们有用的软件库和其他工具。也投资于创新支持系统级性能,其MemoryX技术等更大的内存池与WSE-2芯片和SwarmX高性能互连结构,让它织192芯片一起巨大的神经网络进行训练。

该公司的长期战略之一是,在超级计算机业务之外扩张,并在亚马逊网络服务(Amazon Web Services, AWS)、谷歌和微软(Microsoft)等公司运营的巨型云数据中心中开辟插槽。

今年9月,cerbras表示Cirrascale将提供首个由CS-2系统驱动的云服务。

上周宣布的这轮融资由Alpha Wave Ventures和阿布扎比增长基金(Abu Dhabi Growth Fund)牵头。

从我们的合作伙伴

实现5G和机器人的未来

2021年11月18日,

汽车和Mil/Aero热管理解决方案

物联网技术可能是一把双刃剑。一方面,由于所有形式的智能设备都集成了连接性,性能的提高是一个重要因素。

超高可靠性,低延迟

当你读这篇文章时,5G正在美国推广。有些人有一个兼容5G的手机,可以连接到AT&T网络,T-Mobile,等等。

LLC谐振控制器,超低待机功率,高压启动

LLC谐振控制器,超低待机功率,高压启动

协同处理器体系结构:一种用于快速成型的嵌入式系统体系结构

2021年7月6日
编者注:尽管它以数字处理性能和吞吐量而闻名,但协处理器体系结构提供了嵌入式系统…

Amphenol ICC的EV电池管理系统互连设计

设计互连的电动汽车电池管理系统:Gijs Werner,分销和营销总监FCI基础BU, Amphenol ICC介绍…

声音你的意见!

本网站要求您注册或登录后发表评论。
目前还没有任何评论。想开始对话吗?

从我们的合作伙伴

汽车和Mil/Aero热管理解决方案

物联网技术可能是一把双刃剑。一方面,由于所有形式的智能设备都集成了连接性,性能的提高是一个重要因素。

超高可靠性,低延迟

当你读这篇文章时,5G正在美国推广。有些人有一个兼容5G的手机,可以连接到AT&T网络,T-Mobile,等等。

LLC谐振控制器,超低待机功率,高压启动

LLC谐振控制器,超低待机功率,高压启动

协同处理器体系结构:一种用于快速成型的嵌入式系统体系结构

编者注:尽管它以数字处理性能和吞吐量而闻名,但协处理器体系结构提供了嵌入式系统…
Baidu