“Cerebras世界上最大的芯片将计算提升到一个全新的水平”
Cere Bras系统在supercomputing 2019上发布了新的cs-1系统。 这家企业今年早些时候在hot chips上发布了waferscaleengine(WSE )。 这个芯片几乎令人难以置信。 印象深刻。 世界上最大的负载传感器,以令人难以置信的40万核心、1.2万亿个晶体管、46,225平方毫米的硅、18 gb的片上存储器的形式,全部集成为与整个晶片一样大,另外,该芯片的功率为15kw
虽然芯片开发工作非常复杂,但足够合理的大规模部署系统不仅可以提供足够的冷却能力,还可以为所有计算能力提供足够的能源。 cerebras完成了这一壮举,今天该公司发布了该系统,argonne国立研究所宣布使用了该系统。 这家企业还向我们提供了系统内部的详细原理图。
图1中4
该系统只测量15个机架单元的高度,约为26英寸。 因为这三个可以放在一个架子上。 考虑到性能,这是一个非常紧凑的软件包。 需要1,000个gpu的集群。 这是因为单个cerebras芯片的核心数量是单个gpu的78倍以上,内存为3,000倍,内存带宽为10,000倍,因此消耗了整个机架的功耗和一半的兆瓦
谷歌的tpu v3芯片豆荚消耗100千瓦的电力,但只提供单一cs-1系统的1/3的性能。 总体来说,cs-1的耗电量只有1/5,尺寸只有1/30,但速度是整个tpu外壳的3倍。 相比之下,cerebras cs-1消耗20kw,其中4kw的电力专用于风扇、泵、热交换器等冷却子系统。 该系统向芯片提供15kw的电力,剩下的1kw因电源效率下降而损失。
系统左上角有12个100gbe连接。 这些系统与执行以前流传的格式计算的大型超级计算机一起工作。 然后,用超级计算机解决的数据流入cs-1进行其他ai解决,利用两种计算的特点满足不同的业务负荷。 这个系统也可以通过互联网结构扩展到多个节点。 这意味着cs-1系统可以在更大的组中工作。 虽然cerebras测试了非常大的集群,可以通过数据并行化模型的模型并行化作为单一的同构系统进行管理,但是官方的可扩展性指标还没有发表。
整个cerebras cs-1由自定义组件组成。 系统通过12个电源连接从背面获取电源。 然后从54v降到0.8v,传输到芯片上。 电力流向主板而不是主板周围,然后流向解决方案。 未指定核心数量的每个区域都接收自己的电源。 晶片级芯片是将多个芯片和芯片的互联网结构捆绑而构成的,但已知功率传播比芯片/分划板斜杠还要细。 这样可以确保芯片整体的一致电力传输,芯片上的电力分配面也最小化。
免责声明:晨报时代网免费收录各个行业的优秀中文网站,提供网站分类目录检索与关键字搜索等服务,本篇文章是在网络上转载的,本站不为其真实性负责,只为传播网络信息为目的,非商业用途,如有异议请及时联系btr2031@163.com,本站的小编将予以删除。