华为详解昇腾AI芯片:自研达芬奇架构 算力和能效比大幅提升

首页

2018-10-26

核心提示:10月10日,华为在全联接大会2018上,首次宣布了华为的AI战略以及全栈解决方案。 与此同时,华为发布了自研云端AI芯片“昇腾(Ascend)”系列,基于达芬奇架构,首批推出7nm的昇腾910以及12nm的昇腾310。

其中,昇腾910是目前10月10日,华为在全联接大会2018上,首次宣布了华为的AI战略以及全栈解决方案。

与此同时,华为发布了自研云端AI芯片昇腾(Ascend)系列,基于达芬奇架构,首批推出7nm的昇腾910以及12nm的昇腾310。 其中,昇腾910是目前单芯片计算密度最大的芯片,计算力远超谷歌和英伟达。 昇腾910半精度(FP16)运算能力为256TFLOPS,比NVIDIA的TeslaV100要高一倍,整数精度(INT8)512TOPS,支持128通道全高清视频解码(/265),最大功耗350W。 昇腾310芯片的最大功耗仅为8W,主打极致高效计算低功耗AI芯片。 半精度(FP16)运算能力8TFLOPS,整数精度(INT8)16TOPS,支持16通道全高清视频解码(/265)。

这两款AI芯片和大规模分布式训练系统都将在明年第二季度推出。 日前,华为终端手机产品线总裁何刚发布长图,详细介绍了昇腾310的用途以及设计细节。 何刚表示,昇腾310作为华为全栈全场景AI解决方案的关键部分,是华为全面AI战略的重要支撑。 在设计方面,突破了人工智能芯片设计的功耗、算力等约束,实现了能效比的大幅提升。

未来将为平安城市、自动驾驶、云业务和IT智能、智能制造、机器人、便携机、智能手机、智能手表等应用场景提供全新的解决方案。 昇腾310采用华为自研达芬奇架构,使用了华为自研的高效灵活CISC指令集,每个AI核心可以在1个周期内完成4096次MAC计算,集成了张量、矢量、标量等多种运算单元,支持多种混合精度计算,支持训练及推理两种场景的数据精度运算。 统一架构可以适配多种场景,功耗范围从几十毫瓦到几百瓦,弹性多核堆叠,可在多种场景下提供最优能耗比。

(更多资讯请访问天津在线:)。