AI芯片:寒武纪DaDianNao结构分析

DaDianNao

寒武纪的DaDianNao的诞生稍晚于DianNao,同样也是在2014年。(这里仅仅指论文发表时间)

如果把DianNao看作是嵌入式终端使用的处理器,那么DaDianNao就是服务器上用的大规模高性能处理器。
DaDianNao其实就是采用的DianNao的NFU作为内核,然后在一块芯片上同时放置了16个NFU,于是乎,性能也就是DianNao的16倍。
文章说,在DaDianNao的设计过程中,首先想到的是,直接将DianNao中NFU的逻辑资源扩大成原来的16倍即可简单实现性能16倍的提升。但是这里就要考虑芯片上实际的晶体管布局及布线。发现,如果单纯扩大NFU规模,那么最终布线所占用的芯片面积远远超过NFU逻辑模块,貌似并不高效,如下图中的Figure4所示。
于是乎,就想到了多核并行的架构。
将上面的大NFU拆分成16个小NFU(DianNao),通过合理布局布线,能够大幅缩小布线需要的面积,最终面积的减小28.5%,而性能与上面的设计相同。
芯片上,那可真的是寸土寸金。
没说的,选第二种,也就是下图中的Figure5。
这里写图片描述

到目前为止(2018年),国内的人工智能公司,大部分还是局限在算法领域,并不关注底层硬件。少数几个大体量的AI独角兽,如寒武纪/商汤/深鉴/地平线/比特大陆等公司,都对芯片有不同程度的涉足。这其中,大部分公司的芯片都只是涉及到终端的推断(inference),而没有涉足训练(training),所以芯片设计比较简单。
相反,国外的科技巨头,比如谷歌/intel/NviDia/facebook等,都有涉足training的深度学习处理器的研发。

寒武纪是少数已经涉足training的中国企业。
DaDianNao就是可以用于服务器上进行大规模training的专用芯片。
看好寒武纪!

  • 3
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值