- 博客(3)
- 收藏
- 关注
转载 cuDNN: efficient Primitives for Deep Learning 论文阅读笔记
这篇论文主要讨论如何针对CNN做一些GPU矩阵计算的优化。传统CNN计算主要开销是在convolutions, activation function, pooling.首先,我们看convolution的操作过程:参数表:O是输出input feature map,F是filter, D0是input feature map. 从公式看到如果用循环操作,需
2017-02-27 19:02:07 682
转载 优化基于FPGA的深度卷积神经网络的加速器设计
英文论文链接:http://cadlab.cs.ucla.edu/~cong/slides/fpga2015_chen.pdf翻译:卜居转载请注明出处:http://blog.csdn.net/kkk584520/article/details/47450159【0. 摘要】CNN已经广泛用于图像识别,因为它能模仿生物视觉神经的行为获得很高识别准确率。最近,基于深度学习算法
2017-02-20 09:31:18 770
转载 Parameter Server 详解
本博客仅为作者记录笔记之用,不免有很多细节不对之处。还望各位看官能够见谅,欢迎批评指正。更多相关博客请猛戳:http://blog.csdn.net/cyh_24如需转载,请附上本文链接:http://blog.csdn.net/cyh_24/article/details/50545780MXNet 是李沐和陈天奇等各路英雄豪杰打造的开源深度学习框架(最近不能更火了),其中最
2017-02-09 15:52:50 3669
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人