并行程序设计论文笔记
不务正业的土豆
知行合一 止于行善
展开
-
Low-memory GEMM-based convolution algorithms for deep neural networks 深度神经网络中基于GEMM的低内存卷积算法
文章目录1 相关介绍DNN卷积的实现方法contributions2 DNN 卷积3 使用O(K2CHW)O(K^2CHW)O(K2CHW) 空间的patch matrix的卷积3.1 Matrix layouts3.2 Patch-minor layouts3.3 Patch-building Algoritmsim2col−scanim2col−copy−selfim2col−copy−lon...原创 2019-10-20 22:18:24 · 1150 阅读 · 1 评论 -
[论文总结]:Mixed Precision Training 混合精度训练 百度和英伟达联合发表 ICLR 2018
文章目录1论文概述2 Half Precision Format2 混合精度的解释采用FP16的优势为什么需要FP323 控制半精度的信息损失的方法accumulating FP16 products into FP32FP32 Master Copy of WeightsLoss scaling总结:训练步骤实验结果语音识别 Speech Recongnition图像分类物体检测 Dete...原创 2019-07-30 11:03:23 · 5074 阅读 · 0 评论 -
MEC:Memory-efficient Convolution for Deep Neural Network 深度神经网络中内存高效的卷积算法MEC 论文详解 ICML 2017
文章目录1 相关介绍2 Preliminaries标记相关工作3 MEC算法3.1 动机3.2 MEC 算法初级版本3.3 MEC 算法高级版本3.4 分析4 实验结果论文:MEC: Memory-efficient Convolution for Deep Neural Network 深度神经网络内存高效的卷积作者:Minsik Cho,Daniel Brand来源:ICML 2017...原创 2019-10-20 15:19:19 · 1790 阅读 · 0 评论 -
Parallel Multi Channel Convolution using General Matrix Multiplication 基于广义矩阵乘法的并行多通道卷积 ASAP 2017
文章目录1 相关介绍用到的一些定义背景contributions2 CNN多通道卷积是单通道卷积的和im2col3 新方法3.1 Kernel to Row(kn2row) and Kernel to Column (kn2col)4. 实验结果实验设置性能趋势相关工作论文:Parallel Multi Channel Convolution using General Matrix Multi...原创 2019-10-14 22:43:57 · 1339 阅读 · 1 评论