【深度学习】Torch卷积层源码详解

shenxiaolu1984

于 2016-08-31 19:11:57 发布

阅读量1w

点赞数 4

分类专栏： DL框架文章标签：深度学习卷积源码 deep-learn

本文链接：https://blog.csdn.net/shenxiaolu1984/article/details/52373174

版权

本文深入解析Torch中的nn包 SpatialConvolution 模块，从初始化到nn(lua)、THNN(C)层次的实现，详述卷积层的前向传播过程。介绍了lua接口、THNN库的函数声明、THNN库的核心功能以及THBlas(C)层次的矩阵乘法实现。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

本文以前向传播为例，详细分析Torch的nn包中，SpatialConvolution函数的实现方式。
在分析源文件时，同时给出了github上的链接以及安装后的文件位置。

初始化

定义一个卷积层需要如下输入参数

nInputPlane\nOutputPlane    -- 输入\输出通道数，M\N
kW\kH                       -- 核尺寸，K
dW\dH                       -- 步长
padW\padH                   -- 补边

卷积层的核心变量

weight         -- 卷积核权重，N*M*K*K
bias           -- 卷积核偏置，N
gradWeight     -- 权重导数，N*M*K*K
gradBia        -- 偏置导数，N

为效率起见，torch的层采用分层方式实现：

nn(lua)->THNN(C)->THTensor(C)->THBlas(C)->LAPACK(Fortran)

在/extra/nn/SpatialConvolution.lua中，定义了卷积层的lua接口。

前向运算的函数是updateOutput(input)，其中执行运算的部分如下：

input.THNN.SpatialConvolutionMM_updateOutput(
      input:cdata(),            self.outp