torch学习笔记3.3：实现自定义模块(gpu)

最新推荐文章于 2024-08-08 23:29:37 发布

July_Zh1

最新推荐文章于 2024-08-08 23:29:37 发布

阅读量2.5k

点赞数 3

分类专栏： computer vision machine learning tool 文章标签： torch gpu cuda cnn 自定义

本文链接：https://blog.csdn.net/happyer88/article/details/53057259

版权

这篇博客介绍了如何在torch中创建自定义模块nxn及其CUDA版本cunxn，特别是详细讲解了GPU实现的ReLU类。通过CMakeLists.txt配置CUDA文件编译，init.cu组织模块，以及ReLU.cu中GPU上的ReLU函数实现。

摘要由CSDN通过智能技术生成

在使用torch时，如果想自己实现一个层，则可以按照《torch学习笔记1：实现自定义层》中的方法来实现。但是如果想要实现一个比较复杂的网络，往往需要自己实现多个层（或类），并且有时可能需要重写其他模块中已有的函数来达到自己的目的，如果还是在nn模块中添加，会比较混乱，并且不利于本地git仓库统一管理，这个时候，我们可以自己实现一个像nn一样的模块，在代码中使用时 require即可。

我们来实现一个名为nxn的自定义模块，以及它的cuda版本cunxn模块，其中包含一个自定义的Hello类（lua实现），ReLU类（分别用CPU和GPU实现）。

由于篇幅原因，这里把torch自定义模块的lua实现，cpu实现，gpu实现分别写一篇文章，本文介绍cpu实现的ReLU类。

1 总目录结构和 2 使用说明在《torch学习笔记3.1：实现自定义模块(lua)》

3 文件说明

这里介绍的都是cunxn文件夹里面的。

CMakeLists.txt

可以参考torch自带模块来写，主要是cuda文件的编译和链接，需要注意的部分内容如下：

......
FIND_PACKAGE(CUDA 4.0 REQUIRED)

SET(src-cuda init.cu)

CUDA_ADD_LIBRARY(cunxn MODULE ${src-cuda})
TARGET_LINK_LIBRARIES(cunxn luaT THC TH)
IF(APPLE)
  SET_TARGET_PROPERTIES(cunxn PROPERTIES
    LINK_FLAGS "-undefined dynamic_lookup")
ENDIF()


### Torch packages supposes libraries prefix is "lib"
SET_TARGET_PROPERTIES(cunxn PROPERTIES
  PREFIX "lib"
  IMPORT_PREFIX "lib")

INSTALL(TARGETS cunxn
  RUNTIME DESTINATION "${Torch_INSTALL_LUA_CPATH_SUBDIR}"
  LIBRARY DESTINATION "${Torch_INSTALL_LUA_CPATH_SUBDIR