导航栏
深度学习C++代码 (位于 Github)
深度学习C++代码配套教程(1. 总述)
深度学习C++代码配套教程(2. 基础数据操作)
深度学习C++代码配套教程(3. 数据文件读取)
深度学习C++代码配套教程(4. ANN 经典神经网络)
深度学习C++代码配套教程(5. CNN 卷积神经网络)
本贴为"深度学习C++实现" github.com/fansmale/cann 的配套教程.
1. 动机
作为一个程序员,必须时刻把show me the code摆在第一位. 使用C++的原因如下:
- 使用python很容易成为调包侠,不符合我程序员的身份;
- java虽然是我的最爱, 但它GPU的支持不行, 后期扩展不好办.
2. 特点
为增强可读性和可维护性,我希望自己的程序具备如下特点:
- 不需要外部包的支持. 已有的深度学习代码, 往往需要各种附加的包, 增加了安装运行的难度. 本程序则从头做起, 自己实现矩阵运算等;
- 使用统一的命名规则, 如局部变量用temp开头, 参数以para开头. 总的命名使用驼峰方式, 与我们以前的java相同;
- 具有完备的注释, 也与java注释风格一致;
- 不使用复杂的语句, 我也不会;
- 尽可能不用 new 进行临时空间分配, 避免使用 free 语句 (析构方法内除外). 这样程序运行起来后, 不管训练多少个 epoch, 申请空间不再增加. 这也是因为我对 C++ 的内存管理方式不熟悉, 所以干脆绕过去.
3. 安装需求
程序开发使用CodeBlocks, 由于它是免费软件, 也比较简单, 所以推荐使用. 它将 .h 文件与 .cpp 文件分别放在 include 和 src 文件夹. 如果使用其它环境如 VC, 应该容易, 只是我没试过.
数据可以放在任意文件夹, 需要改 main.cpp 里面的文件名即可.
4. 组织
当前分为四个部分, 后面如果实现 RNN 和 LSTM, 就进行相应的增加.
4.1 基础数据处理
Activiator 类: 管理激活函数;
MfIntArray 类: 管理一维整数数组;
MfDoubleMatrix 类: 管理二维实数数组, 一维的也顺便可用 (偷懒没专门写);
Mf4DTensor 类: 管理 4 维张量.
4.2 文件读取
MfDataReader 类, 将数据从文件中读出, 并进行训练集、测试集划分.
4.3 经典神经网络
MfAnnLayer 类: 管理一层网络;
MfFullAnn 类: 管理整个网络.
4.4 卷积神经网络
MfCnnLayer 类: 管理一层网络;
MfFullCnn 类: 管理整个网络.
So, let’s get started! 下一节