MATLAB深度学习CNN包的代码详解补充及各变量参数说明

最新推荐文章于 2024-08-02 17:00:52 发布

天际青年

最新推荐文章于 2024-08-02 17:00:52 发布

阅读量7.4k

点赞数 1

分类专栏： CNN 深度学习神经网络文章标签：深度学习 matlab 神经网络 CNN 算法

本文链接：https://blog.csdn.net/qq_20028731/article/details/69892169

版权

本文详细介绍了MATLAB深度学习包中卷积神经网络（CNN）的实现，包括变量和参数的意义。通过对源代码的分析，阐述了训练过程中的关键步骤，如数据预处理、网络结构、训练参数以及反向传播中的误差计算和权重更新。此外，还讨论了网络的构建、输入层、卷积层、下采样层的计算公式以及敏感值的求解。尽管此包已过时，但对于初学者来说，它是理解CNN工作原理的好资源。

摘要由CSDN通过智能技术生成

最近在做卷积神经网络，看了MATLAB版本的CNN包的实现，同时看了网上许多大神对此包的详细代码解释，感觉醍醐灌顶，同时感觉代码研究过程中仍有许多疑问，在这里针对MATLAB深度学习包的卷积神经网络包的训练说明，分别对程序运行过程中出现的变量以及其对应的意义做出说明。

首先，看此文章之前，请先了解以下前置内容：

Deep Learning（深度学习）学习笔记整理系列之（三） - zouxy09的专栏 - 博客频道 - CSDN.NET

http://blog.csdn.net/zouxy09/article/details/8775518

BP算法——别跟我说看完这个你还不懂 - Hungryof的专栏 - 博客频道 - CSDN.NET

http://blog.csdn.net/hungryof/article/details/50436231

卷积神经网络的详解 http://www.dataguru.cn/article-10638-1.html

详细解释CNN卷积神经网络各层的参数和链接个数的计算http://blog.csdn.net/dcxhun3/article/details/46878999

Deep Learning论文笔记之（四）CNN卷积神经网络bp算法推导和实现 http://blog.csdn.net/zouxy09/article/details/9993371/

Deep learning：五十一(CNN的反向求导及练习) - tornadomeet - 博客园

http://www.cnblogs.com/tornadomeet/p/3468450.html

cnn公式推导 - alexanderkun - 博客园

http://www.cnblogs.com/alexanderkun/p/4863691.html

然后，对于程序的详细源代码解释，参照此博客，本文是对此博客中一些遗漏的地方做些补充和说明：http://blog.csdn.net/zouxy09/article/details/9993743/

首先，在test_example_CNN.m中，各个变量的说明：

load mnist_uint8;

mnist_uint8.mat：手写数字原始数据集，包括以下四个变量：

train_x为60000幅大小为784的输入图像，train_y为60000幅大小为10的train_x图像对应的分类结果。这两个矩阵用来训练神经网络。

test_x为10000幅大小为784的输入图像，test_y为10000幅test_x图像应该输出的、正确的分类结果（softmax回归，结果由长度为10的向量组成，如[x1,x2,…,x10],x1到x10分别有0~1的值代表该图像对应数字是1~10的概率，最大的那个xi既是分类结果）。用test_x去训练神经网络，得到结果后与test_y比较，从而输出错误率。

train_x = double(reshape(train_x',28,28,60000))/255;

test_x = double(reshape(test_x',28,28,10000))/255;

train_y = double(train_y');

test_y = double(test_y');

对于这四行语句，是分别对上面说的四个矩阵进行变形操作，转换成double类型后求平均值。

对train_x，先把60000x784的矩阵通过转置（'）和reshape操作，转换成28x28x60000的图像，然后转换成double除255（原始输入数据为0~255的值，这里需要压缩成0~1），即得到了60000幅28x28的手写数字输入图像。