DeepLearningToolBox学习——NN(neural network)

最新推荐文章于 2024-08-08 07:41:08 发布

susandebug

最新推荐文章于 2024-08-08 07:41:08 发布

阅读量1.2w

点赞数

分类专栏：机器学习文章标签： DNN NN BP deep learning dropout

本文链接：https://blog.csdn.net/u010025211/article/details/50581156

版权

本文基于DeepLearningToolBox，详细介绍了神经网络模型的各个组成部分，包括test_example_NN、nnsetup、nntrain、nnff、nnbp、nnapplygrads和nntest等关键步骤。通过对比Andrew Ng的UFLDL教程，深入理解神经网络的训练和应用。

摘要由CSDN通过智能技术生成

经典的DeepLearningToolBox，将里面的模型和Andrew Ng的UFLDL tutorial 对应学习，收获不小。

下载地址：DeepLearningToolBox

神经网络模型，层与层之间全连接。

1. test_example_NN

%% ex1 vanilla neural net
rand('state',0)
nn = nnsetup([784 100 10]);
opts.numepochs =  1;   %  Number of full sweeps through data
opts.batchsize = 100;  %  Take a mean gradient step over this many samples
[nn, L] = nntrain(nn, train_x, train_y, opts);

[er, bad] = nntest(nn, test_x, test_y);

batchsize 是指每个batch的大小，比如有60000张图片，这里把100个图片作为一个整体（batch）进行训练(或者测试)，则有600个batch,需要训练600次。这个概念在DL中是常见的。

这里面出现了3个关键函数：nnsetup,nntrain,nntest

2. nnsetup

设置神经网络结构，包括初始化参数：

function nn = nnsetup(architecture)
% NNSETUP creates a Feedforward Backpropagate Neural Network
% nn = nnsetup(architecture) returns an neural network structure with n=numel(architecture)
% layers, architecture being a n x 1 vector of layer sizes e.g. [784 100 10]

    nn.size   = architecture;
    nn.n      = numel(nn.size);
    
    nn.activation_function              = 'tanh_opt';   %  Activation functions of hidden layers: 'sigm' (sigmoid) or 'tanh_opt' (optimal tanh).
    nn.learningRate                     = 2;            %  learning rate Note: typically needs to be lower when using 'sigm' activation function and non-normalized inputs.
    nn.momentum                         = 0.5;          %  Momentum
    nn.scaling_learningRate             = 1;            %  Scaling factor for the learning rate (each epoch)
    nn.weightPenaltyL2                  = 0;            %  L2 regularization
    nn.nonSparsityPenalty               = 0;            %  Non sparsity penalty
    nn.sparsityTarget                   = 0.05;         %  Sparsity target
    nn.inputZeroMaskedFraction          = 0;            %  Used for Denoising AutoEncoders
    nn.dropoutFraction                  = 0;            %  Dropout level (http://www.cs.toronto.edu/~hinton/absps/dropout.pdf)
    nn.testing                          = 0;            %  Internal variable. nntest sets this to one.
    nn.output                           = 'sigm';       %  output unit 'sigm' (=logistic), 'softmax