【面向代码】学习 Deep Learning（四） Stacked Auto-Encoders(SAE)

最新推荐文章于 2022-12-19 12:15:43 发布

Kylin-Xu

最新推荐文章于 2022-12-19 12:15:43 发布

阅读量2.3k

点赞数

分类专栏： deep learning ANN 文章标签： neural network matlab machine learning deep learning

deep learning 同时被 2 个专栏收录

44 篇文章 2 订阅

订阅专栏

30 篇文章 0 订阅

订阅专栏

今天介绍的呢是DL另一个非常重要的模型：SAE

把这个放在最后来说呢，主要是因为在UFLDL tutorial 里已经介绍得比较详细了，二来代码非常简单(在NN的基础之上)

先放一张autoencoder的基本结构：

基本意思就是一个隐藏层的神经网络，输入输出都是x，属于无监督学习

==========================================================================================

基本代码

saesetup.m

[cpp]view plaincopy 
   
 function sae = saesetup(size)  
     for u = 2 : numel(size)  
         sae.ae{u-1} = nnsetup([size(u-1) size(u) size(u-1)]);  
     end  
 end  

saetrain.m

[cpp]view plaincopy 
   
 function sae = saetrain(sae, x, opts)  
     for i = 1 : numel(sae.ae);  
         disp(['Training AE ' num2str(i) '/' num2str(numel(sae.ae))]);  
         sae.ae{i} = nntrain(sae.ae{i}, x, x, opts);  
         t = nnff(sae.ae{i}, x, x);  
         x = t.a{2};  
         %remove bias term  
         x = x(:,2:end);  
     end  
 end  

其实就是每一层一个autoencoder，隐藏层的值作为下一层的输入

各类变形

为了不致于本文内容太少。。。现在单独把它的几个变形提出来说说

sparse autoencoder：

这就是ufldl讲的版本，toolbox中的代码和ufldl中练习的部分基本一致：

在nnff.m中使用：nn.p{i} = 0.99 * nn.p{i} + 0.01 * mean(nn.a{i}, 1);计算

在nnbp.m中使用

pi = repmat(nn.p{i}, size(nn.a{i}, 1), 1);

sparsityError = [zeros(size(nn.a{i},1),1) nn.nonSparsityPenalty * (-nn.sparsityTarget ./ pi + (1 - nn.sparsityTarget) ./ (1 - pi))];

计算sparsityError即可

denoising autoencoder：

denoising其实就是在autoencoder的基础上，给输入的x加入噪声，就相当于dropout用在输入层

toolbox中的也实现非常简单：

在nntrain.m中：

batch_x = batch_x.*(rand(size(batch_x))>nn.inputZeroMaskedFraction)

也就是随即把大小为(nn.inputZeroMaskedFraction)的一部分x赋成0，denoising autoencoder的表现好像比sparse autoencoder要强一些

Contractive Auto-Encoders：

这个变形呢是《Contractive auto-encoders: Explicit invariance during feature extraction》提出的

这篇论文里也总结了一下autoencoder，感觉很不错

Contractive autoencoders的模型是：

其中：

hj是表示hidden layer的函数，用它对x求导

论文里说：这个项是

encourages the mapping to the feature space to be contractive in the neighborhood of the training data

具体的实现呢是：

代码呢参看：论文作者提供的：点击打开链接

主要是

jacobian(self，x):

_jacobi_loss():

_fit_reconstruction():

这几个函数和autoencoder有出入，其实也比较简单，就不细讲了

总结：

总的来说，autoencoder感觉是DL中比较好理解的一部分，所以介绍内容不长

可能你也发现了，Toolbox里还有一个文件夹叫CAE，不过这个CAE是Convolutional Auto-Encoders

参考 http://www.idsia.ch/~ciresan/data/icann2011.pdf ，以后有时间再学习一下~

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Kylin-Xu CSDN认证博客专家 CSDN认证企业博客

码龄12年

7: 原创

24万+: 周排名

225万+: 总排名

25万+: 访问

: 等级

2103: 积分

59: 粉丝

22: 获赞

31: 评论

84: 收藏

私信

关注

热门文章

分类专栏

story 1篇
parallel communication 1篇
ToolBox 5篇
deep learning 44篇
ANN 30篇
math foundation 2篇
machine learning 29篇
latex 1篇
Boosting 1篇

最新评论

THE MNIST DATABASE
张牧之7: 下载MNISt数据集出现403forbidden怎么回事
DeepLearnToolbox_DBN notes
D_aguozi 回复哆啦C梦GO: 同问，这是什么意思呀
指数增长模型
CATCHTHEFITE: 图片都显示不出来能不能解决下？
k-折交叉验证(k-fold crossValidation)
沙小菜: 对于k交叉验证的工作流程有个疑问，他们是按下面的步骤工作的么？一个数据集一共有1,2,3三个部分，以model0为初始化参数第一波迭代：model0为初始化参数，1,2做训练集，3做测试集，得到参数模型model1，测试精度为pres1; 第二波迭代：model1为初始化参数，2,3做训练集，1做测试集，得到参数模型model2，测试精度为pres2; 第三波迭代：model2为初始化参数，3,1做训练集，2做测试集，得到参数模型model3，测试精度为pres3; 最终的测试结果为(pres1+pres2+pres3)/3。每次的迭代的初始化模型都是上一次迭代得来的？
k-折交叉验证(k-fold crossValidation)
闷声图样回复 wallace-lll: 分类准确率啊，无非是fit完了之后predict一下。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。