《机器学习技法》学习笔记13——深度学习

最新推荐文章于 2020-05-06 00:51:29 发布

小爷毛毛（卓寿杰）

最新推荐文章于 2020-05-06 00:51:29 发布

阅读量914

点赞数

分类专栏：深度学习基础/原理机器学习技法与实战文章标签：深度学习机器学习神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u011239443/article/details/76692801

版权

深度学习基础/原理同时被 2 个专栏收录

141 篇文章 12 订阅

订阅专栏

机器学习技法与实战

15 篇文章 13 订阅

订阅专栏

http://blog.csdn.net/u011239443/article/details/76692801

深度神经网络

浅层神经网络	深层神经网络
更加有效的训练	难以训练
更简单的结构选择	复杂的结构选择
更具有理论依据，但可能难以提取特征	更加武断的依据，简化特征提取
适合多项式组合比较明确的情况下	适合多项式组合复杂未知的情况下

深度学习面临的挑战	迎接该挑战的相关技术
难以训练	mini-batch、 GPU
复杂的结构选择	CNN、RNN
模型复杂度高，容易过拟合	1.大数据 2.正则化： dropout；denoising
优化困难	pre-training

自动编码器

我们可以使用自动编码器来做pre-training：

自动编码器模型如下：

自动编码器本质是想训练得到一层能让隐藏层节点表达出输入的权重，即可以看作 $w_{ij}^1$ 用于编码， $w_{ij}^2$ 用于解码，并且 $w_{ij}^1 = w_{ji}^2$

噪音编码自动编码器

噪音编码自动编码器其实就是希望当数据中有噪音的时候，自动编码器依旧能将输入正确的表达出来：

主要分析

线性自动编码器模型：

损失函数：

我们对上式进行线性变换：

最优化问题就变成了：

我们先固定V，变化 Γ来求的最小值。这么一来两项左边的V都可以提取来先不看，问题变成：

那么就可知，I − Γ尽可能的多0向量行结果，就会越小。而l Γ的rank ≤ ˜ d，所以 Γ取值为：

进一步的问题变成了：

对于矩阵V中的每一行的最优化问题有：

我们对上式使用拉格朗日乘子法：

$\large v^Tx_nx_n^Tv- λ(v^Tv-1)$

对上式关于v求导，取极值得：

$\large 2 x_nx_n^Tv - 2λv = 0$

$\large x_nx_n^Tv = λv$

把 $x_nx_n^T$ 看作矩阵 $X^TX$ ，可知最优化v其实就是在求矩阵 $X^TX$ 特征值最大的特征向量。
这里写图片描述

小爷毛毛（卓寿杰）

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

小爷毛毛（卓寿杰） 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。