去噪自动编码机

去噪自动编码机(Denoising Autoencoder)

  1. 自动编码机的主要作用是数据降维,提取特征。 原始输入 x 经过加权 W,b,映射函数(如:非线性函数Sigmoid)之后得到 y ,在对y反向加权映射回来成为 z 。通过反复迭代两组W,b,使得误差函数最小,即尽可能保证 z 近似于x,即完美重构了 x .自动编码器,它没有使用数据标签来计算误差update参数,所以是无监督学习。其次,利用类似神经网络的双隐层的方式,简单粗暴地提取了样本的特征。Vincent在2010年的论文中做了研究,发现只要单组W就可以了。 我们在训练 W 过程中, W=WT , WW 成为Tied Weights. 实验证明 W 没必要去训练.
  2. 降噪自动编码器(Denoising Autoencoder). Vincent在2008年的论文中提出了AutoEncoder的改良版——dA。论文的标题叫 “Extracting and composing robust features with denoising autoencoders”。就是以一定概率分布(通常使用二项分布)去擦除原始输入矩阵,即每个值都随机置 0 , 这样看起来部分数据的部分特征是丢失了。以这丢失的数据x去计算 y ,计算z,并将 z 与原始x做误差迭代,这样,网络就学习了这个破损(原文叫Corruputed)的数据。这个破损的数据是很有用的,原因有二:其之一,通过与非破损数据训练的对比,破损数据训练出来的Weight噪声比较小。降噪因此得名。原因不难理解,因为擦除的时候不小心把输入噪声给擦掉了。其之二,破损数据一定程度上减轻了训练数据与测试数据的代沟。由于数据的部分被擦掉了,因而这破损数据, 一定程度上比较接近测试数据。(训练、测试肯定有同有异,当然我们要求同舍异)。这样训练出来的Weight的鲁棒性就提高了.破损的数据相当于一个简化的PCA,把特征做一个简单的降维预提取。
  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值