2021李宏毅机器学习课程-YouTube第六部分、自编码器Auto-encoder

1.Auto-encoder


Self-supervised learning是类似无监督学习的一种,self-supervised learning又叫做Pre-train。

Auto-encoder也可以用于图像辨识或者文字辨识问题,如右图所示是一个图像辨识问题。例如,我们输入一张高维的图片经过一个Encoder输出一个低维的向量,再用低维的向量作为输入,经过Decoder还原一张图片,最终使得还原出来的图片和原图片尽可能的接近
在这里插入图片描述

为什么一个高维的图片可以变成一个低维的向量,最后还能还原出一张图片?

因为一张图片看似是3 x 3的但是其中所蕴含的变化是有限的,比如下图所示的我们可以用一些二维的向量来表示3 x 3的图片的变化,从而实现用低维的向量表示一张图片,最后还能根据二维向量所对应的变化还原出图片。

在这里插入图片描述

2.De-noising Auto-encoder


De-noising Auto-encoder指的是在对图片进行encoder之前,添加一些杂讯(noises)在图片中,然后经过变换还原图片,最后和原图片尽可能的接近。

De-noising Auto-encoder过程和BERT类似,都是在最开始添加了杂讯,然后进行处理的过程,其中各部分的所对应的名词如下图所示。

在这里插入图片描述

3.特征分离


我们还可以实现特征的分离(Feature Disentangle),比如下图是输入一段音频,我们可通过一个Encoder使得音频的内容信息和说话者的音频信息(包括音高,语调等等)进行分离,还可以实现变声器的功能。

下图中间是简单的Auto-encoder过程,输入一段音频再还原。右图是语音特征分离再组合,实现变声器。

在这里插入图片描述

我们在特征分离的时候,中间的低维向量可以使用真实的数字、二进制、one-hot编码等来表示不同的特征。
在这里插入图片描述

3.Vector Quantized Variational Auto-encoder (VQVAE)


下图表示的矢量量化变分自动编码器(VQVAE)指的是我们例如输入的图片通过Encoder之后得到一个低维向量,然后这个向量和我们数据集中学习得到的一些其他的向量分析相关性(self-attention),最后拿最相关的作为输出,输入到Decoder中去还原图片。

在这里插入图片描述

4.更多应用


1)通过添加Discriminator输出文章摘要

下图所示的是机器通过训练大量文章,能够在encoder和decoder中间产生某种暗号,使得decoder能够还原出原文章,但是这个暗号是人们看不懂的,也就是中间的部分不能作为我们的摘要。

在这里插入图片描述

我们可以使用GAN中的想法添加一个看过人们写的文章的Discriminator,使得输出的摘要是我们能看懂的样子。

在这里插入图片描述

2)Generator

我们发现Auto-encoder的后半部分和GAN中的,由一个向量输出一个图片是一致的,所以这部分就可以当作是generator来用,VAE(variational auto-encoder)就是这种思想设计的,将auto-encoder的decoder作为generator来用。

在这里插入图片描述

3)Compression(压缩)

因为encoder就是输出一个低维的向量所以可以用作压缩(Compression),反之decoder可以用作解压缩(Decompression),但是这个过程会丢帧(Lossy)

在这里插入图片描述

4)Anomaly Detection(异常检测)

当一个新的资料来的时候,我们去判断他和我们训练的资料是否是相似的,是就输出正常(normal),不是就输出异常(anomaly)

相似的定义是根据情景来设计的。

在这里插入图片描述

5)制作图片

对于训练集训练过的人脸,我们就可以在测试集的时候重建出相似度很高的图片,而对于训练集没见过的图片,我们就不好完成图片的重建。

在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Liuyc-Code boy

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值