2021李宏毅机器学习课程-YouTube第六部分、自编码器Auto-encoder

最新推荐文章于 2024-05-26 21:21:03 发布

Liuyc-Code boy

最新推荐文章于 2024-05-26 21:21:03 发布

阅读量215

点赞数

文章标签：人工智能 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_52836217/article/details/128494512

版权

第六部分、自编码器Auto-encoder

1.Auto-encoder

Self-supervised learning是类似无监督学习的一种，self-supervised learning又叫做Pre-train。

Auto-encoder也可以用于图像辨识或者文字辨识问题，如右图所示是一个图像辨识问题。例如，我们输入一张高维的图片经过一个Encoder输出一个低维的向量，再用低维的向量作为输入，经过Decoder去还原一张图片，最终使得还原出来的图片和原图片尽可能的接近。
在这里插入图片描述

为什么一个高维的图片可以变成一个低维的向量，最后还能还原出一张图片？

因为一张图片看似是3 x 3的但是其中所蕴含的变化是有限的，比如下图所示的我们可以用一些二维的向量来表示3 x 3的图片的变化，从而实现用低维的向量表示一张图片，最后还能根据二维向量所对应的变化还原出图片。

在这里插入图片描述

2.De-noising Auto-encoder

De-noising Auto-encoder指的是在对图片进行encoder之前，添加一些杂讯(noises)在图片中，然后经过变换还原图片，最后和原图片尽可能的接近。

De-noising Auto-encoder过程和BERT类似，都是在最开始添加了杂讯，然后进行处理的过程，其中各部分的所对应的名词如下图所示。

在这里插入图片描述

3.特征分离

我们还可以实现特征的分离(Feature Disentangle)，比如下图是输入一段音频，我们可通过一个Encoder使得音频的内容信息和说话者的音频信息(包括音高，语调等等)进行分离，还可以实现变声器的功能。

下图中间是简单的Auto-encoder过程，输入一段音频再还原。右图是语音特征分离再组合，实现变声器。

在这里插入图片描述

我们在特征分离的时候，中间的低维向量可以使用真实的数字、二进制、one-hot编码等来表示不同的特征。
在这里插入图片描述

3.Vector Quantized Variational Auto-encoder (VQVAE)

下图表示的矢量量化变分自动编码器（VQVAE）指的是我们例如输入的图片通过Encoder之后得到一个低维向量，然后这个向量和我们数据集中学习得到的一些其他的向量分析相关性(self-attention)，最后拿最相关的作为输出，输入到Decoder中去还原图片。

在这里插入图片描述

4.更多应用

1）通过添加Discriminator输出文章摘要

下图所示的是机器通过训练大量文章，能够在encoder和decoder中间产生某种暗号，使得decoder能够还原出原文章，但是这个暗号是人们看不懂的，也就是中间的部分不能作为我们的摘要。

在这里插入图片描述

我们可以使用GAN中的想法添加一个看过人们写的文章的Discriminator，使得输出的摘要是我们能看懂的样子。

在这里插入图片描述

2）Generator

我们发现Auto-encoder的后半部分和GAN中的，由一个向量输出一个图片是一致的，所以这部分就可以当作是generator来用，VAE(variational auto-encoder)就是这种思想设计的，将auto-encoder的decoder作为generator来用。

在这里插入图片描述

3）Compression(压缩)

因为encoder就是输出一个低维的向量所以可以用作压缩(Compression)，反之decoder可以用作解压缩(Decompression)，但是这个过程会丢帧(Lossy)。

在这里插入图片描述

4）Anomaly Detection(异常检测)

当一个新的资料来的时候，我们去判断他和我们训练的资料是否是相似的，是就输出正常(normal)，不是就输出异常(anomaly)。

相似的定义是根据情景来设计的。

在这里插入图片描述

5）制作图片

对于训练集训练过的人脸，我们就可以在测试集的时候重建出相似度很高的图片，而对于训练集没见过的图片，我们就不好完成图片的重建。

在这里插入图片描述

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
2021李宏毅机器学习课程-YouTube第六部分、自编码器Auto-encoder

2021李宏毅机器学习课程-YouTube第六部分、自编码器Auto-encoder
复制链接

扫一扫

Liuyc-Code boy CSDN认证博客专家 CSDN认证企业博客

码龄4年

53: 原创

23万+: 周排名

5万+: 总排名

7万+: 访问

: 等级

661: 积分

224: 粉丝

108: 获赞

28: 评论

349: 收藏

私信

关注

热门文章

最新评论

计算机视觉OpenCv学习系列：第十部分、实时人脸检测
m0_57214303: 楼主请问一下深度学习的模型是哪一类
OpenMMlab AI实战营第三期培训
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
pycharm里用ananconda配置pytorch
Liuyc-Code boy: 我这里的pytorch是创建的虚环境的名字，是接着我前面写的这个安装anaconda来的https://blog.csdn.net/weixin_52836217/article/details/126674089
2021李宏毅机器学习课程-YouTube第一部分、绪论
Curry30Klay: 哥，写得真好
pycharm里用ananconda配置pytorch
LOvOJ: 佬，求问，conda配置的时候，在安装路径找到了pytorch但是里面没有python。exe怎么办，但是系统解释器选项里可以找到pytorch的python。exe 谢谢

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Liuyc-Code boy 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。