课程笔记——Unsupervised Learning：Deep Auto-encoder

最新推荐文章于 2022-11-07 16:40:59 发布

mintminty

最新推荐文章于 2022-11-07 16:40:59 发布

阅读量187

点赞数

分类专栏：模型原理笔记

本文链接：https://blog.csdn.net/mintminty/article/details/93379290

版权

9 篇文章 0 订阅

订阅专栏

1.思路

目的：用神经网络降维，得到低维度code
过程：
1.Encoder编码器

2.Decoder解码器

3.Encoder编码器-Decoder解码器连接在一起，即可完成学习
在这里插入图片描述

主成分分析： $c$ 可视为hidden layer(线性的)，若将中间整体当作神经网络来看，我们将中间的层称为Bottleneck layer(因为中间维度小)
在这里插入图片描述
深度自编码： 与PCA相比，即多加了几个hidden layer

1.仅从pixel图片通过t-SNE，发现4、9分不开
在这里插入图片描述
2.先将pixel通过PCA降至32维，再利用t-SNE，结果仍然是4、9分不开

3.训练一个auto-encoder，将其中encoder部分拿出来，将手写数字图片输入，结果如下

1.传统方法：vector space model向量空间模型

将每个query和对应的document全部用一组向量描述，计算query-每个document的角度，相似度越高则其越可能成为搜寻的结果
向量描述的方法：bag-of-word，即高维的向量。缺点：仅能做到字面比对，未考虑到语义

2.我们希望不仅考虑字面意思，还要考虑语义意思。即输入一个词汇不仅将包含该词的文章找出，还希望有关联的文章被找出。
将bag-of-word通过auto-encoder降成2维(即每篇文章均为二维空间的点)，结果如图
此时输入query，经过auto-encoder降维，再计算与文章间的相似度，从而找出同类文章