无监督学习之稀疏编码，自编码

最新推荐文章于 2023-09-20 09:20:37 发布

kejistudy

最新推荐文章于 2023-09-20 09:20:37 发布

阅读量2k

点赞数 1

分类专栏： python实践文章标签：深度学习神经网络机器学习 python 自编码器

本文链接：https://blog.csdn.net/kejistudy/article/details/116106257

版权

本文介绍了无监督学习中的稀疏编码和自编码器。稀疏编码旨在通过少量元素重建数据，自编码器则用于降维、特征检测和数据生成。文章详细讲解了自编码器的结构、目标函数以及去噪编码器的作用，并提供了核心代码示例。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

前言

一、稀疏编码

1.基本概念

稀疏编码这一概念来源于神经生物学，例如看到的每幅画都是上亿像素的，但在初级视觉皮层中。每个神经元只对特定的刺激信号做出响应（例如特殊条纹，特定方向的边缘），每幅画像经过大脑处置之后只用较小的代价取重建和储存，仅存入重要的信息。
以此类比，外界的信息在经过编码后仅有一部分神经元被激活，即外界信息在神经系统的表示上有稀疏性。
稀疏编码的目的：在大量的数据集中，选取很小部分作为元素来重建新的数据。
编码的概念：（线性）编码指将输入样本 $\in R^D$ ，表示为一组基向量 $A=[\alpha_1,...\alpha_M]$ 的线性组合。
$=\Sigma_{m=1} ^M z_m \alpha_m$
X 表示D维空间的样本，例如一幅图片在这里插入图片描述

A为标准化的基础矩阵，表示构成组成元素的基本原子，可称为字典，在图像中可表示为构成图像的基本边，角。在这里插入图片描述

A为基向量（字典）。Z为编码（基向量的系数），AZ表示经过编码后的x，表示外界环境经过编码后只有一小部分神经元被激活，则外界刺激在系统的表示中具有很高的稀疏性。
注：稀疏性的定义：非零元素的比例。若向量z中仅有几个非零元素则说明该向量是稀疏的。

维度角度：D维空间中的样本x 找到其在P维空间的表示，为了稀疏编码需要找到一组“过完备的基向量，因为过完备的基向量下往往存在冗余，因此会出现很多有效的编码。（根据线代知识，P>D ，则说明这个稀疏矩阵有很多解）
对这些编码加一个稀疏性限制，将减少解空间大小，得到唯一的稀疏性编码。

2. 模型算法

给定一组N个输入向量。目标函数为
$\rho$ 表示衡量稀疏性函数-z越稀疏， $\rho(z)$ 越小， $\eta$ 超参数，用来控制稀疏性强度。
其中，衡量稀疏性函数有多种形式：在这里插入图片描述

二、自编码

1. 概念

上面两组数据如果让你记忆，哪一行数据会更容易记住呢？咋一看，可能会觉得肯定是第一行，但仔细分析后发现第二组数据长，但存在一定规律，偶数项的后一项是除2得到的数，奇数项的后一项是三倍加一。这个过程就涉及到记忆、感知、和模式匹配的关系。
和这样的记忆模式类似，一个自编码器接收输入，将其转换成高效的内部表示，然后再输出输入数据的类似物。自编码器通常包括两部分：encoder（也称为识别网络）将输入转换成内部表示，decoder（也称为生成网络）将内部表示转换成输出。
自编码器通过简单地学习将输入复制到输出来工作。这一任务就是输入训练数据，再输出训练数据的任务，输入数据进行一高效表示，其维度一般远小于输入数据。