CPC (representation learning with contrastive predictive coding)

最新推荐文章于 2025-03-20 18:21:03 发布

奔跑的林小川

最新推荐文章于 2025-03-20 18:21:03 发布

阅读量1.3w

点赞数 6

文章标签： CPC 表示学习

本文链接：https://blog.csdn.net/qq_31239495/article/details/82838398

版权

本文介绍了一种名为对比预测编码(CPC)的非监督学习通用算法，它在高维数据中提取有用表示，通过自回归模型预测未来隐变量，使用对比损失最大化样本信息。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

论文：https://arxiv.org/pdf/1807.03748.pdf

摘要：

监督学习在很多应用方面有了巨大的进步，但是非监督学习却没有如此广的应用，非监督学习是人工智能方面非常重要也非常具有挑战性的领域。这篇论文提出了 constrative predictive coding，一个非监督的通用的算法用于在高维度数据中提取有用的表示信息。算法的核心是通过强大的自回归（autoregressive）模型来学习未来的（预测的）隐变量表示。论文使用对比损失概率（probabilistic contrastive loss）来引入最大化预测样本的信息的隐变量。大多数其他研究的工作都集中在使用一个特殊的修正（公式）评估表示，论文（CPC）所使用的方法在学习有用信息表示的时候表现非常优异。

介绍：

迄今为止，在标注数据上通过端对端的方式学习高级表示是人工智能的巨大成功之处。但是，仍然存在数据使用效率，鲁棒性和泛化能力不足的缺点。非监督学习通常使用的策略常被用于预测未来、丢失或者上下文相关的信息。 Prodictive coding 是数据压缩的一个传统方式。神经科学认为大脑预测状态是多层的，有重点的，现阶段在预测上下文词语上的表示学习非常成功。论文假设上述的方法（指的是表示学习的一些方法）成功的部分原因是我们使用同样的高层隐变量信息来预测相关变量。

论文主要工作：①将高位数据压缩到更简洁的隐变量空间，该空间使用条件概率建造。②在隐变量中使用强大的自回归模型来预测未来可能的步骤。③使用对抗噪声估计（noise-contrastive estimation）

启发：

在时间序列和高维度建模中，使用下一步预测来开采信号的平滑度。当预测的更远，公用信息变得更少，模型需要更全局结构的推断。预测高维数据的挑战众多：①单峰的损失函数，如均方差，交叉熵不适用。②强大的生成模型需要重建数据的每个特征。

直接通过条件概率方程来探索数据 x 和内容 c之间的信息不是最有效的解决方案。论文在预测未来信息时，将目标x（未来的）和内容 c（现在的）通过非线性映射压缩成一个向量表示的分布，替代成互信息表示方式，如下公式所示：

对比预测编码：

如图所示，是非线性编码器，用于映射输入序列，到隐变量表示序列，自回归模型总结所有t时刻之前的隐变量空间和生成内容隐变量表示

论文构造了一个密度概率函数，用于保存探索序列和内容隐变量表示之间的互信息，公式如下：

论文使用log双线性模型：其中表示预测每一个步骤k的不同于线性转化。同时，如果使用非线性网络结构或者循环神经网络结构也是可以的。

论文使用了重要性采样（importance sampling）和noise-contrastive estimation等技巧，使用resnet作为编码器，GRUs作为自回归模型。如果使用现在最新的研究，比如masked convolutional architectures 或者 self-attention，可能会更大的提升实验结果。