AASAE：通过数据增强替换KL

Flame5376

已于 2024-06-26 15:44:01 修改

阅读量532

点赞数 21

文章标签：人工智能机器学习聚类 embedding 学习

于 2024-06-25 22:54:55 首次发布

本文链接：https://blog.csdn.net/m0_46114999/article/details/139969842

版权

Abstract

通过数据增强替换KL正则化

缺点：

优势：

方法：

缺点：

都十分重视通过数据增强的方法来结合领域知识

确保单个输入和表示之间存在大致上一对一的映射
这可以防止内部表示崩溃到单个点上，类似于对比学习中批量统计的正则化中的反例。

确保内部表示在语义上排列在紧凑的空间中。
这在对比和非对比方法中执行类似于数据增强的作用，但不同之处在于它与输入域无关。

定义：通过数据增强来增强变分自动编码器

通过基于特定领域的数据增强去噪准则来代替KL散度
优势：

代理任务旨在预测输入的非平凡但容易适用的转换方式
如：

总结：好用但需要大量负例

旨在通过依赖数据级别或批次级别的统计数据来学习没有负样本的良好表示
分两类，基于聚类的和基于蒸馏的

在这里插入图片描述

三种机制：

最小化了重建误差，这鼓励 VAE 的中间表示对于每个观察或多或少是唯一的。换句话说，它确保输入的内部表示不会相互崩溃。
表示为对近似后验的期望，是通过确保对表示的微小扰动不会显着改变解码的观察来使表示空间平滑。
KL目的：
确保数据分布下任何观察的表示很可能在先验分布下。先验分布通常构造为标准正态分布，这意味着概率质量高度集中在原点附近（尽管不一定在原点上）。这确保了来自观察的表示根据它们的语义紧密排列，而不依赖于任何领域知识。