对比学习方法（3）——BYOL

AIM086

已于 2025-01-22 17:38:42 修改

阅读量873

点赞数 14

分类专栏：对比学习无监督学习自监督学习文章标签：学习方法人工智能深度学习

于 2025-01-22 17:38:27 首次发布

本文链接：https://blog.csdn.net/qq_43538018/article/details/145307112

版权

对比学习同时被 3 个专栏收录

4 篇文章

订阅专栏

无监督学习

2 篇文章

订阅专栏

自监督学习

1 篇文章

订阅专栏

BYOL（Bootstrap Your Own Latent）是一种无监督对比学习方法，旨在通过学习增强表示的自监督学习来训练神经网络。与传统的对比学习方法（如SimCLR、MoCo等）不同，BYOL不依赖于负样本或对比的负对，而是通过一种创新的设计，利用两个网络（在线网络和目标网络）的交互来学习表示。这种设计简化了训练过程，同时避免了对大量负样本的需求。

1. BYOL的核心框架

BYOL的核心结构包括两个主要组件：

在线网络（Online Network）：负责学习任务，它包含一个编码器、一个映射头和一个预测器。
目标网络（Target Network）：它的结构与在线网络相同，但参数更新方式不同。

算法具体流程如下：

输入增强：给定一个样本 $x$ ，通过随机数据增强生成两个不同的视图 $x_1$ 和 $x_2$ 。
特征提取：
- 在线网络的编码器对 $x_1$ 进行特征提取，生成嵌入表示 $z_1$ ，然后通过映射头得到映射表示 $q_1$ 。
- 目标网络的编码器对 $x_2$ 进行特征提取，生成嵌入表示 $z_2$ ，再通过映射头生成映射表示 $y_2$ 。
预测：在线网络中的预测器 $g(\cdot)$ 将 $q_1$ 转化为预测表示 $p_1$ 。
一致性目标：BYOL的目标是使 $p_1$ 和 $y_2$ 的表示尽可能相似（通过计算相似性损失）。同样地，反向操作对 $x_2$ 和 $x_1$ 也计算相似性损失，即 $x_2$ 输入到在线网络， $x_1$ 输入到目标网络。

2. 参数更新

BYOL采用不同的策略来更新在线网络和目标网络的参数。

在线网络 通过 反向传播 优化标准梯度下降来更新。

目标网络 通过 指数移动平均（EMA）更新，其参数是在线网络参数的指数加权平均值。公式如下： $\theta_{\text{target}} \leftarrow \tau \theta_{\text{target}} + (1 - \tau) \theta_{\text{online}}$ 其中， $\tau$ 是一个平滑系数，通常设为接近于 $1$ 的值（如 $0.99$ ）。这种设计确保了目标网络的参数变化更平滑，提供一个稳定的对齐目标。

3. 损失函数

BYOL使用 余弦相似度损失 来衡量两个表示之间的相似性。假设 $p_1$ 和 $y_2$ 是经过归一化的向量，损失函数定义为： $\mathcal{L}(p_1, y_2) = -\frac{p_1 \cdot y_2}{\|p_1\| \|y_2\|}.$ 总的损失是从两个视图的对称损失之和： $\mathcal{L}_{\text{total}} = \mathcal{L}(p_1, y_2) + \mathcal{L}(p_2, y_1).$

4. 特点和优势

无需负样本：BYOL摆脱了对比学习中依赖负样本的需求，简化了实现难度，并避免了负样本选择不当可能导致的优化问题。
训练稳定性：通过目标网络的EMA更新机制，BYOL在训练过程中表现出极大的稳定性。
泛化性强：BYOL能学习到高质量的表征，适用于下游任务（如分类、检测）的迁移学习。
避免崩塌问题：理论上，直接优化BYOL的目标可能导致模型学到恒定表示（即崩塌）。然而，BYOL的设计（包括对称视图损失和目标网络EMA更新）在实践中有效避免了这种问题。