基于典型相关性分析的多视图学习方法(基于半监督学习的 CCA)——基于标签传播的半监督典型相关分析(LPbSCCA)

基于标签传播的半监督典型相关分析(Semi-supervised Canonical Correlation analysis based on Label Propagation, LPbSCCA)是一种结合了典型相关分析(CCA)和标签传播技术半监督学习方法,由Shen等人提出。

该方法特别适用于处理只有部分样本带有标签的多视图数据集旨在利用少量的标注信息来改善无监督数据的表示学习。

LPbSCCA的目标

LPbSCCA的目标是在两个或多个视图(数据集)之间学习一组共享的潜在表示,即使得每个数据集的潜在表示在CCA的意义上具有最大的相关性,同时利用有限的标签信息来指导学习过程,以提高表示学习的效果和分类性能。

标签传播

标签传播是一种常用的半监督学习技术,用于从少量标记样本中推断大量未标记样本的标签。

该技术基于这样的假设:如果两个样本在特征空间中很接近,那么它们很可能属于同一类别

在LPbSCCA中,Shen等人利用标签传播技术来估计未标记样本的类信息,进而辅助CCA学习。

LPbSCCA的数学框架

假设我们有两个数据集 X 1 \mathbf{X}_1 X1 X 2 \mathbf{X}_2 X2 ,每个数据集包含 N N N 个样本,但可能有不同的特征维度 d 1 d_1 d1 d 2 d_2 d2

其中,一部分样本带有类别标签,而大部分样本是未标记的。

LPbSCCA的目标是找到两个非线性变换 f 1 ( X 1 ; θ 1 ) f_1(\mathbf{X}_1; \theta_1) f1(X1;θ1) f 2 ( X 2 ; θ 2 ) f_2(\mathbf{X}_2; \theta_2) f2(X2;θ2) ,其中 θ 1 \theta_1 θ1 θ 2 \theta_2 θ2对应的网络参数,使得变换后的数据在CCA的意义上具有最大的相关性同时利用标签传播技术来估计未标记样本的类别信息,以指导学习过程。

LPbSCCA的损失函数

LPbSCCA的损失函数通常包含两个部分:

  1. CCA损失:用于最大化变换后数据集之间的相关性类似于DCCA中的CCA损失。
  2. 标签传播损失:用于利用已知的标签信息和样本间的相似度来推断未标记样本的类别信息,通常通过构建邻接图和标签传播算法来实现。

具体的损失函数可以表示为:

L L P b S C C A = L C C A + λ L p r o p L_{LPbSCCA} = L_{CCA} + \lambda L_{prop} LLPbSCCA=LCCA+λLprop

其中,

  • L C C A L_{CCA} LCCA 是CCA损失,用于最大化两个变换后数据集之间的相关性。
  • L p r o p L_{prop} Lprop 是标签传播损失,用于利用已知的标签信息和样本间的相似度来推断未标记样本的类别信息。
  • λ \lambda λ 是超参数,用于平衡CCA损失和标签传播损失的贡献。

公式解析

  • X 1 \mathbf{X}_1 X1 X 2 \mathbf{X}_2 X2 :原始输入数据集。
  • f 1 ( ⋅ ) f_1(\cdot) f1() f 2 ( ⋅ ) f_2(\cdot) f2() :由深度神经网络实现的非线性变换函数。
  • C f 1 ( X 1 ) f 2 ( X 2 ) \mathbf{C}_{f_1(X_1)f_2(X_2)} Cf1(X1)f2(X2) :变换后的数据 f 1 ( X 1 ) f_1(\mathbf{X}_1) f1(X1) f 2 ( X 2 ) f_2(\mathbf{X}_2) f2(X2) 之间的互协方差矩阵,用于CCA损失。
  • L p r o p L_{prop} Lprop :标签传播损失,基于邻接图和标签传播算法,用于估计未标记样本的类别信息。
  • λ \lambda λ :超参数,用于调节CCA损失和标签传播损失的相对重要性。

训练过程

LPbSCCA的训练过程涉及使用梯度下降或其他优化算法来最小化上述定义的损失函数。

这意味着要调整网络参数 θ 1 \theta_1 θ1 θ 2 \theta_2 θ2 ,使得变换后的数据在CCA空间中尽可能地相关,同时利用标签传播技术来估计并利用未标记样本的类别信息,以指导表示学习。

结论

LPbSCCA提供了一种有效的框架,用于处理部分标记的多视图数据集,特别是在数据标注成本高昂或难以获取的情况下。

通过结合CCA和标签传播技术,LPbSCCA能够从有限的标注信息中学习高质量的共享表示,这对于各种实际应用场景,如图像分类、文本分类和生物信息学分析等,都有着重要的意义。

  • 34
    点赞
  • 30
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

不易撞的网名

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值