基于典型相关性分析的多视图学习方法（基于半监督学习的 CCA）——基于标签传播的半监督典型相关分析（LPbSCCA）...

樊昱乔

于 2024-07-16 02:57:13 发布

阅读量33

点赞数

文章标签：学习方法学习人工智能

基于标签传播的半监督典型相关分析（Semi-supervised Canonical Correlation analysis based on Label Propagation, LPbSCCA）是一种结合了典型相关分析（CCA）和标签传播技术的半监督学习方法，由Shen等人提出。

该方法特别适用于处理只有部分样本带有标签的多视图数据集，旨在利用少量的标注信息来改善无监督数据的表示学习。

LPbSCCA的目标

LPbSCCA的目标是在两个或多个视图（数据集）之间学习一组共享的潜在表示，即使得每个数据集的潜在表示在CCA的意义上具有最大的相关性，同时利用有限的标签信息来指导学习过程，以提高表示学习的效果和分类性能。

标签传播

标签传播是一种常用的半监督学习技术，用于从少量标记样本中推断大量未标记样本的标签。

该技术基于这样的假设：如果两个样本在特征空间中很接近，那么它们很可能属于同一类别。

在LPbSCCA中，Shen等人利用标签传播技术来估计未标记样本的类信息，进而辅助CCA学习。

LPbSCCA的数学框架

假设我们有两个数据集基于典型相关性分析的多视图学习方法（基于半监督学习的 CCA）——基于标签传播的半监督典型相关分析（LPbSCCA）_数据集和，每个数据集包含个样本，但可能有不同的特征维度 和

其中，一部分样本带有类别标签，而大部分样本是未标记的。

LPbSCCA的目标是找到两个非线性变换基于典型相关性分析的多视图学习方法（基于半监督学习的 CCA）——基于标签传播的半监督典型相关分析（LPbSCCA）_python_06 和，其中和是对应的网络参数，使得变换后的数据在CCA的意义上具有最大的相关性，同时利用标签传播技术来估计未标记样本的类别信息，以指导学习过程。

LPbSCCA的损失函数

LPbSCCA的损失函数通常包含两个部分：

CCA损失：用于最大化变换后数据集之间的相关性，类似于DCCA中的CCA损失。
标签传播损失：用于利用已知的标签信息和样本间的相似度来推断未标记样本的类别信息，通常通过构建邻接图和标签传播算法来实现。

具体的损失函数可以表示为：

基于典型相关性分析的多视图学习方法（基于半监督学习的 CCA）——基于标签传播的半监督典型相关分析（LPbSCCA）_python_10

其中，

是CCA损失，用于最大化两个变换后数据集之间的相关性。
是标签传播损失，用于利用已知的标签信息和样本间的相似度来推断未标记样本的类别信息。

公式解析

和
和
：变换后的数据和

训练过程

LPbSCCA的训练过程涉及使用梯度下降或其他优化算法来最小化上述定义的损失函数。

这意味着要调整网络参数 基于典型相关性分析的多视图学习方法（基于半监督学习的 CCA）——基于标签传播的半监督典型相关分析（LPbSCCA）_python_08 和

结论

LPbSCCA提供了一种有效的框架，用于处理部分标记的多视图数据集，特别是在数据标注成本高昂或难以获取的情况下。

通过结合CCA和标签传播技术，LPbSCCA能够从有限的标注信息中学习高质量的共享表示，这对于各种实际应用场景，如图像分类、文本分类和生物信息学分析等，都有着重要的意义。

原创作者: u_15837794 转载于: https://blog.51cto.com/u_15837794/11458090

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。