sheng的学习笔记-AI-图半监督学习

AI目录:sheng的学习笔记-AI目录-CSDN博客

半监督学习:sheng的学习笔记-AI-半监督学习-CSDN博客 

 

什么是图半监督学习

给定一个数据集,我们可将其映射为一个图,数据集中每个样本对应于图中一个结点,若两个样本之间的相似度很高(或相关性很强)​,则对应的结点之间存在一条边,边的“强度”(strength)正比于样本之间的相似度(或相关性)​。

我们可将有标记样本所对应的结点想象为染过色,而未标记样本所对应的结点尚未染色。于是,半监督学习就对应于“颜色”在图上扩散或传播的过程。由于一个图对应了一个矩阵,这就使得我们能基于矩阵运算来进行半监督学习算法的推导与分析。这就是标记传播算法label propagation 

下面这一坨的算法,看看就得了,反正我也没看懂 

二分类问题的标记传播

原理

能量函数

 

 

标签传播算法假定在满足约束条件的条件下,能量函数 最低。其中约束条件为: 

 最优化求解

多类标签传播算法

迭代式标记算法

 

其实上述算法都对应于正则化框架:

 

结论

1)虽然二类标签传播算法和多类标签传播算法理论上都收敛,而且都知道解析解。但是:

因此标签传播算法一般选择迭代算法来实现。 

 

2)图半监督学习方法在概念上相当清晰,且易于通过对所涉及矩阵运算的分析来探索算法性质。

缺点:

  • 在存储开销上较大,使得此类算法很难直接处理大规模数据。
  • 由于构图过程仅能考虑训练样本集,难以判断新的样本在图中的位置。因此在接收到新样本时,要么将其加入原数据集对图进行重构并重新进行标记传播,要么引入额外的预测机制。

参考:

12.半监督学习 - 三、图半监督学习 - 《AI算法工程师手册》 - 书栈网 · BookStack 

机器学习 书 

  • 4
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值