机器学习理论 | 周志华西瓜书第十三章：半监督学习

最新推荐文章于 2024-06-20 22:14:07 发布

ZIYUE WU

最新推荐文章于 2024-06-20 22:14:07 发布

阅读量979

点赞数

分类专栏： Machine Learning

本文链接：https://blog.csdn.net/Tinky2013/article/details/89032655

版权

30 篇文章 6 订阅

订阅专栏

第十三章半监督学习

此系列文章旨在提炼周志华《机器学习》的核心要点，不断完善中…

1、一些概念
主动学习(active learning)：使用尽量少的query获得经良好的性能
半监督学习(semi-supervised learning)：让学习器不依赖外界交互，自动利用未标记样本来提升学习性能

2、一些假设
聚类假设(cluster assumption)：假设数据存在簇结构，同一个簇的样本属于同一个类别
流形假设(manifold assumption)：假设数据分布在一个流形结构上，邻近的样本拥有相似的输出值

3、半监督学习分类
纯半监督学习：假定训练数据中的未标记样本并非预测的数据
直推学习：假定学习过程中所考虑的未标记样本恰是预测数据

1、概述

2、公式推断

数据样本生成基于的概率密度： $p(\bm x)=\sum_{i=1}^N\alpha_i*p(\bm x|\bm\mu_i,\bm\Sigma_i)$
推导:
后验概率： $p(\Theta=i|\bm x)=\frac{\alpha_i*p(\bm x|\bm\mu_i,\bm\Sigma_i)}{\sum_{i=1}^N\alpha_i*p(\bm x|\bm\mu_i,\bm\Sigma_i)}$
$D_l\bigcup D_u$ （标记样本集 $\bigcup$ 未标记样本集）对数似然：
$LL(D_l\bigcup D_u)=\sum_{(\bm x_j,y_j)\in D_l}ln(\sum_{i=1}^N\alpha_i*p(\bm x|\bm\mu_i,\bm\Sigma_i)*p(y_j|\Theta=i,\bm x_j))+\sum_{\bm x_j\in D_u}ln(\sum_{i=1}^N\alpha_i*p(\bm x_j|\bm\mu_i,\bm\Sigma_i))$

上式两部分：有监督项和无监督项

3、EM算法求解高斯混合模型的参数估计
E步：根据当前模型参数计算未标记样本xj属于各高斯混合成分的概率M步：基于γji更新模型参数（li表示第i类的有标记样本数目）μi∑iαi方法关键：模型假设必须准确

代表：TSVM(Transductive Support Vector Machine)
学习目标： $D_u$ 中样本预测标记
限制条件
TSVM算法

聚类任务中获得的监督信息类型

利用第一类监督信息的代表：约束k均值算法
在这里插入图片描述
利用第二类监督信息的代表：约束种子k均值算法

关注