最近在做半监督分类,要和常用的半监督分类算法进行比较,因此,需要用常见半监督分类算法的matlab代码
由于以前没做过半监督,看了几篇论文后知道了常用的半监督算法有tsvn,基于生成模型的半监督算法,
感觉tsvm太难了,就想从基于生成模型的半监督算法入手,具体为用基于EM算法的半监督生成模型,这里的生成模型用混合高斯模型
在网上看了很多混合高斯模型的代码,但并没有用于半监督的,看博士论文里面用混合高斯模型如何实现半监督分类,也并不明白。(基础不好,看到数学概率公式就有点蒙,为了毕业看吧)
将半监督混合高斯模型的实现总结如下,再将网上的无监督混合高斯模型的matlab代码进行研究,希望能够得出半监督混合高斯模型的matlab代码
第一篇论文里关于这部分的内容:基于生成模型的半监督模型:该算法首先假设样本由某种分布生成,这里我们用混合高斯模型,然后把未标记样本的条件概率(什么意思,是不是p(y|x),是不是已知未标记样本的情况下它的类标的概率)看做是缺失参数,利用标记样本和未标记样本(这里问题出现了,如何利用呢?)通过最大期望算法即EM来对生成模型的参数进行估计(什么参数?条件概率吗?)在获得最优参数后即可用于判别未知样本的标签。
第二篇论文里关于这部分的内容:标准EM算法常利用最大似然准则对泛化模型进行参数估计,设数据集X={x1,x2,...xN}中的每个分量都是通过特定分布p(x|)(这些特殊符号怎么输入捏?)进行采样得到的。
则似然函数可定义为:p(x|)
EM算法是处理数据缺失情况下参数估计的有效手段,设数据集Z包括标记数据集X和未标记数据集Y,Z=(X,Y),