前段时间看了一篇采用拉普拉斯支持向量机做半监督岩性识别的论文:
Semi-supervised learning for lithology identification using Laplacian support vector machinewww.sciencedirect.com中间查了很多资料发现中文互联网上对于拉普拉斯支持向量机(以下简称LapSVM)的介绍非常少,所以在这里聊以下我非常浅显的一点见解。
先下结论:LapSVM是一种专门为半监督学习而生的算法。
定义
那么什么是LapSVM呢?
LapSVM 算法通过将标记数据与未标记数据的边缘分布的几何结构信息转化为流形正则项并加入到传统的分类监督算法 SVM 中, 使之扩展为半监督框架下的学习算法.
上面这个定义是我在一篇介绍LapSVM的论文中摘抄的,一会我会把论文链接放到最后。
这个定义其实已经基本把LapSVM的基本特点阐述了:1.半监督学习方法。2.将流行正则项加如传统的SVM中。
原理
下面我从两个角度入手聊下LapSVM。
第一个角度:半监督
提到半监督,我的第一想法是,我现在有一堆数据集,他们大部分是没有标签的,少部分是有标签的,我们现在想使用这些数据集进行分类或者回归建模,那么我们第一步应该做什么呢ÿ