Semi-Supervised Support Vector Machines(S3VMs)

对于Semi-Supervised Support Vector Machines (S3VMs),即半监督支持向量机的直观理解是很简单的,如下图所示。在左图中,所有的数据都是有标签数据,所以可以使用SVM的最大化间隔来确定分离超平面。如果存在大量无标记的点,如右图所示,该如何确定分离超平面呢?如果还是采用左图所示的分离超平面,则分离超平面会将稠密的无标记数据切分成两个不同的类。但是根据图上的数据分布来看,该分离超平面很可能不是最优的,最优的分离超平面为图中实线所示,它就是由S3VMs得到的一个决策边界。上面简单介绍了S3VMs的直观理解,下面从理论层面详细介绍该算法。由于S3VMs是基于SVM的,所以先介绍SVM的部分理论知识。

SVM and S3VM

Support Vector Machines(SVM)

假设存在两个类 y{ 1,1} ,决策边界为

{ x|wTx+b=0}

f(x)=wTx+b ,则决策边界为 f(x)=0 。对于样本 x 的预测值为 sign(f(x)) ,它到决策边界距离的绝对值为 |f(x)|/||w||

决策边界将整个特征空间划分成两份, f>0 f<0 。对于有标记样本 (x,y) ,带符号的距离为

yf(x)/||w||

如果分类正确,则带符号的距离为正,否则为负。对于线性可分的情况,可以将问题转化为下列带约束的优化问题

minw,b s.t. ||w||2yi(wTxi+b)1,i=1,...,l

对于线性不可分的情况,至少有一个点不能满足上述约束条件时,引入松弛因子 ξ ,将问题转为下述优化问题

minw,b,ξ s.t. i=1lξi+λ||w||2<
  • 2
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值