spark mllib svm java_Spark-MLlib-SVM源码实现分析

注:MLlib中的SVM只实现了线性二分类。没有非线性(核函数),也没有多分类和回归。线性二分类的优化过程类似于逻辑回归。以下从三个方面进行分析:(一)SVM的目标函数、损失函数和最优化方法。(二)从MLlib实现的源码分析模型创建以及优化的过程。(三)参考ML中NaiveBayes的实现,探索SVM-Pipeline的实现思路。一、SVM 公式1.1 目标函数目标函数:** y = wx **(...
摘要由CSDN通过智能技术生成

注:MLlib中的SVM只实现了线性二分类。没有非线性(核函数),也没有多分类和回归。线性二分类的优化过程类似于逻辑回归。以下从三个方面进行分析:(一)SVM的目标函数、损失函数和最优化方法。(二)从MLlib实现的源码分析模型创建以及优化的过程。(三)参考ML中NaiveBayes的实现,探索SVM-Pipeline的实现思路。

一、SVM 公式

1.1 目标函数

目标函数:** y = wx **

(注:w是超平面的法向量)

1.2 损失函数

损失函数:HingeGradient

公式:** avg( max(0, 1 - (2 y - 1) f_w(x))) )**

(注:0 1分类label,在svm中要转为 -1,1

1.3 优化函数(随机梯度下降)

梯度:** -(2y - 1) * x **

正则项:** L2 = (1/2) * w^2 **

梯度更新方法:** weight = weight - lambda (gradient + regParam * weight) **

二、MLlib源码实现分析

下图是SVMWithSGD的类图,SVMWithSGD继承了GeneralizdLinearAlgorithm。run()方法会调用optimitor:GradientDescent(gradient, updater)优化得到模型的权值参数weights,并调用createModel(weights)方法new一个SVMModel,返回SVMModel。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值