mllib调参 spark_SparkMLlib分类算法之支持向量机

最新推荐文章于 2024-04-27 23:38:24 发布

weixin_39812065

最新推荐文章于 2024-04-27 23:38:24 发布

阅读量279

点赞数

文章标签： mllib调参 spark

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39812065/article/details/111526424

版权

SparkMLlib分类算法之支持向量机

(一)，概念

支持向量机(support vector machine)是一种分类算法，通过寻求结构化风险最小来提高学习机泛化能力，实现经验风险和置信范围的最小化，从而达到在统计样本量较少的情况下，亦能获得良好统计规律的目的。通俗来讲，它是一种二类分类模型，其基本模型定义为特征空间上的间隔最大的线性分类器，即支持向量机的学习策略便是间隔最大化，最终可转化为一个凸二次规划问题的求解。参考网址：http://www.cnblogs.com/end/p/3848740.html

(二)，SparkMLlib中SVM回归应用

2，处理数据及获取训练集和测试集

val orig_file=sc.textFile("train_nohead.tsv")//println(orig_file.first())

val data_file=orig_file.map(_.split("\t")).map{

r=>val trimmed=r.map(_.replace("\"",""))

val lable=trimmed(r.length-1).toDouble

val feature=trimmed.slice(4,r.length-1).map(d => if(d=="?")0.0

elsed.toDouble)

LabeledPoint(lable,Vectors.dense(feature))

}/*特征标准化优化*/val vectors=data_file.map(x =>x.

最低0.47元/天解锁文章

weixin_39812065

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
mllib调参 spark_SparkMLlib分类算法之支持向量机

SparkMLlib分类算法之支持向量机(一)，概念支持向量机(support vector machine)是一种分类算法，通过寻求结构化风险最小来提高学习机泛化能力，实现经验风险和置信范围的最小化，从而达到在统计样本量较少的情况下，亦能获得良好统计规律的目的。通俗来讲，它是一种二类分类模型，其基本模型定义为特征空间上的间隔最大的线性分类器，即支持向量机的学习策略便是间隔最大化，最终可转化为一个...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。