java ML回归预测_Spark MLlib回归算法------线性回归、逻辑回归、SVM和ALS

最新推荐文章于 2024-05-29 15:00:15 发布

weixin_39595537

最新推荐文章于 2024-05-29 15:00:15 发布

阅读量561

点赞数

文章标签： java ML回归预测

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39595537/article/details/115039560

版权

Spark MLlib回归算法------线性回归、逻辑回归、SVM和ALS

1、线性回归：

(1)模型的建立：

回归正则化方法(Lasso，Ridge和ElasticNet)在高维和数据集变量之间多重共线性情况下运行良好。

数学上，ElasticNet被定义为L1和L2正则化项的凸组合：

通过适当设置α，ElasticNet包含L1和L2正则化作为特殊情况。例如，如果用参数α设置为1来训练线性回归模型，则其等价于Lasso模型。另一方面，如果α被设置为0，则训练的模型简化为ridge回归模型。

(2)实战：

利用线性回归+随机梯度下降算法构建一个线性模型，并进行预测，最后计算均方误差(Mean Squared Errors)来对模型进行评估。

val conf = new SparkConf().setAppName("LeanerRegressionModelDemo").setMaster("local[4]")

val sc = new SparkContext(conf)

val data = sc.textFile("C://Users//BIGDATA//Desktop//文件//BigData//Spark//7.SparkMLlib_2//resource//resource//ridge-data//lpsa.data")

val parsedData = data.map { line =>

val parts = line.split(',')

LabeledPoint(parts(0).toDouble, Vectors.dense(parts(1).split(' ').map(_.toDouble)))

}.cache()

// Building the model

val numIterations = 20

val model = LinearRegressionWithSGD.train(parsedData, numIterations)

// Evaluate model on training examples and compute training error

val valuesAndPreds = parsedData.map { point =>

val prediction = model.predict(point.features)

(point.label, prediction)

}

val MSE = valuesAndPreds.map{ case(v, p) => math.pow((v - p), 2)}.reduce(_ + _)/valuesAndPreds.count

println("training Mean Squared Error = " + MSE)

2、逻辑回归：

(1)数学公式

逻辑回归一般是用来预测二元分类的，它的线性方法可以用公式(1)进行描述，它的损失函数用公式(2)进行描术：

f(w):=λR(w)+1n∑i=1nL(w;xi,yi) (1)

这里，xi∈Rd 代表训练数据， 1≤i≤n ， yi∈R对应的是labels. 目标函数f有两部分：正则化和损失函数，前者的作用是为了去躁，后者是用来评估训练数据模型的误差。在w中损失函数L(w;.)是一个典型的凸函数。固定的正则化参数λ≥0(代码中用regParam 表示)，用来权衡两目标间的最小损失。下面是sparkmllib当中的损失函数和它对应的梯度下降方法数学表达式：接下来的正则化函数公式： sign(w) 是由 (±1)组成的向量。

L(w;x,y):=log(1+exp(−ywTx)) (2)

对于二元分类问题，训练输出一个预测模型，给定一组向量X,能过通过公式(3)进行预测。

f(z)=1/(1

最低0.47元/天解锁文章

weixin_39595537

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
java ML回归预测_Spark MLlib回归算法------线性回归、逻辑回归、SVM和ALS

Spark MLlib回归算法------线性回归、逻辑回归、SVM和ALS1、线性回归：(1)模型的建立：回归正则化方法(Lasso，Ridge和ElasticNet)在高维和数据集变量之间多重共线性情况下运行良好。数学上，ElasticNet被定义为L1和L2正则化项的凸组合：通过适当设置α，ElasticNet包含L1和L2正则化作为特殊情况。例如，如果用参数α设置为1来训练线性回归模型，则...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。