Scala语言 + Spark MLLib进行机器学习---线性回归

最新推荐文章于 2020-07-30 03:34:16 发布

雁寻

最新推荐文章于 2020-07-30 03:34:16 发布

阅读量3.5k

点赞数

分类专栏： Spark/Scala 机器学习文章标签：机器学习 spark scala 线性回归

机器学习同时被 2 个专栏收录

8 篇文章 0 订阅

订阅专栏

Spark/Scala

5 篇文章 0 订阅

订阅专栏

下面的例子展示了如何加载数据，解析为RDD(译者注：RDD为Spark的弹性数据集)；然后利用线性回归+随机梯度下降算法构建一个线性模型，并进行预测，最后计算均方误差(Mean Squared Errors)来对模型进行评估。

import org.apache.spark.mllib.regression.LinearRegressionWithSGD
import org.apache.spark.mllib.regression.LabeledPoint

// Load and parse the data
val data = sc.textFile("mllib/data/ridge-data/lpsa.data")
val parsedData = data.map { line =>
  val parts = line.split(',')
  LabeledPoint(parts(0).toDouble, parts(1).split(' ').map(x => x.toDouble).toArray)
}

// Building the model
val numIterations = 20
val model = LinearRegressionWithSGD.train(parsedData, numIterations)

// Evaluate model on training examples and compute training error
val valuesAndPreds = parsedData.map { point =>
  val prediction = model.predict(point.features)
  (point.label, prediction)
}
val MSE = valuesAndPreds.map{ case(v, p) => math.pow((v - p), 2)}.reduce(_ + _)/valuesAndPreds.count
println("training Mean Squared Error = " + MSE)

优惠劵

雁寻

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Scala语言 + Spark MLLib进行机器学习---线性回归

下面的例子展示了如何加载数据，解析为RDD(译者注：RDD为Spark的弹性数据集)；然后利用线形回归+随机梯度下降算法构建一个线形模型，并进行预测，最后计算均方误差来对模型进行评估。import org.apache.spark.mllib.regression.LinearRegressionWithSGDimport org.apache.spark.mllib.regre
复制链接

扫一扫