Spark--LinearRegressionWithSGD

最新推荐文章于 2024-04-20 23:47:31 发布

Enche

最新推荐文章于 2024-04-20 23:47:31 发布

阅读量974

点赞数

分类专栏：机器学习

本文链接：https://blog.csdn.net/Enche/article/details/79047552

版权

机器学习专栏收录该内容

21 篇文章 2 订阅

订阅专栏

测试数据：链接: https://pan.baidu.com/s/1i7owaXJ 密码: 4wqg

代码记录：

import org.apache.spark.mllib.linalg.Vectors
import org.apache.spark.mllib.regression.{LabeledPoint, LinearRegressionWithSGD}
import org.apache.spark.sql.SparkSession

/**
  * Created by root on 1/12/18.
  */
object LinearRegressionWithSGDTest {
  def main(args: Array[String]): Unit = {
    val path = "/home/enche/data/lpsa.data"
    val spark = SparkSession.builder().appName("LinearRegressionWithSGD").master("local").getOrCreate()
    val sc = spark.sparkContext
    val data = sc.textFile(path)
//将数据转成Rdd[LabelPoint]格式
    val traindata = data.map(
      line=>LabeledPoint(
        line.split(",")(0).toDouble, Vectors.dense(line.split(",")(1).split(" ").map(_.toDouble))
      )
    )
//train(Rdd[LabelPoint],最大迭代数，学习率，每批次占总数的百分比)
    val model = LinearRegressionWithSGD.train(traindata,100,0.2,0.1)
    print(model.weights)
  }
}

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Enche

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Spark--LinearRegressionWithSGD

测试数据：链接: https://pan.baidu.com/s/1i7owaXJ 密码: 4wqg代码记录：import org.apache.spark.mllib.linalg.Vectorsimport org.apache.spark.mllib.regression.{LabeledPoint, LinearRegressionWithSGD}import org.
复制链接

扫一扫