spark实现下的逻辑回归(logistic regression)

本文介绍了Spark 2.0以后的逻辑回归功能增强,包括支持二分类和多分类。讨论了逻辑回归在分类和回归中的应用,并指出在Spark 1.6和2.0版本中多分类的setFamily方法可能不适用。同时提供了完整的逻辑回归二分类代码示例,数据可以手动创建或从文件读取。
摘要由CSDN通过智能技术生成

在spark2.0之前,逻辑回归只能做二分类的。之后加上了多分类。

根据我的理解,逻辑回归既可以用来分类,也可以用来回归,但是官网并没有给出logistic regression回归的例子,只有线性回归(linear regression)的例子

此外,官网给出了逻辑回归二分类和多分类的例子,但是多分类中的setFamlily方法无法在spark1.6和spark2.0的版本上运行,无论是用IDEA还是spark-shell。

这里给出完整的逻辑回归二分类代码,数据创建方式有两种:手动代码输入和从文件读取。

代码如下:

/**
  * Created by wangtuntun on 17-3-7.
  * 将数据代入模型进行预测
  * 本来想用logistic regression做回归的,结果点开的是官网的classification下的代码
  * 而且还是只支持二分类的代码
  */
import org.apache.spark.{SparkContext, SparkConf}
import org.apache.spark.ml.classification.LogisticRegression
import org.apache.spark.ml.param.ParamMap
import org.apache.spark.mllib.linalg.{Vector, Vectors}
import org.apache.spark.sql.Row
import org.apache.spark.sql.SQLContext
object predict_with_logistic_regression_classification {
  def main(args: Array[String]): Unit = {
    // Prepare training data from a
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值