Spark随机森林算法交叉验证、管道模型（pipeline）、模型评估代码实例

最新推荐文章于 2024-04-29 23:48:30 发布

小曹变老曹

最新推荐文章于 2024-04-29 23:48:30 发布

阅读量450

点赞数

分类专栏： Spark

本文链接：https://blog.csdn.net/feichong621/article/details/115143640

版权

package cn.itcast.tags.ml.classification

import org.apache.spark.ml.Pipeline
import org.apache.spark.ml.classification.RandomForestClassifier
import org.apache.spark.ml.evaluation.MulticlassClassificationEvaluator
import org.apache.spark.ml.feature.{StringIndexer, StringIndexerModel, VectorIndexer, VectorIndexerModel}
import org.apache.spark.ml.param.ParamMap
import org.apache.spark.ml.tuning.{CrossValidator, CrossValidatorModel, ParamGridBuilder}
import org.apache.spark.sql.{DataFrame, SparkSession}

object RfModel {
  def main(args: Array[String]): Unit = {
    val spark = SparkSession.builder()
      .appName(this.getClass.getSimpleName.stripSuffix("$"))
      .master("local[4]")
      .getOrCreate()
    import org.apache.spark.sql.functions._
    import spark.implicits._

    // 1. 加载数据
    val dataframe: DataFrame = spark.read
      .format("libsvm")
      .load("datas/ship/total001.txt")

    // 划分数据集：训练数据和测试数据
    va

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

小曹变老曹

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
Spark随机森林算法交叉验证、管道模型（pipeline）、模型评估代码实例

package cn.itcast.tags.ml.classificationimport org.apache.spark.ml.Pipelineimport org.apache.spark.ml.classification.RandomForestClassifierimport org.apache.spark.ml.evaluation.MulticlassClassificationEvaluatorimport org.apache.spark.ml.feature.{Strin
复制链接

扫一扫