mllib调参 spark_Spark ML调参

最新推荐文章于 2022-05-25 14:50:59 发布

weixin_39714763

最新推荐文章于 2022-05-25 14:50:59 发布

阅读量175

点赞数

文章标签： mllib调参 spark

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39714763/article/details/111526430

版权

在机器学习中，如何根据给定的数据集，为算法模型拟合参数，使得模型达到最优的效果，这一过程称为“调参”(tuning)。

Spark的Mllib提供了CrossValidator和TrainValidationSplit两种方法，来帮助实现模型的调优。

一般使用上述的两种方法需要进行如下设置，

setEstimator方法指定需要调参的算法algorithm或是工作流Pipeline(Pipeline也是一种Estimator)；

setEstimatorParamMaps方法指定“参数网格”(使用new ParamGridBuilder().addGrid(xxx,xxx).build())，作为备选的参数组合；

setEvaluator指定评价方法，用来衡量训练好的模型在验证集上的表现。

交叉验证CrossValidator

import org.apache.spark.ml.Pipeline

import org.apache.spark.ml.classification.LogisticRegression

import org.apache.spark.ml.evaluation.BinaryClassificationEvaluator

import org.apache.spark.ml.feature.{HashingTF, Tokenizer}

import org.apache.spark.ml.linalg.Vector

import org.apache.spark.ml.tuning.{CrossValidator, ParamGridBuilder}

import org.apache.spark.sql.Row

// Prepare training data from a list of (id, text, label) tuples.

val training = spark.createDataFrame(Seq(

(0L, "a b c d e spark", 1.0),

(1L, "b d", 0.0),

(2L, "spark f g h", 1.0),

(3L, "hadoop mapreduce", 0.0),

(4L, "b spark who", 1.0),

(5L, "g d a y", 0.0),

(6L, "spark fly", 1.0),

(7L, "was mapreduce", 0.0),

(8L, "e spark program", 1.0),

(9L, "a e c l", 0.0),

(10L, "spark compile", 1.0),

(11L, "hadoop software", 0.0)

)).toDF("id", "text", "label")

// Configure an ML pipeline, which consists of three stages: tokenizer, hashingTF, and lr.

<

最低0.47元/天解锁文章

weixin_39714763

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
mllib调参 spark_Spark ML调参

在机器学习中，如何根据给定的数据集，为算法模型拟合参数，使得模型达到最优的效果，这一过程称为“调参”(tuning)。Spark的Mllib提供了CrossValidator和TrainValidationSplit两种方法，来帮助实现模型的调优。一般使用上述的两种方法需要进行如下设置，setEstimator方法指定需要调参的算法algorithm或是工作流Pipeline(Pipeline也是...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。