Spark MLlib数据挖掘7--评估矩阵

Spark MLlib数据挖掘7–评估矩阵

Spark MLlib附带了许多机器学习算法,可用于学习和预测数据。当这些算法应用于构建机器学习模型时,需要根据某些标准评估模型的性能。而为了对模型的性能进行评价,Spark MLlib还提供了一套度量标准,用于评估机器学习模型的性能,如分类模型评估和回归模型评估。

分类模型评估
分类算法有很多,但分类模型的评估都具有相似的原理。在监督分类问题中,存在每个数据点的真实输出和模型生成的预测输出。因此,每个数据点的结果可以分配到以下四个类别之一:
真阳性(TP) - 标签为正,预测也为正。
真阴性(TN) - 标签为阴性,预测也为阴性。
假阳性(FP) - 标签为阴性但预测为阳性。
假阴性(FN) - 标签为正,但预测为负。

二分类问题模型评估参数回顾:
二进制分类器用于将给定数据集的元素分成两个可能的组中的一个(例如欺诈或非欺诈),是多类分类的特殊情况。大多数二进制分类度量可以推广到多类分类度量。评估参数如下:
在这里插入图片描述
Spark MLlib中二分类问题模型评估样例代码如下:

import org.apache.spark.mllib.classification.LogisticRegressionWithLBFGS
import org.apache.spark.mllib.evaluation.BinaryClassificationMetrics
import org.apache.spark.mllib.regression.LabeledPoint
import org.apache.spark.mllib.util.MLUtils
val metrics = new BinaryClassificationMetrics(predictionAndLabels)
val precision = metrics.precisionByThreshold
precision.foreach {
    case (t, p) => println(s“Threshold: $t, Precision: $p”) } //准确率
val recall = metrics.recallByThreshold
recall.foreach {
    case (t
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值