PySpark入门十八:ML之评估器

评估器

评估器被视为需要评估的统计模型,对数据做预测或分类。包含了七种分类。

评估器分类

  1. LogisticRegresssion: 逻辑斯蒂回归,实际作用于二分类场景;
  2. DecisionTreeClassifier: 决策树,适用于分类场景。maxDepth:限制树的深度,minInstancePerNode:树节点观察数据的最小数量,maxBins:参数指定连续变量将被分割的Bin的最大数量,impurity:测量并计算来自分割信息的度量;
  3. GBTClassifier: 用于分类的梯度提升决策树模型,集合多个弱分类的模型形成一个强健的模型,支持二进制标签、连续特征和分类特征;
  4. RandomForestClassifier:随机森林,支持二元标签和多项标签,对观察对象进行分类;
  5. NaiveBayes:贝叶斯定理,条件概率理论对数据分类,支持二元标签和多项标签;
  6. MultilayerPerceptronClassifier:多层感知机分类器,模仿人类大脑本质的分类器,理论基础为神经网络理论,该模型通常包含三层:输入层(需要和训练数据中特征的数量一样)、多个隐藏层、输出层,其中,神经元个数等于标签中的类别数量。输入层和隐藏层中的所有神经元都有sigmod激活函数,输出层的激活函数为softmax;
  7. OneVsRest:将多元分类问题简化为二分类问题。在多标签情况下,模型可以训练成多个二元逻辑回归模型,所有模型分别积分,具有最高概率的模型获胜。如果label==2,模型将构建一个逻辑回归,将label为2的转换为1,其余标签值转化为0,然后训练二元模型。

这就是今天学习的ML的7个评估器,对多层感知机的理解更加清晰了一些,之前学习深度学习的时候,一直处于懵懂的状态,之后会分享数据建模案例。 学习数据建模,先弄明白模型的逻辑和使用场景是十分必要的。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值