XGBoost常见错误与调优

一、常见错误

1、空值

报错信息:

java.lang.RuntimeException: you can only specify missing value as 0.0 (the currently set value NaN) when you have SparseVector or Empty vector as your feature format
at ml.dmlc.xgboost4j.scala.spark.XGBoost$$anonfun$verifyMissingSetting$1.apply(XGBoost.scala:77)
at ml.dmlc.xgboost4j.scala.spark.XGBoost$$anonfun$verifyMissingSetting$1.apply(XGBoost.scala:75)

XGBosot.scala报错地方点进去发现:

 

这里是XGBoost对于缺失值的处理,xxxxxxx

解决办法,设置missing处理的情况,

val xliff = new XGBoostClassifier(params)
  .setFeaturesCol("indexedFeatures") //feature 列
 .setLabelCol("indexedLabel") //lable 列
 .setMissing(0)  //设置对于缺失值的处理

2、xgboost4j-spark中碰到not found key:train

给xgb的参数setNumWorks(80)有关,设置的太大就会这样报错,原因是xgb中num_worker这个参数是表示模型在run的时候,会并行跑多少个worker,而每个worker起码是会分配到一个partition的。所以partition设置的越小

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值