XGBoost报错feature_names mismatch

我们在训练好XGBoost后实际应用时可能会报下面的错误:

feature_names mismatch: ['sex', 'age', 其他列名作者略去]

通常报这个错误就是因为在训练模型时输入的数据包含列名,那么在模型训练好后实际应用中你输入的待遇测数据也要包含列名,也就是待遇测的数据格式应该和训练数据保持一致,这个一致包括要有列名以及列的顺序

通常我们训练时输入的数据格式是pd.DataFrame类型,在我们用测试数据构建DataFrame类型时可以使用

x_data =[{'sex':1, 'age':23,......}]
x_data = pd.DataFrame(x_data)

此时构建的数据的列名是乱序的,为了保持列名顺序一致可以再做下排序:

即把列的顺序显式指定出来

x_data = x_data[['sex','age',......]]

这样最终得到的x_data数据就是按sex、age等依次排序的。

 

当然还有其他的指定顺序的方法,有兴趣的也可以自己尝试下。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值