分层抽样后训练模型时的bug修复

根据上一篇博客中的方法对样本进行分层抽样,抽样后反复测试,都觉得没有任问题,但是在训练模型的时候执行:
models = LogisticRegression(C = 1000 , tol= 1e-10 , max_iter= 1000)
models.fit(data_train_2 , data_Y_2)
报错内容为:
raise ValueError(“Unknown label type: %r” % y_type)
ValueError: Unknown label type: ‘unknown’

一直找原因,经过一番探索,终于找到了问题的根源,就是抽样后返回的目标字段的类型和原始字段不统一了,所以导致建模报错。原始数据的目标字段数据类型为dtype: int64, 而抽样后目标字段的数据类型为dtype: object,

解决方法为:
data_train_0 = stratifiedSampling(data_train_1,‘S_ORG’,‘MARK’,10)
data_Y_2 = data_train_0[‘MARK’].astype(np.int64)
data_train_2 = data_train_0.drop(‘MARK’, axis = 1)
这样就把目标字段的数据类型转换成了模型认可的类型。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值