python中cut函数_“意外的关键字参数'axis'”tunning SckitLearn在使用Pandas'cut函数后的train_test_split函数...

我在操作数据集时遇到了这个问题。我的数据集采用CSV格式,结构如下:ID,FieldOne,FieldTwo,FieldThree,FieldFour,FieldThree,FieldFour,FieldFive,ToPredict1,337,118,4,4.5,4.5,9.65,1,0.922,324,107,4,4,4.5,8.87,1,0.763,316,104,3,3,3.5,8,1,0....
摘要由CSDN通过智能技术生成

我在操作数据集时遇到了这个问题。我的数据集采用CSV格式,结构如下:ID,FieldOne,FieldTwo,FieldThree,FieldFour,FieldThree,FieldFour,FieldFive,ToPredict

1,337,118,4,4.5,4.5,9.65,1,0.92

2,324,107,4,4,4.5,8.87,1,0.76

3,316,104,3,3,3.5,8,1,0.72

“ToPredictField”是一个概率,它告诉我为某个进程选择每一行的可能性。这是我的类专栏,我想把它分为5类:非常不可能(<=0.5)、不太可能(介于0.5和0.7之间)、中等(介于0.7和0.8之间)、可能(介于0.8和0.9之间)、非常相似(>0.9)。我是这样使用Pandascut函数来实现的:

^{pr2}$

现在,我尝试运行train_test_split将数据集分成67%的train/33%:data_X = dataset[['ID','FieldOne','FieldTwo','FieldThree','FieldFour','FieldThree','FieldFour','FieldFive']].values

data_Y = dataset['Chance of Admit '].values

train_X, test_X, train_Y, test_Y = train_test_split(data_X, data_Y, test_size=0.33, random_state=10)

但是,我得到一个错误:/usr/

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值