python randomforest 离散值_Python Sklearn RandomForest和缺少的值

我正在尝试对包含缺少值的数据集执行RandomForest。

我的数据集看起来像:train_data = [['1' 'NaN' 'NaN' '0.0127034' '0.0435092']

['1' 'NaN' 'NaN' '0.0113187' '0.228205']

['1' '0.648' '0.248' '0.0142176' '0.202707']

...,

['1' '0.357' '0.470' '0.0328121' '0.255039']

['1' 'NaN' 'NaN' '0.00311825' '0.0381745']

['1' 'NaN' 'NaN' '0.0332604' '0.2857']]

为了估算“NaN”值,我使用:from sklearn.preprocessing import Imputer

imp=Imputer(missing_values='NaN',strategy='mean',axis=0)

imp.fit(train_data[0::,1::])

new_train_data=imp.transform(train_data)

但我得到了以下错误:Traceback (most recent call last):

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值