python randomforest 离散值_Python Sklearn RandomForest和缺少的值

最新推荐文章于 2023-03-27 22:01:58 发布

weixin_39620629

最新推荐文章于 2023-03-27 22:01:58 发布

阅读量153

点赞数

文章标签： python randomforest 离散值

本文链接：https://blog.csdn.net/weixin_39620629/article/details/111729187

版权

我正在尝试对包含缺少值的数据集执行RandomForest。

我的数据集看起来像：train_data = [['1' 'NaN' 'NaN' '0.0127034' '0.0435092']

['1' 'NaN' 'NaN' '0.0113187' '0.228205']

['1' '0.648' '0.248' '0.0142176' '0.202707']

...,

['1' '0.357' '0.470' '0.0328121' '0.255039']

['1' 'NaN' 'NaN' '0.00311825' '0.0381745']

['1' 'NaN' 'NaN' '0.0332604' '0.2857']]

为了估算“NaN”值，我使用：from sklearn.preprocessing import Imputer

imp=Imputer(missing_values='NaN',strategy='mean',axis=0)

imp.fit(train_data[0::,1::])

new_train_data=imp.transform(train_data)

但我得到了以下错误：Traceback (most recent call last):

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注