eviews如何处理缺失数据填补_寻找数据集中缺失值的最佳填充方法,填补,分析,思路,整理...

本文介绍了如何使用eviews处理数据集中的缺失值,包括用均值、0和随机森林策略进行填补。通过比较不同方法的建模效果,如MSE,展示了每种方法的适用性。
摘要由CSDN通过智能技术生成

寻找数据集最佳的缺失值的填补方法(分析思路的整理):

第一步,导入需要用到的库;

第二步,导入完整的数据集并进行探索,以波士顿数据为例

例如:将特征数据集和标签数据集分出来

X_full

,

y_full

=

dataset

.

data

,

dataset

.

target

# 找出特征列的的行列的范围

n_samples

=

X_full

.

shape

[

0

]

n_features

=

X_full

.

shape

[

1

]

第三步,为完整数据集放入缺失值

首先设置一个缺失的比例,计算出缺失的数据的数量

然后从特征的行列索引范围内,随机取要选的数量

missing_features = rng.randint(0,n_features,n_missing_samples)

# randint(下限,上限,n)  ,意思是请在下限和上限之间取出n个整数

missing_samples = rng.randint(0,n_samples,n_missing_samples)

最后,防止操作错误,先复制数据集,然后,将选出的索引值的位置用nan填充

X_mi

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值