eviews如何处理缺失数据填补_手把手教你处理数据中的缺失值

本文介绍了数据缺失的类型及其处理方法,包括随机遗失、完全随机缺失和非随机缺失,提供了从删除、填充平均值、中位数到使用线性插值、多重插补等策略,并强调了不同情况下选择合适方法的重要性。
摘要由CSDN通过智能技术生成
c7b425a42ae217172c99a27f18e7018b.png

作者:Leopold d’Avezac

翻译:廖倩颖

校对:杨毅远

本文长度为1900字,建议阅读8分钟

本文为大家介绍了数据缺失的原因以及缺失值的类型,最后列举了每一种缺失值类型的处理方法以及优缺点。

标签:离群数据 填充

不论是机器学习模型,KPI或者报告,缺失值和它们的替代值都会导致你的分析结果出现巨大错误。通常分析人员只用一种方式处理缺失值。但事实并非如此,下面我们会介绍三种类型的缺失值以及其对应的解决方法。

空值(null)的类型

随机遗失(MAR):在变量中空值的出现并非随机,而是取决于记录中已知或者是未知的特征。那么你可能会问自己,为什么其被称为随机遗失呢?这是因为空值与其实际值无关。这取决于你的数据集是否能被测试。为了找出替代值,你应该比较其他变量的分布,以获取具有缺失值和非缺失值的记录。

比如:一个关于教育的数据集缺失了很多小孩的IQ测试分数,只是因为相比十二岁的孩子,四岁的孩子很少会通过这个测试。所以出现的空值与IQ实际值没有相关性,而与年龄相关。

完全随机缺失(MCAR):空值的出现与记录中已知或者未知特征是完全无关的。再次重申ÿ

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值