em模型补缺失值_缺失值填补方法

weixin_39631953

于 2020-12-21 16:42:12 发布

阅读量3.6k

点赞数 3

文章标签： em模型补缺失值

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39631953/article/details/111799788

版权

得到一份数据文件时，常常会发现文件中存在一些缺失的数据，而缺失数据会对分析任务产生阻碍，造成结果的偏移和统计工作的低效率。处理缺失数据的流程大致是：确认数据缺失机制——选择缺失数据的处理方法。

1.确认数据缺失机制

处理缺失数据前，首先应该了解数据缺失的机制。缺失值的机制并非造成缺失值的原因，而是描述缺失值与观测变量间可能的关系。确定数据缺失机制有利于选择合适的处理方法对数据进行处理。一般情况下，缺失机制可以分为以下三种类型：

①完全随机缺失，假设缺失的概率对于各变量的取值是等概率的，即缺失是完全随机的，那么删除缺失数据后的结果将是无偏的。缺失概率与其他变量无关，也与该变量自身无关。

——检验方法：T检验，按照缺失指示变量将各计量变量分为两组，用T检验比较两组均值有误差别。【看到有文章说其他类型缺失机制可能也出现这样情形，但是我个人认为如果是将其他所有测量变量都比较应该就只有完全随机缺失满足。故，认为t检验可行】

②随机缺失，指缺失的概率只与模型中某些观测变量有关，而与该变量自身无关。例如，在一次测试中，如果IQ达不到最低要求的100分，那么将不能参加随后的人格测试。在人格测试上因为IQ低于100分而产生的缺失值为随机缺失。通常情况下，完全随机缺失的假设很难被满足，而随机缺失则是一个相对宽松的假设。

③非随机缺失，当某变量出现缺失值的可能性只与自身相关时称作非随机缺失。例如，公司新录用了20名员工，由于6名员工表现较差，在试用期内辞退，试用期结束后的表现评定中，辞退的6名员工的表现分即为非随机缺失。

各缺失机制的具体判断方法见链接：http://w

最低0.47元/天解锁文章

weixin_39631953

关注

3
点赞
踩
25

收藏

觉得还不错? 一键收藏
0
评论
em模型补缺失值_缺失值填补方法

得到一份数据文件时，常常会发现文件中存在一些缺失的数据，而缺失数据会对分析任务产生阻碍，造成结果的偏移和统计工作的低效率。处理缺失数据的流程大致是：确认数据缺失机制——选择缺失数据的处理方法。1.确认数据缺失机制处理缺失数据前，首先应该了解数据缺失的机制。缺失值的机制并非造成缺失值的原因，而是描述缺失值与观测变量间可能的关系。确定数据缺失机制有利于选择合适的处理方法对数据进行处理。一般情况下，缺失...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。