数据挖掘中模型填补的方法

最新推荐文章于 2024-07-25 23:56:17 发布

聋聋聋聋呀

最新推荐文章于 2024-07-25 23:56:17 发布

阅读量1.5k

点赞数

分类专栏： SAS 文章标签：数据挖掘缺失值填补中位数填补模型填补缺失值 FCS回归

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Er_longlong/article/details/89684552

版权

数据挖掘中，模型填补缺失值的方法与样本量大小有关。当样本量适中，常使用proc stdize（均值、中位数）和proc mi（基于模型）；大量样本时，倾向proc dmzip（中位数）和决策树模型填补。对于连续变量的缺失值，FCS回归是常见选择，proc mi过程步结合多重插补减少随机偏差。

摘要由CSDN通过智能技术生成

填补方法与样本量相关

通常，数据挖掘领域建模时数据样本的填补方法与样本量的大小息息相关，一般，如果变量间取值关联程度较强，则模型填补的方式似乎更为常见：

样本量适中的情况下，我会使用如下两种方式进行缺失值的填补

一种方法是利用proc stdize过程步，这种方法只能利用基本的描述统计的方法进行填补，例如使用均值、中位数等方式，此外，这种方式也能够同时进行样本的标准化。工作中，这个过程步的使用频率很高。

另一种方法是利用proc mi过程步<

最低0.47元/天解锁文章

聋聋聋聋呀

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

聋聋聋聋呀 CSDN认证博客专家 CSDN认证企业博客

码龄8年

45: 原创

5万+: 周排名

87万+: 总排名

14万+: 访问

: 等级

1835: 积分

52: 粉丝

54: 获赞

3: 评论

315: 收藏

私信

关注

热门文章

分类专栏

Tableau 1篇
金融风控 2篇
SAS 38篇
数据分析行业看法 2篇
EXCEL 1篇

最新评论

从样本T检验到六西格玛
普通网友: 不错，优思学院也在发表六西格玛的相关文章和ILSSI认证的资讯，有空来看看！
信用评分建模时的坑
qq_40909212: 您好，请问扩大坏样本的浓度，坏样本命中率会在实际好坏样本浓度下发生变化吗？如何通过在好坏样本浓度1:1时的坏样本命中率推导出在实际好坏样本浓度下的坏样本命中率？
我眼中的信用评分模型
weixin_44302802: 你好，我一家头部持牌消金风控高层，请问你是在哪个城市，方便的话，加个微信号，业务交流一下，谢谢～

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。