数据缺失值填补

20 篇文章 0 订阅
14 篇文章 0 订阅

缺失值填充方法包括简单填充、属性填充和实例填充三种类型,本文主要研究属性填充方式。

填充依赖原始数据的单一或少量属性维度,利用属性间的关系或属性潜在的规则对缺失值进行填充。

常用的属性填充方法有:基于回归分析、信息增益、灰色预测的方法和EM 算法等。

基于回归分析的填充方法通过拟合回归数学模型计算缺失值,该方法仅适用于满足确定数学模型的数据集;基于信息增益的方法,依据与缺失数据关联密切的属性对缺失值进行填充,该方法针对标称型数据效果良好,但不适用于数值型数据;

序列缺失数据的灰插值推理方法通过引入灰色预测模型拟合单属性函数,插值填充缺失值,取得了良好的效果,然而该算法限制了训练模型,可伸缩性不强;

基于EM 模型的填充方法认为数据服从含参分布,算法经过多次迭代收敛填充缺失数据,得到的填充效果良好但迭代方式很大程度地加大了算法复杂性,限制了方法的实际应用。

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值