缺失值处理方法

缺失值填充
摘要由CSDN通过智能技术生成

缺失值是数据分析中一个常见的问题,因为在许多情况下,我们的数据集中会存在缺失数据。这些缺失值可能会导致分析结果偏差或错误,因此需要进行缺失值处理。下面介绍四种常见的缺失值处理方法:前向填充、移动平均、指数平滑、线性插值

1、前向填充(Forward Filling):使用前面最近的一个已知值来填充缺失值。当有多个连续的缺失值时,该方法将使用上一个已知值来填充所有缺失值,直到遇到下一个已知值。



# 构建一列随机缺失值列
unemploy['missing'] = unemploy['rate']
# unemploy.head()
# 随机选择10%行手动填充缺失值
mis_index = unemploy.sample(frac=0.1,random_state=999).index   # 获取缺失值所在的行标签
# mis_index   将存在缺失值的单元格转换为None
unemploy.loc[mis_index,'missing']=None


unemploy['f_fill'] = unemploy['missing']
unemploy['f_fill'].ffill(inplace=True)   # 默认实现前向填充


# 然后绘制散点--折线图实现观察
# 首先绘制关于date——rate散点图
plt.scatter(unemploy.year,unemploy.rate,s=10)
plt.plot(unemploy.year,unemploy.rate,label='real')


# 将非缺失点用“红点”绘制出来;缺失点用“倒三角”绘制出来
plt.scatter(unemploy[~unemploy.index.isin(mis_index)].year,unemploy[~unemploy.
  • 0
    点赞
  • 18
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值