数据特征工程 | Python实现特征工程之缺失值填充

19 篇文章 64 订阅 ¥29.90 ¥99.00
16 篇文章 1 订阅 ¥259.90 ¥399.90
本文介绍了在Python中处理数据特征工程时如何处理缺失值,包括使用Pandas的基本填充方法如均值、中位数和众数,以及使用SimpleImputer和KNN算法进行填充。强调了直接删除缺失值可能导致信息丢失,建议根据数据分布选择合适的填充策略。此外,文章讨论了数据缺失的原因、机制和类型,如MCAR、MAR、NMAR,为数据预处理提供指导。
摘要由CSDN通过智能技术生成

数据特征工程 | Python实现特征工程之缺失值填充

基本介绍

Pandas中缺失值填充的技巧:

  • 填充具体数值,通常是0;
  • 填充某个统计值,比如均值、中位数、众数等;
  • 填充前后项的值;
  • 基于SimpleImputer类的填充;
  • 基于KNN算法的填充

程序设计

数据统计
import pandas as pd
import numpy as np
df = pd.DataFrame({
   
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

前程算法屋

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值