【代码模版】数据缺失值处理

1. 缺失值情况查看

# 数据缺失值情况查看
columns_list = list(DF.columns)
for each_column in columns_list:
    if DF[each_column].isnull().sum() != 0:
        print(each_column, data3[each_column].isnull().sum())
# 对某个特征列具体缺失情况进行查看
DataFrame[DataFrame['column_name'].isnull()]

2. 对某个特征的缺失值进行平均值填充

DataFrame['column_name'].fillna(round(DataFrame['column_name'].mean()), inplace=True)

3. 利用B特征列包含的字符串信息,来对A特征列的缺失值进行填充

# 查看A特征列缺失具体情况
DataFrame[DataFrame['columnA'].isnull()]
# 查看A特征缺失处对应的包含A所需要的信息的B特征的具体情况
DataFrame.loc[DataFrame['columnA'].isnull(), 'columnB']
# 定位到A特征缺失信息的具体位置
DataFrame.loc[DataFrame['columnA'].isnull(), 'columnA']
# 结合前面两步,利用字符串提取来补充A的缺失信息
DataFrame.loc[DataFrame['columnA'].isnull(), 'columnA'] = [str(x)[m: n] for x in DataFrame.loc[DataFrame['columnA'].isnull(), 'columnB']]

4. 删除缺失值

# 删除缺失值
DF2 = DF1.dropna()
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

不停下脚步的乌龟

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值