Python超实用小技巧:统计每列缺失值的占比

该博客介绍了如何在Python中计算数据框中缺失值的百分比。`missing_percent`函数通过计算每一列的缺失值数量占总数量的比例,并对有缺失值的列进行排序,返回缺失值占比大于0的列及其缺失值百分比。示例结果显示,`Embarked`列缺失值占比0.22%,`Age`列缺失值占比19.8%。
摘要由CSDN通过智能技术生成
  • 代码

 def missing_percent(df):
     nan_percent = 100*(df.isnull().sum()/len(df))
     # df.isnull().sum()统计每一列的缺失值数量
     # 再除上len()得到每一列的缺失值比例——小数形式
     # *100得到百分数
     nan_percent = nan_percent[nan_percent > 0].sort_values()
     # 得到每列的缺失值的占比,升序排序
     # >0是为了筛掉没有缺失值的列,只返回有缺失值的
     return nan_percent
 print(missing_percent(train))

结果将输出回train数据每列的缺失值占比(如果缺失值为0则不显示)

  • 结果示例

 Embarked     0.224467
 Age         19.865320
 dtype: float64

Embarked列缺失值为0.22%

Age列缺失值为19.8%

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值