使用python库对缺失值/重复值/空值的处理

#查看缺失值总数
a = df.isnull().sum()   #a=每列缺失值个数
b = a.sum   #求和
print(f'缺失值总数 : {b}')
#删除含有缺失值的列,并打印删除列数或行数
c = len(df.columns)   #c是原本表格的列数   不加columns是行数
df1 = df.dropna(axis=1,how='any')   #删除含有缺失值的列(axis=0是行)
d = len(df1.colums)   #d是修改后表格的数量
e = c-d
print(f'被删除的列数: {e}') #删除含有缺失值的列,并打印删除列数或行数
#使用平均值填补缺失值和空值
f = df['某列'].mean()   #计算某一列平均值(sum总和,median中位数,std标准差,min最小值,max最大值)
g = df['某列'].fillna(f)   #使用平均值填充
print('某表'.fillna(0))   #使用0填补缺失值空值
#删除包含重复值的行
h = df.drop_duplitcates(subset='某列',keep='first')   #删除某列中有重复值的行(只保留第一次出现的行)
  • 10
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值