import pandas as pd
import numpy as np
# 缺失值检测
# 加载数据
# data = pd.read_excel('qs.xlsx')
# print(data)
# 利用isnull进行空值判断 -->返回bool df ,如果为True, 就是空值,如果为False,就是真实值
# print(data.isnull())
# 与sum连用,统计每一列空值个数
# print(data.isnull().sum())
# 利用notnull进行空值判断 -->返回bool df ,如果为True, 就是真实值,如果为False,就是空值
# print(data.notnull())
# 与sum连用,统计每一列真实值个数
# print(data.notnull().sum())
# 缺失值处理
# 删除法
# axis = 0 ,删除行
# any 只要行里面有空值,就删除整行
# inplace = True 替换原文本
# all 只有整行整列数据全为空值就删除
# data.dropna(axis=0,how='any',inplace=True)
# print(data)
# 删除法 --》存在NA就删除----》对数据影响较大(慎用)
# 如果某一行或者某一列数据存在大量的缺失值,这个时候就可以使用删除法删除
# 填充法
# 使用fillna进行填充,需要制定填充的内容,inplace是否覆盖原来数据
# 注意填充的数值型数据,可以使用均值,众数,中位数进行填充
# 类别型数据需要使用众数进行填充
# data['门店编号'].fillna('CDNL', inplace=True)
# print(data)
# 填充值必须为单个数值,不可以为序列,众数不唯一,取下标获取单个众数
# data['类别ID'
pandas 控制检测与处理
最新推荐文章于 2021-11-10 21:47:31 发布
![](https://img-home.csdnimg.cn/images/20240711042549.png)