直接学习:https://edu.csdn.net/course/play/6861/371100
冗余值、异常值和缺失值的处理(二)
1、异常值的识别及处理
#z得分法
#分位数法
#距离法
2、缺失值的识别及处理
df.isnull
df.fillna
df.dropna
3、示例代码如下:
data05 = pd.read_excel(r'D:\Teach Plan\CSDN\PPT\第7章 pandas模块的介绍\data_test05.xlsx')
data05.head()
#识别缺失值
data05.isnull()
data05.isnull().any(axis = 0)
data05.isnull().sum(axis = 0)/data05.shape[0]
#缺失值的处理
data05.dropna(inplace = True)
data05.fillna(value = {'gender':data05.gender.mode()[0], 'age':data05.age.mean(),'income':data05.income.median()}, inplace = True)
print(data05)