1. 缺失值处理
缺失值处理主要有三个内容、四个函数:发现缺失值(isnull() notnull())、删除缺失值(dropna())、填补缺失值(fillna())
首先创建一个矩阵
1.1 发现缺失值
发现缺失值是生成布尔类型的掩码数据,两个函数相反
1.2 删除缺失值
基本类型dropna(axis=0, how =‘any’,tresh) ,其中axis是按行还是按列删除、how有两种any-有缺失值即删除和all-全部确实删除、tresh是限定非缺失值的数量
eg1:有缺失删除该列
eg2:按列,全部缺失删除
eg3:按列,非缺失值至少为三个
1.3 填补缺失值
填补缺失值fillna(),除了给固定值,还可以method参数,有ffill-从前向后填充和bfill-从后向前填充
固定值填充
按列前向填充