1、https://blog.csdn.net/lwgkzl/article/details/80948548此篇博客有讲解
注意:
1、删除
规则:
any:只要某行或者某列有缺失值就删除
all:全部缺失才删除
thresh: 一行或一列中至少出现了thresh个才删除(限定出现具体的缺失值再删除)
subset:在某些列的子集中选择出现了缺失值的列删除,不在子集中的含有缺失值的列或行不会删除(由axis决定是行还是列);限定某行或者某列进行操作
inplace:刷选过缺失值得新数据是存为副本还是直接在原数据上进行修改。
2、填充数值
规则:
value指定填充怎样的数值;fillna表示用同样的值填充,比如fillna(5)表示用5替换缺失值
value则指明用特定的值填充特定的行或者列;
axis:注明如何填充(行/列);
method:ffill(axis=1表示横向的前面的值替换后面的缺失值,如果axis=0,那么则是上面的值替换下面的缺失值。)
与ffill相对的backfill/bfill表示缺失值后面的一个值代替前面的缺失值;
limit:限定填充缺失值的个数
注:method中的参数ffill和value不可同时使用
操作:
1、先创建3行3列的数据表
2、利用_.dropna()函数,()内若不注明,则为默认值,默认删除行和只要含有缺失值的;故此函数作用:只要含有缺失值的行均会被删除
print df.dropna(how='all',axis=1);若要对列进行操作需要在括号内特别注明(axis=1),how='all'表示列或者行全部缺失时才删除
3、利用_.fillna填充函数,以下操作同博客内容,注意其中截取的代码为部分代码,要想实现整个效果,定要将所创建的数表和函数结合(不然会报错)
4、函数DataFrame.isna()用来判断是不是缺失值,以true/false的形式
用来确定,即查找
5、最上面链接博客的最后一小部分写出了用heelo替换空格值