预计阅读时间:3分钟
今日锦囊
怎么去除DataFrame里的缺失值?
这个我们经常会用,当我们发现某个变量的缺失率太高的时候,我们会直接对其进行删除操作,又或者说某一行我不想要了,想单独删除这一行数据,这个我们该怎么处理呢?这里介绍一个方法,DataFrame.dropna(),具体可以看下图:
从方法介绍可以看出,我们可以指定 axis
的值,如果是0,那就是按照行去进行空值删除,如果是1则是按照列去进行操作,默认是0。
同时,还有一个参数是how
,就是选择删除的条件,如果是 any
则是如果存在一个空值,则这行(列)的数据都会被删除,如果是 all
的话,只有当这行(列)全部的变量值为空才会被删除,默认的话都是any
。
好了,举几个栗子,我们还是用climate数据集: