DataFrame.dropna
定义:
DataFrame.dropna(axis=0, how='any', thresh=None, subset=None, inplace=False)
- thresh: 一行或者一列中最多有多少NaN
In [19]: df
Out[19]:
A B C D
0 NaN 2.0 NaN 0
1 3.0 4.0 NaN 1
2 NaN NaN NaN 5
3 NaN 3.0 NaN 4
In [20]: df.dropna(how='all')
Out[20]:
A B C D
0 NaN 2.0 NaN 0
1 3.0 4.0 NaN 1
2 NaN NaN NaN 5
3 NaN 3.0 NaN 4
In [21]: df.loc[2,'D'] = np.NaN
In [22]: df
Out[22]:
A B C D
0 NaN 2.0 NaN 0.0
1 3.0 4.0 NaN 1.0
2 NaN NaN NaN NaN
3 NaN 3.0 NaN 4.0
In [23]: df.dropna(how='all')
Out[23]:
A B C D
0 NaN 2.0 NaN 0.0
1 3.0 4.0 NaN 1.0
3 NaN 3.0 NaN 4.0
# 删除一列
In [25]: df.dropna(how='all', axis=1)
Out[25]:
A B D
0 NaN 2.0 0.0
1 3.0 4.0 1.0
2 NaN NaN NaN
3 NaN 3.0 4.0
In [22]: df
Out[22]:
A B C D
0 NaN 2.0 NaN 0.0
1 3.0 4.0 NaN 1.0
2 NaN NaN NaN NaN
3 NaN 3.0 NaN 4.0
# 一行中最多有两个NaN, 否则drop
>>> df.dropna(thresh=2)
A B C D
0 NaN 2.0 NaN 0
1 3.0 4.0 NaN 1