DataFrame.dropna(axis=0, how='any', thresh=None, subset=None, inplace=False)
Remove missing values.
pd.dropna()函数(官方文档)用于过滤数据中的缺失数据.
缺失数据在pandas中用NaN标记.
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randn(5, 3), index = list('abcde'), columns = ['one', 'two', 'three']) # 随机产生5行3列的数据
df.ix[1, :-1] = np.nan # 将指定数据定义为缺失
df.ix[1:-1, 2] = np.nan
print(df)
df.dropna() #删除所有带缺失数据的行
parameters | 详解 |
---|---|
axis | default 0指行,1为列 |
how | {‘any’, ‘all’}, default ‘any’指带缺失值的所有行;'all’指清除全是缺失值的行 |
thresh | int,保留含有int个非空值的行 |
subset | 对特定的列进行缺失值删除处理 |
inplace | 这个很常见,True表示就地更改 |
.
.
.
2018-11-21 15:30:46写于德州乐陵