Series.dropna().unique()
>>> ser = pd.Series([1., 2., np.nan])
>>> ser
0 1.0
1 2.0
2 NaN
>>> ser.dropna()
0 1.0
1 2.0
dtype: float64
ser=pd.Series([1,2,np.nan])
ser.dropna(inplace=True)##返回值是none
值得注意的是dataframe.dropna()
是删除含有nan的一行或者一列
pd.Categorical
c = pd.Categorical(['a','b','c','a','b','c','d'], ordered=True,categories=['c', 'b', 'a'])
print(c)
--》[a, b, c, a, b, c, NaN] ##没有的类别换成成NAN
Categories (3, object): [c < b < a]##大小排序
print(c.categories)
--》Index(['c', 'b', 'a'], dtype='object')
print(c.codes)
--》[ 2 1 0 2 1 0 -1]##NAN编码转化为-1