Python Pandas库如何查看一个dataframe对象,某一列元素的非空值的行数,如何查看某一列共有多少个不相同的值?
用例子来看一下,先创建一个dataframe对象df:
df = pd.DataFrame(np.arange(12).reshape(3,4),
index = list('ABC'),
columns = list('JKLM'))
df.iloc[1,2] =np.nan
df.iloc[2,3] = np.nan
df = df.append(df)
格式如下:
如何获取每列中非零元素的行数呢?使用
df.count()
输出如下:
也就是J列包含6个非nan行,L包括4个非空的行。单独看一列的个数可以使用df['J'].count(),获取J列的值的个数。
哪如何看某一列不同的值个数,也就是有duo呢多少个不同的元素呢?
1.使用df['J'].value_counts().count()
这里values_counts()返回不同值的及包含的个数,count()将行数返回回来。
2.使用df['J'].unique().shape[0]
这里unique()返回该列包含的所有不同值,以一个矩阵的形式返回。使用shape就该矩阵的形状获取。