1 查看前(后)x行数据:
#前x行:
df.head(x)
#后x行:
df.tail(x)
df.iloc[-x:, :]
2 查看所有列名:
df.columns
3 查看数据行列数:
df.shape
4 查看行数:
#方法一:
df.shape[0]
#方法二;
len(df)
5 查看列数:
#方法一:
len(df.columns)
#方法二:
df.shape[1]
#方法三:
df.info()
6 查看索引、数据类型和内存信息:
df.info()
7 查看索引:
df.index
8 查看数值型列的汇总统计:
df.describe()
np.percentile(df, q=[0, 25, 50, 75, 100])
9 查看每列的数据类型:
df.dtypes
10 查看某列共有几种元素:
#方法一:
df['xxx'].nunique()
#方法二:
len(df['xxx'].unique())
#方法三:
len(df.groupby('xxx'))
#方法四:
len(df['xxx'].value_counts())
11 查看pandas与numpy版本:
pandas.__version__
np.__version__
12 查看某一列各元素出现的次数:
df['xxx'].value_counts()
13 查看某列每个字符串的长度:
df['xxx'].str.len()