pandas当中有很多对于数据整体状况进行描述的信息,这些信息在我们进行了解数据的时候很有用。
我们假设df为我们已经导入的DataFrame数据,方法的运用均为 df.方法名 。
下面是一些描述整体信息常用的方法:
df.info()方法: i 可以查看(数据有多少行多少列;各个属性的类型object 、int32 、int64等)
df.head(number)方法: 可以查看(前number行的数据值)
df.sample(n)方法 : (随机的查看几个样本)
df.shape属性: 可以查看(数据有多少行多少列)
df.describe()方法:默认情况下只显示出来数值类型的数据情况,可以查看(数据的统计情况如均值、方差、最大最小值、分位数)
df.describe(include='all') 加入include参数以后,可以显示所有数据的情况,显示出来的信息如下(count、unique、top、freq 还有上述默认情况下的信息)
df.isnull().sum() 可以查看(每个列中有多少个nan值)