info()函数与describe()函数
一,info()函数
- 功能: 给出样本数据的相关信息概览 :行数,列数,列索引,列非空值个数,列类型,内存占用
- 使用格式:data.info()
- DataFrame.info(verbose=None, memory_usage=True, null_counts=True)
- verbose:True or False,字面意思是冗长的,也就说如何DataFrame有很多列,是否显示所有列的信息,如果为否,那么会省略一部分;
- memory_usage:True or False,默认为True,是否查看DataFrame的内存使用情况;
- null_counts:True or False,默认为True,是否统计NaN值的个数
二,describe()函数
-
功能:直接给出样本数据的一些基本的统计量,包括均值,标准差,最大值,最小值,分位数等。
-
使用格式:data.describe()
-
可以传递一些参数,如percentiles = [0.2,0.4,0.6,0.8]就是指定0.2,0.4,0.6,0.8分位数,而不是默认的0.25,0.5,0.75分位数。
>data.describe()
age
> count 3.000000
> mean 20.666667
> std 2.516611
> min 18.000000
> 25% 19.500000
> 50% 21.000000
> 75% 22.000000
> max 23.000000
>data.describe(percentiles = [0.2,0.4,0.6,0.8])
> age
> count 3.000000
> mean 20.666667
> std 2.516611
> min 18.000000
> 20% 19.200000
> 40% 20.400000
> 50% 21.000000
> 60% 21.400000
> 80% 22.200000
>max 23.000000