python pandas中,对于一维数组,describe会返回一系列参数,count,mean,std,min,25%,50%,75%,max。
describe()返回值的解释如下:
1、count:返回数组的个数,如上述为4个元素,所以返回为4;
2、mean:返回数组的平均值,1 3 5 9的平均值为4.5;
3、std:返回数组的标准差;
4、min:返回数组的最小值;
5、25%,50%,75%:返回数组的三个不同百分位置的数值,也就是统计学中的四分位数,其中50%对应的是中位数。
6、max:返回列表的最大值。
扩展资料:
describe()函数有三个参数可以指定,分别是percentiles, include, exclude,三者的含义如下:
1、percentiles:默认是返回四分位数,即25%,50%和75%,可以修改:describe(percentiles=[.75, 0.8]),则返回的是50%,75%,80%位置的数,可以根据需要进行相应的处理。
2、include:默认只计算数值型特征的统计量,当参数为’all’时,显示所有类型的数据;当参数为numpy.number时,返回的是数值类型的数据;当参数为numpy.object,返回的是object类型的数据;当include=[‘category’]时,返回的是category;当include=[‘O’]时,返回统计的是字符串型的数据。
3、exclude:include可以指定返回类型,而exclude则可以指定不返回某种类型,即返回除指定类型之外的数据。
参考资料来源:python API-describe
参考资料来源:百度百科