项目场景:pandas.describe()参数的意义
python数据清理方面一般都会用到df.describe()这个函数,但其实这是可以传参数的。比如以泰坦尼克号生存预测为例
df = pd.read_csv(’./train.csv’)
df.describe()
python pandas中,对于一维数组,describe会返回一系列参数,count,mean,std,min,25%,50%,75%,max。
describe()返回值的解释如下:
1、count:返回数组的个数,如上述为4个元素,所以返回为4;
2、mean:返回数组的平均值,1 3 5 9的平均值为4.5;
3、std:返回数组的标准差;
4、min:返回数组的最小值;
5、25%,50%,75%:返回数组的三个不同百分位置的数值,也就是统计学中的四分位数,其中50%对应的是中位数。
6、max:返回列表的最大值。
df.describe(include=‘O’)
大写英文字母 O