describe函数输出含义
NA数据已经删除
in:
print(adult["Hours-per-week"].describe())
#输出每周工作的小时总量
output:
count:总数
mean:平均值
std:方差
min:最小值
25%:25%分位数
50%:50%分位数
75%:75%分位数
max:最大值
Name:名字
dtype:数据类型
分位值:
25%分位值对应40.000000在这里意思是少于25%的人每周工作总量低于40。
75%分位值对应45.000000在这里意思是少于75%的人每周工作总量低于45。
分位值计算例子:
设有一组数据【1 8 5 2 3 6 4 1 2 9 7】
先从小到大排序
- 1
- 1
- 2
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
一共11个数,共10个数字间隔,每个四分位间10/4=2.5个数。
-
计算25分位:
第1个四分位数为上面11个数中的第1+2.5=3.5个数
指的是第三个数+第三个和第四个数中间的0.5位置处,即:
2+0.5*(2-2)= 2 -
计算50分位:
第2个四分位数为上面11个数中的第1+2.5*2=6个数
即:4 -
计算75分位:
第3个四分位数为上面11个数中的第1+2.53=8.5个数
指的是第八个数+第八个和第九个数中间的0.5位置处,即:
6+0.5(7-6)=6.5