四个统计量的概念
Ø平均数(mean)也成为均值,它是一组数据相加后出医院数据的个数得得到的结果,样本均值用表示,总体均值用。
Ø中位数(median)是一组数据排序后处于中间位置上的数值,用表示。
Ø四分位数(quartile)是一组数据排序后处于25%和75%位置上的书;用和表示。
标准差;离差平方后再求平均数即是方差(variance),方差开方后就是标准差(standard deviation)。总体方差;样本方差;则样本标准差是S,总体标准差是
Ø 标准分(standard score),测度每个数值在该组数据中的相对位置,并可以用它来判断一组数据是否有离群点。标准分数说的是某个数据与平均数相比相差多少个标准差,他是某个数据与其平均数的离差除以标准差后的值。
数据集准备
《随机抽取25个网络用户,得到他们的年龄(单位:周岁).xls》。数据集来源于人民大学出版社出版的贾俊平老师独著的《统计学(第六版)》第3章练习题3.1。网址如下:
用Excel求统计量
Ø 均值;使用average函数;代码清单:=AVERAGE(A1:A25);结果是24;
Ø 中位数;使用median函数;代码清单:=MEDIAN(A1:A25);结果23;
Ø 上四分位数;代码清单:=QUARTILE.INC(A1:A25,1);结果:19;
Ø 下四分位数;代码清单:=QUARTILE.INC(A1:A25,3);结果:27;
Ø 方差;Excel中没有求方差的函数;因此使用公式方差=标准差的平方;
Ø 标准差;使用stdev.s函数;代码清单:=STDEV.S(A1:A25);结果:6.652067348;
Ø 标准分;求第一个值得标准分,代码清单:=(A1-AVERAGE(A1:A25))/STDEV.S(A1:A25);结果:-0.751646028;
用R语言求统计量
第一步:导入数据
代码清单:
> test
> test
第二步:求统计量
Ø 均值;
代码清单:
>c
>c
[1] 24
Ø 中位数;
代码清单:
> c
> c
[1] 23
Ø 上四分位数;
代码清单:
> c
>quantile(c,.25)
25%
19
Ø 下四分位数;
代码清单:
>quantile(c,.75)
75%
27
Ø 方差;
代码清单:
>var(c)
[1] 44.25
Ø 标准差;
代码清单:
>sd(c)
[1] 6.652067
Ø 标准分;
代码清单:
> a
> a
[1] -0.751646
用Python求统计量
第一步:数据和库准备
代码清单:
>>> import numpy as np
>>> array = np.arange(10)#创建一个0-10的一维数组
>>> array#显示数组
array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
第二步:求统计量
Ø 均值;
代码清单:
>>> np.mean(array)
4.5
Ø 中位数;
代码清单:
>>> np.median(array)
4.5
Ø 标准差;
代码清单:
>>>np.std(array)
2.8722813232690143