第三章 统计运算基础
1. 平均数
(1)算术平均数:
s
u
m
/
n
sum/n
sum/n
(2)加权平均数:
∑
i
=
1
n
x
i
w
i
∑
i
=
1
n
w
i
(
w
为
频
数
/
率
)
\frac{\sum^{n}_{i=1}x_iw_i}{\sum^n_{i=1}w_i}(w为频数/率)
∑i=1nwi∑i=1nxiwi(w为频数/率)
(3)调和平均数:
H
=
n
∑
1
x
H=\frac{n}{\sum\frac{1}{x}}
H=∑x1n
在某些情形下调和平均数与算术平均数等价。
例1:某人在100元/股,200元/股,300元/股三个价位各买进股票60000元,问所持股票的均价多少?
解:
H
=
总
金
额
总
股
数
=
60000
∗
3
60000
100
+
60000
200
+
60000
300
=
3
1
100
+
1
200
+
1
300
H=\frac{总金额}{总股数}=\frac{60000*3}{\frac{60000}{100}+\frac{60000}{200}+\frac{60000}{300}}=\frac{3}{\frac{1}{100}+\frac{1}{200}+\frac{1}{300}}
H=总股数总金额=10060000+20060000+3006000060000∗3=1001+2001+30013
例2:设某行业150个企业的有关产值和利润如下,计算第一二季度的平均产值利润率。
(产值利润率=实际利润 / 实际产值 * 100%)
解:
实际产值*利润率=实际利润
总利润率=总利润 / 总产值
对于第一季度:
已知实际产值,未知实际利润
对于第二季度:
已知实际利润,未知实际产值
(4)几何平均数:
G
=
∏
i
n
X
i
n
G=\sqrt[n]{\prod_{i}^nX_i}
G=ni∏nXi
用于计算平均比率或者平均发展速度。
例1:某人向银行贷款,第一季度利率5%,第二季度利率5.2%,第三季度利率4.6%,第四季度的利率是5.8%,问平均每季度的利率是多少?
易错写法:
例2:设某生产流水线由12道工序组成,据统计有3道工序的 不合格率为2%,有4道工序的不合格率为4%,有5道 工序的不合格率为5%,则平均的不合格率为多少?
(5)幂平均数:
通过幂平均数,可以化成其他的平均数
(6)不同平均数的特点:
- 算术平均:取长补短
- 几何平均和调和平均:劳有所得
- 幂平均:惩罚坏的,激励好的
2. 位置代表数
(1)中位数:按大小排列之后居中的数,如果有两个则取平均。
(2)分位数:比如四等位数
(3)众数:出现次数最多的数,可以出现多个众数
3. 分布偏态与平均数和位置代表数的关系
M
o
M_o
Mo是众数,
M
e
M_e
Me是中位数
例题:一组技术人员月薪的众数为7000元,算术平均 数为10000元,适度偏斜时中位数近似值是多少?
4. 离散指标
离散指标反映的是数值的差异程度
4.1 全距(极差)
R=Max-Min
4.2 内距(四分位差)
4.3 异众比率
非众数组频数占总频数之比:
V
r
=
∑
f
i
−
f
o
∑
f
i
(
f
o
是
众
数
频
数
)
V_r=\frac{\sum f_i-f_o}{\sum f_i}(f_o是众数频数)
Vr=∑fi∑fi−fo(fo是众数频数)
4.4 平均差
全称:平均绝对偏差
M
a
d
=
∑
∣
x
i
−
x
ˉ
∣
n
Mad=\frac{\sum |x_i-\bar x|}{n}
Mad=n∑∣xi−xˉ∣
性能没有标准差好
4.5 方差与标准差
σ
2
=
∑
(
x
i
−
x
ˉ
)
2
n
\sigma ^2=\frac{\sum (x_i-\bar x)^2}{n}
σ2=n∑(xi−xˉ)2
σ
=
∑
(
x
i
−
x
ˉ
)
2
n
\sigma =\sqrt \frac{\sum (x_i-\bar x)^2}{n}
σ=n∑(xi−xˉ)2
方差简易公式:
S
2
=
x
2
ˉ
−
x
ˉ
2
S^2=\bar{x^2}-\bar x^2
S2=x2ˉ−xˉ2
4.6 变异系数
为什么要引入变异系数?
当两个问题的量纲不一致的时候,难以比较透明的离散程度。
比如:已知某班所有学生的身高和体重,哪个离散程度较小?
为了消除变量水平和计量单位的影响,引入变异系数:
标准差系数,极差系数,平均差系数
标准差系数: V s = s x ˉ V_s=\frac{s}{\bar x} Vs=xˉs
指标除以平均值就是系数。
对于体重和身高的离散程度比较问题解答:
若已知:
σ
h
=
13.64
c
m
x
ˉ
h
=
167.9
c
m
σ
w
=
8.94
k
g
x
ˉ
w
=
65.1
k
g
\sigma_h=13.64cm \\ \bar x_h=167.9cm \\ \sigma_w=8.94kg\\\bar x_w=65.1kg
σh=13.64cmxˉh=167.9cmσw=8.94kgxˉw=65.1kg
所以体重的离散程度更大
4.7 是非标志
对于一个二分问题而言,我们对于问题的对错的概率引入“成数”这一概念。
是:P
否:Q
例子: 某批产品共500件,其中合格品480件,不 合格品20件,计算成数?
解:
P=480/500=96%, Q=20/500=4%
引入成数之后,可以利用成数化简标准差公式:
σ
=
P
Q
\sigma=\sqrt{PQ}
σ=PQ
注意,只对于二分问题成立。
4.8 偏度系数
什么是偏度?偏度系数用于衡量什么?
偏度用于描述分布形状,对于一个分布是右偏还是左偏,偏离多少,我们需要一个量化标准。
正偏:
负偏:
计算角度1:基于算术平均数,众数/中位数
S
k
=
x
ˉ
−
m
o
s
S_k=\frac{\bar x-m_o}{s}
Sk=sxˉ−mo
s 是标准差
变动范围在(-3,3)之间
当
S
k
<
0
S_k<0
Sk<0表示负偏
计算角度2:基于四分位数
S
k
=
Q
l
+
Q
u
−
2
m
e
Q
u
−
Q
l
S_k=\frac{Q_l+Q_u-2m_e}{Q_u-Q_l}
Sk=Qu−QlQl+Qu−2me
m e m_e me是中位数
系数变动范围在(-1,1)
当
S
k
<
0
S_k<0
Sk<0表示负偏
计算角度3:动差法
中心动差(c阶动差):
m
c
=
∑
(
x
i
−
x
ˉ
)
c
/
n
m_c=\sum (x_i-\bar x)^c/n
mc=∑(xi−xˉ)c/n
S k = m 3 S 3 S_k=\frac{m_3}{S^3} Sk=S3m3
4.9 峰度系数
引入峰度也是为了描述分布的陡峭性。
计算公式:
K
=
∑
(
x
i
−
x
ˉ
)
4
/
n
(
∑
(
x
i
−
x
ˉ
)
2
/
n
)
2
=
m
4
s
4
K=\frac{\sum (x_i-\bar x)^4/n}{(\sum (x_i-\bar x)^2/n)^2}=\frac{m_4}{s^4}
K=(∑(xi−xˉ)2/n)2∑(xi−xˉ)4/n=s4m4
当K=3,正态分布
当K=1.8,均匀分布
例题:动差法求偏度系数和峰度系数
解: