均值、期望、方差、协方差
均值、方差这两个概念我们在初中就曾接触过,而期望和协方差我们可能到了大学才会接触到
一、均值:
均值又分为总体均值和样本均值:
(1).总体均值:使用总体数据求得的均值
想必这个大家都耳熟能详,他其实反映的就是一组数据的平均值,他的公式也非常简单设一组数据为
X = (x1,x2,x3,x4,x5,……xn)那么他的均值就为
μ
=
∑
i
=
1
N
x
i
N
\mu = \frac{\sum_{i=1}^Nxi}{N}
μ=N∑i=1Nxi
(2).样本均值:从总体数据中抽出一部分样本,用这些样本来估计总体均值
用样本求总体均值我们通过无偏估计来实现,无偏估计的定义为估计量的数学期望(期望的内容在下面)等于被估计参数的
真实值,则称此估计量为被估计参数的无偏估计我们的样本均值和总体均值公式一样
X
−
=
∑
i
=
1
n
x
i
n
X^- = \frac{\sum_{i=1}^nxi}{n}
X−=n∑i=1nxi 因为他的数学期望
E
(
X
−
)
=
μ
E(X^-) = \mu
E(X−)=μ 证明我们放在下面期望那一段
二、方差:
方差同样分为总体方差和样本方差
(1) 总体方差
方差则是反映的是数据的波动程度,通常我们中学所常见到的方差的公式是这种形式的
V
A
R
(
x
)
=
∑
i
=
1
n
(
x
i
−
μ
)
2
n
VAR(x) = \frac{\sum_{i=1}^n(xi-\mu)^2}{n}
VAR(x)=n∑i=1n(xi−μ)2 这种形式的方差是针对的是我们已知总体数据,来求总体方差
(2)样本方差
实际工作中,总体均数难以得到时,应用样本统计量代替总体参数,样本方差用我们的取出的样本来估计总体的方差,我们的样本方差公式为
V
A
R
(
x
)
=
∑
i
=
1
n
(
x
i
−
X
−
)
2
n
−
1
VAR(x) = \frac{\sum_{i=1}^n(xi-X^-)^2}{n-1}
VAR(x)=n−1∑i=1n(xi−X−)2这里我们的分母使用n-1而不是n,这个原因建议参考这篇文章,讲的非常透彻
三、期望
是试验中每次可能结果的概率乘以其结果的总和,是最基本的数学特征之一。它反映随机变量平均取值的大小。
举个简单的例子来说明以下期望,假设我们花两元钱去买彩票,我们可以通过计算得到中一、二、三等奖的概率,假设中一等奖的概率为0.01,金额100,中二等奖的概率为0.03,金额20,中三等奖的概率0.3,金额5元,那么他的数学期望就为,1000.01+200.03+5*0.3=3.1,这就意味着当我们买了很多次彩票之后,平均买一次两元的彩票可以中3.1元,如果真有这种好事,我宁愿天天买,可惜现实不是这样,关注我 ,我会抽个时间计算一下大乐透的数学期望,或者其他的玩法,看看你买一次平均可以中多少,想算哪种玩法的可以下面留言,我有时间给大家算一下
期望的计算分为离散随机变量和连续随机变量:
(1)、离散随机变量:
上面我们所算的彩票的例子就是离散随机变量的期望,离散随机变量期望的表达式为
E
(
X
)
=
∑
i
=
1
n
p
i
∗
x
i
(
x
i
就
代
表
的
是
离
散
值
也
就
是
中
奖
的
金
额
,
p
i
代
表
中
某
种
金
额
的
概
率
)
E(X) = \sum_{i=1}^npi*xi(xi就代表的是离散值也就是中奖的金额,pi代表中某种金额的概率)
E(X)=i=1∑npi∗xi(xi就代表的是离散值也就是中奖的金额,pi代表中某种金额的概率)
(2)、连续随机变量:
E
(
X
)
=
∫
−
∞
∞
x
f
(
x
)
d
x
E(X)=\int_{-\infty}^{\infty}xf(x)dx
E(X)=∫−∞∞xf(x)dx f(x)是连续变量x的密度函数
数学期望性质(掌握这些性质有助于上面无偏估计量的理解):
1、设X是随机变量,C是常数,则E(CX)=CE(X)
2、设X,Y是任意两个随机变量,则有E(X+Y)=E(X)+E(Y)
3、设X,Y是相互独立的随机变量,则有E(XY)=E(X)E(Y)
4、设C为常数,则E(C)=C
看
完
了
性
质
,
我
们
来
把
样
本
均
值
那
里
的
E
(
X
−
)
=
μ
证
明
一
下
看完了性质,我们来把样本均值那里的E(X^-) = \mu证明一下
看完了性质,我们来把样本均值那里的E(X−)=μ证明一下
E
(
X
−
)
=
E
(
∑
i
=
1
n
x
i
n
)
=
1
n
E
(
∑
i
=
1
n
x
i
)
=
1
n
∑
i
=
1
n
E
(
x
i
)
=
1
n
∑
i
=
1
n
x
i
=
μ
E(X^-) = E(\frac{\sum_{i=1}^nxi}{n}) = \frac{1}{n}E(\sum_{i=1}^nxi)=\frac{1}{n}\sum_{i=1}^nE(xi)=\frac{1}{n}\sum_{i=1}^nxi=\mu
E(X−)=E(n∑i=1nxi)=n1E(i=1∑nxi)=n1i=1∑nE(xi)=n1i=1∑nxi=μ
四、协方差
协方差其实可以通俗的理解为两个变量在变化过程中是他们的趋势的相关性有多大,即判断他们是正相关还是负相关,程度有多大,他的公式为
C
O
V
(
X
,
Y
)
=
E
(
(
X
−
μ
x
)
(
Y
−
μ
y
)
)
COV(X,Y) = E((X-\mu_x)(Y-\mu_y))
COV(X,Y)=E((X−μx)(Y−μy))
从公式的角度来看他就是,对于两个变量X、Y,在每个时刻(X与其均值之差 * Y与其均值之差)之和求平均值,从协方差的大小就可以看出这两个变量趋势相关的程度
五、相关系数
相关系数和协方差其实作用一样,只不多是多加了一项
ρ
=
C
O
V
(
X
,
Y
)
D
(
X
)
D
(
Y
)
\rho = \frac{COV(X,Y)}{\sqrt{D(X)}\sqrt{D(Y)}}
ρ=D(X)D(Y)COV(X,Y)
加这一项目的是为了消除X、Y数据不在一个量纲上,举个例子:
如果我们要比较X:(1,2,3,4,5)和Y(100,200,300,400,500),他的协方差为200,相关系数为1
而如果X:(1,2,3,4,5)和Y(2,3,4,5,6),他的协方差为2,相关系数为1,这样我们就很明显看出来,其实他们相关性都为1,但是由于量纲的不同,协方差差距很大