随机变量:随机变量就是你去估计一件事可能发生的结果,然后把这些结果都用数字表达出来.(自己的理解,非准确定义)
如果随机变量的值都可以逐个列举出来,则为离散型随机变量。如果随机变量X的取值无法逐个列举则为连续型变量。
对于离散的,一般用频率函数去描述.
绝对频率:就是一个特定的变量在总量中出现的次数.所有变量出现的次数的总数等于总量的数量.
f
1
+
f
2
+
f
3
+
…
+
f
n
=
N
∑
f
i
=
N
\begin{array}{c} f_{1}+f_{2}+f_{3}+\ldots+f_{n}=N \\ \sum f_{i}=N \end{array}
f1+f2+f3+…+fn=N∑fi=N
相对频率函数
就是归一化,原来的绝对频数除以总量,就能得到相对频数,所有变量的相对频数相加等于1.
h
i
=
h
(
x
i
,
Δ
x
)
=
k
i
n
,
i
=
1
,
2
,
3
,
…
,
m
0
≤
h
(
x
i
,
Δ
x
)
≤
1
∑
i
=
1
m
h
(
x
i
,
Δ
x
)
=
∑
i
=
1
m
k
i
n
=
1
n
∑
i
=
1
m
k
i
=
1
h_{i}=h\left(x_{i}, \Delta_{x}\right)=\frac{k_{i}}{n} ,\mathrm{i}=1,2,3, \ldots, \mathrm{m}\\ \begin{array}{c} 0 \leq h\left(x_{i}, \Delta_{x}\right) \leq 1 \\ \sum_{i=1}^{m} h\left(x_{i}, \Delta_{x}\right)=\sum_{i=1}^{m} \frac{k_{i}}{n}=\frac{1}{n} \sum_{i=1}^{m} k_{i}=1 \end{array}
hi=h(xi,Δx)=nki,i=1,2,3,…,m0≤h(xi,Δx)≤1∑i=1mh(xi,Δx)=∑i=1mnki=n1∑i=1mki=1
累积频数:就是逐级累加.
概率函数里,离散的叫概率质量函数,连续的叫概率密度函数.
概率质量函数.
离散型随机变量的概率函数(分布律),一个值对应一个概率.
也就是随机变量在各个可能值上对应的概率,用直方图表示,区间概率直接几个点相加?
概率密度函数
描述某个点的的概率的函数(暂且这么想吧,虽然点的概率是零)
区间概率看面积的差.
分布函数:点落在负无穷到x之间的概率
(出现的原因是不想知道某个特定的值的概率,只想知道在某个范围内的概率)
概率函数累加的结果
概率分布函数怎么求?
离散就分布函数纵坐标算出来相减
连续就看纵坐标差值,纵坐标相减的结果表示在某一区间取值的概率
分布函数的特性:
非降性
对于任意实数:
x
1
<
x
2
,
F
(
x
2
)
−
F
(
x
1
)
=
P
{
x
1
<
X
<
x
2
}
≥
0
,
F
(
x
1
)
≤
F
(
x
2
)
x_{1}<x_{2}, F\left(x_{2}\right)-F\left(x_{1}\right)=P\left\{x_{1}<X<x_{2}\right\} \geq 0, F\left(x_{1}\right) \leq F\left(x_{2}\right)
x1<x2,F(x2)−F(x1)=P{x1<X<x2}≥0,F(x1)≤F(x2)
有界性
0
≤
F
(
x
)
≤
1
;
F
(
−
∞
)
=
0
,
F
(
+
∞
)
=
1
0 \leq F(x) \leq 1 ; F(-\infty)=0, F(+\infty)=1
0≤F(x)≤1;F(−∞)=0,F(+∞)=1
右连续性
F
(
x
)
=
F
(
x
+
0
)
F(x)=F(x+0)
F(x)=F(x+0)
例子:
概率密度函数:
f
(
x
)
=
6
x
−
6
x
2
x
∈
[
0
,
1
]
f(x)=6 x-6 x^{2} \quad x \in[0,1]
f(x)=6x−6x2x∈[0,1]
图像如下:
求分布函数F(X),也就是求积分.
下限为负无穷, 上限为x.
计算不定积分时,你无法判断它的常数项,所以需要加C;
计算定积分时,因为给出积分上下限,可以得出它的常数项,不需要加C.
这里相当于求定积分,所以不加C.
F
(
x
)
=
∫
−
∞
x
f
(
t
)
d
t
F(x)=\int_{-\infty}^{x} f(t) d t
F(x)=∫−∞xf(t)dt
这里的F(x)是一个分段函数:
F
(
x
)
=
{
0
(
x
<
0
)
3
x
2
−
2
x
3
(
0
≤
x
≤
1
)
1
(
x
>
1
)
F(x)=\left\{\begin{array}{cc} 0 & (x<0) \\ 3 x^{2}-2 x^{3} & (0 \leq x \leq 1) \\ 1 & (x>1) \end{array}\right.
F(x)=⎩⎨⎧03x2−2x31(x<0)(0≤x≤1)(x>1)
期望值
对于离散型随机变量,期望值就是把随机变量的每个取值与其对应的概率相乘,然后再把其相加.公式如下:
E
(
X
)
=
X
1
∗
p
(
X
1
)
+
X
2
∗
p
(
X
2
)
+
…
+
X
n
∗
p
(
X
n
)
=
X
1
∗
f
(
X
1
)
+
X
2
∗
f
(
X
2
)
+
…
+
X
n
∗
f
(
X
n
)
E
(
X
)
=
∑
k
=
1
∞
x
k
p
k
\begin{array}{c} E(X)=\\X_{1} * p\left(X_{1}\right)+X_{2} * p\left(X_{2}\right)+\ldots+X_{n} * p\left(X_{n}\right)=\\X_{1} * f\left(X_{1}\right)+X_{2} * f\left(X_{2}\right)+\ldots+X_{n} * f\left(X_{n}\right) \\ E(X)=\sum_{k=1}^{\infty} x_{k} p_{k} \end{array}
E(X)=X1∗p(X1)+X2∗p(X2)+…+Xn∗p(Xn)=X1∗f(X1)+X2∗f(X2)+…+Xn∗f(Xn)E(X)=∑k=1∞xkpk
对于连续型随机变量,道理其实也是一样的,公式如下:
E
(
X
)
=
μ
=
∫
−
∞
∞
x
f
(
x
)
d
x
E(X)=\mu=\int_{-\infty}^{\infty} x f(x) d x
E(X)=μ=∫−∞∞xf(x)dx
另外要注意区分期望和均值,期望是理论上的,你去预测的,均值是实实在在用观测值算出来的.
参见:
https://www.zhihu.com/question/25391960
这道题其实就是算一个[0,1]内的定积分.
E
(
X
)
=
∫
0
1
x
f
(
x
)
d
x
=
0.5
E(X)=\int_{0}^{1} x f(x) d x=0.5
E(X)=∫01xf(x)dx=0.5
注意概率一般用小数表示哈.
方差
方差是一种特殊的期望,是随机变量的每个取值与其期望(均值)的差值的平方的期望.
σ
2
=
E
[
(
X
−
μ
)
2
]
=
E
(
X
2
−
2
μ
X
+
μ
2
)
=
E
(
X
2
)
−
2
μ
E
(
X
)
+
μ
2
=
E
(
X
2
)
−
2
μ
2
+
μ
2
=
E
(
X
2
)
−
μ
2
\sigma^{2}=E\left[(X-\mu)^{2}\right]\\ =E\left(X^{2}-2 \mu X+\mu^{2}\right)\\ =E\left(X^{2}\right)-2 \mu E(X)+\mu^{2}\\=E\left(X^{2}\right)-2\mu^{2}+\mu^{2}\\=E\left(X^{2}\right)-\mu^{2}
σ2=E[(X−μ)2]=E(X2−2μX+μ2)=E(X2)−2μE(X)+μ2=E(X2)−2μ2+μ2=E(X2)−μ2
用这个式子计算是因为(X-
μ
\mu
μ)没法求.
算下来等于
0.05
\sqrt{0.05}
0.05
标准差也很简单,就是方差开方取正.没啥特别的,主要是为了统一单位.
要求一个在x定义域外的概率,比如求
P
(
x
>
1.1
)
P(x>1.1)
P(x>1.1),就是0
要求一个在x定义域内的概率,对于连续型函数来说,比如
P
(
x
=
0.35
)
P(x=0.35)
P(x=0.35),也是0.
只有在定义域内求区间概率才有意义,比如求
P
(
0
≤
x
≤
0.5
)
P(0 \leq x \leq 0.5)
P(0≤x≤0.5),前面说过,对于连续型,就是求对应分布函数的F(X)的差,或者用概率密度函数求面积也行.
P
(
0
≤
x
≤
0.5
)
=
F
(
0.5
)
−
F
(
0
)
=
0.5
P(0 \leq x \leq 0.5)=F(0.5)-F(0)=0.5
P(0≤x≤0.5)=F(0.5)−F(0)=0.5