统计-随机变量

最新推荐文章于 2025-03-23 21:51:08 发布

jshazhang

最新推荐文章于 2025-03-23 21:51:08 发布

阅读量5.4k

点赞数 3

分类专栏：统计文章标签：统计随机变量

本文链接：https://blog.csdn.net/jshazhang/article/details/79430185

版权

统计专栏收录该内容

6 篇文章

订阅专栏

随机变量

定义

设随机试验E的样本空间为S={e}，若X=X(e)是定义在样本空间S的上的一个单值实函数，则称X=X(e)为随机变量
简单说，让每一个样本点e对应着唯一的实数X(e)，便得到随机变量X=X(e)

离散型随机变量

若随机变量只可能取有限个或可数无限个值时

连续型随机变量

若随机变量只可能取一个区间中的所有实数时

随机变量的概率

随机变量X取某个值x的事件用记号{X=x}表示，其概率记为{X=x}
若L是一个实数集，将随机变量X在L中取值的事件记作{X∈L}，其概率记为P{X $\in$ L}
P{X∈L}=P{e|X(e)∈L}

离散型随机变量及其分布律

设离散型随机变量X所有可能的取值为x_k,X取x_k的概率为P{X=x_k}=p_k (k=1,2,…)

性质

1.非负性 P_k≥0，k=1,2,…
2.规范性 p1+p2+…+pn =1

分布律

x	x1 x2 … xk
p_k	p1 p2 … pk

$\sum\limits_{k=1}^\infty P^k=1$

X的每一个取值各占一些概率，这些概率加起来为1，即概率1以一定的规律分布着各个可能的值上。

0-1分布

定义

只取0和1两个值的随机变量所服从的分布称为0-1分布
设P{X=1}= p (0 < p <1) ,则P{X=0}=1-p
$P{X=k}=p^k(1-p)^{1-k} (k=0,1)$

x	0 1
p_k	1-p p

二项分布

设X表示n重伯努利试验中事件A发生的次数，则X是一个随机变量，X可能的取值为0,1,…,n。
用A_i表示事件A在第i次试验中发生(i=0,1,…,n)
假设A发生在第n1,..,nk次的试验，
这k次试验A发生概率为P( $\overline{A1}$ … $\overline{A_{n-1}}$ A_n $\overline{A_{n+1}}$ … $\overline{A_{k-1}}$ A_k $\overline{A_{k+1}}$ )=(1-p)…(1-p)p(1-p)…(1-p)p(1-p)…(1-p)=p^k(1-p)^n-k
由于A发生在哪k次试验有 $C_n^k$ 种

公式

P{X=k}= $C_n^k$ p^k(1-p)^n-k
随机变量X服从参数n,p的二项分布，记为X~b(n,p)

规范性
$\sum\limits_{k=0}^nC_n^k$ p^k(1-p)^n-k=[p+(1-p)]ⁿ=1

二项分布为0-1分布b(1,p)
P{X=k}=p^k(1-p)^n-k (k=0,1) (C_0^1 $=$ C_1^1$=1)

例子

某人进行射击，每次射中命中率0。02，独立射击400次，至少中两次概率
P~b（400,0.02）
P{X=k}= $C_400^k$ 0.02^k(1-0.02)^400-k
P{X≥2}=1-P{X=0}-P{X=1}
=1- $C_400^0$ 0.02⁰(1-0.02)^400-0- $C_400^0$ 0.02¹(1-0.02)^400-1=0.9972

泊松分布

知道发生的的平均次数 $\lambda$
$P={\lambda \over n}$
X~b(n, $\lambda \over n$ )推出

lim n \to + \infty C k n (λ n) k (1 - λ n) n - k = λ k k ! e - λ

$\lim_{n \to + \infty} C_n^k ({\lambda \over n})^k (1-{\lambda \over n})^{n-k} = {\lambda ^k\over k!}e^{-\lambda}$

定义

设随机变量X所以可能的取值为一起自然数0,1,2…,且取值k(k=0,1,2,..)的概率为

$P_k$ = P{X=k} = ${\lambda ^k\over k!}e^{-\lambda}$
其中 $\lambda$ >0的常数，则称X服从参数为 $\lambda$ 的泊松分布。X~π(\lambda)

可以通过泊松分布表计算

规范性

例子

保险公司承保5000张同年龄为期一年的保单。如果合同期死亡，则赔付3万元。设1年内死亡概率为0.0015，且投保人是互为独立时间。求保险公司对于这批保险人赔付不超过30w的概率
X~b(5000,0.0015)
总赔付额为3X万元
求概率P{3X≤30}=P{X≤10}
二项分布
P{X≤10}= $\sum\limits_{k=0}^{10}C_{5000}^k$ 0.0015^k(1-0.0015)^5000-k

计算困难，用泊松分布
\lambda=np=5000×0.0015=7.5
P{X≤10}= $\sum\limits_{k=0}^{10}{7.5^k\over k!}e^{-7.5}$
直接查表

几何分布试验直到成功的概率

用A_i表示事件A在第i次试验中发生(i=0,1,…,n)假设第kci试验中A第一次发生，则
P{X=k}=P( $\overline{A1}$ … $\overline{A_{k-1}}$ A_k)=（1-p）…(1-p)p=(1-p)^k-1p

定义

设多重伯努利试验中，事件A发生的概率为p(0 < p < 1),记X为A第一次发生时的试验次数，则X取值k的概率
P{X=k}=(1-p)^k-1p (k=1,2…)
称X服从参数为p的几何分布，记作X~G(p)

x	1 2 … k …
p_k	p (1-p)p … (1-p)^k-1p …

规范性

$\sum\limits_{k=1}^\infty(1-p)^{k-1}p=p\sum\limits_{k=1}^\infty(1-p)^{k-1}=p{1 \over{1-(1-p)}} =p {1 \over p} =1$
几何级数(等比级数)
等比级数的和= $首项 \over {1 - 公比}$

超几何分布

设有N件产品，其中有D件次品。今从中任取n件，问其中恰有k件次品(k≤D)的概率是多少？
在N件产品中取n件(不放回)的取法有 $C_N^n$ 种
在D件次品中取k件的取法有 $C_D^k$ 种
在N-D件正品中取n-k件的取法有 $C_N-D^n-k$ 种
在N件产品中取n件，其中恰有k件次品的取法有 $C_D^k$ $C_N-D^n-k$ 种
$P(A)={C_D^kC_N-D^n-k} \over {C_N^n}$

定义

设有N件产品，其中有M件次品。从中任取n件，则其中恰有k件次品(k≤M)的概率是
设随机变量X表示取出n件产品中的次品数，
则P{X=k}={ $C_M^k$ $C_N-M^n-k$ }\over { $C_N^n$ } k=0,1,…,n
称X服从参数为n,M，N的超几何分布

与二项分布关系

当N很大时候，超几何分布和二项分布近似

随机变量的分布函数累积分布函数

分布函数概率

定义

设X是一个随机变量（离散型或连续型），x是任意实数，称事件{X≤x}的概率P{X≤x}为X的分布函数，记作
F(x)=P{X≤x} 定义域整个实数域
对于任何实数x1,x2 (x1 < x2) , 都有P{x1 < X ≤ x2}=P{X ≤ x2}-P{X ≤ x1}=F(x2)-F(x1)

性质1

分布函数F(x)是实数域上( $-\infty,+\infty$ )的单调不减函数

性质2

0≤F(x)≤1
F( $-\infty$ )=0 F( $+\infty$ )=1

性质3

分布函数F(x)至多有可数个跳跃间断点，且处处都是右连续的，即对任何实数x₀,都有
$F(X_0+0)=\lim_{x \to x_0} F(x)=F(x_0)$

公式

P{X≤a}=F(a)
P{X＜a}=F(a-0)
P{X=a}=F(a)-F(a-0)
P{X＞a}=1-F（a）
P{X≥a}=1-F(a-0)
P{a≤X＜b}=F(b-0)-F(a-0)
P{a＜X＜b}=F(b-0)-F(a)
P{a≤X≤b}=F(b)-F(a-0)

离散型随机变量的分布函数

函数概率的累积

连续型随机变量及其密度函数

连续型随机变量及其密度函数的概念

定义

如果随机变量X的分布函数F(x)可以写成以下形式：

F (x) = \int x - \infty f (t) d t (- \infty < x < + \infty)

$F(x)=\int_{-\infty}^{x}f(t)dt (-\infty<x<+\infty)$
其中f(x)是定义在

(−∞,+∞) ( − ∞ , + ∞ ) $(-\infty,+\infty)$ 上的非负可积函数，则称X为连续型随机变量，
f(x)称为X的概率密度函数。

性质1

f(x)≥0 非负性

性质2

$F(x)=\int_{-\infty}^{+\infty}f(x)dx=1$ 规范性

性质3

若f(x)在x处联系，则F(x)在x处可导，且
F’(x)=f(x)

性质4

对任意实数x1,x2(x1

均匀分布

定义

若连续随机变量X具有概率密度

f (x) = ⎧ ⎩ ⎨ ⎪ ⎪ 1 b - a ， a < x < b 0, 其 他

$f(x)=\left\{ \begin{aligned} &{1 \over {b-a}}，{a<x<b} \\ &0, 其他 \end{aligned} \right.$
则称X在区间[a,b]上服从均匀分布，记为X~U(a,b
)

意义

若X~U(a,b),则X落在区间(a,b)中任意长度的子区间的可能性是相同的。
随机变量X落入每一个小区间概率都是
$1 \over {b-a}$ = ${(b-a) \over n} \over {b-a}$ = $1 \over n$
即落入每一个小区间都是等可能的，所以概率被均匀的分布在区间[a,b]上。

分布函数

f (x) = ⎧ ⎩ ⎨ ⎪ ⎪ 0 ， x < a x - a b - a ， a \leq x < b 1, x \geq b

$f(x)=\left\{ \begin{aligned} &0， x< a \\ &{{x-a} \over {b-a}}，{a≤x<b} \\ &1, x≥b \end{aligned} \right.$

指数分布

定义

若连续型随机变量X具有概率密度

f (x) = {λ e - λ x ， x > 0 0, x \leq 0 (常 数 λ > 0)

$f(x)=\left\{ \begin{aligned} &\lambda e^{-\lambda x}，x>0 \\ &0,x≤0 \end{aligned} \right. (常数\lambda > 0)$
则称X服从参数为

λ λ $\lambda$ 的指数分布，记为X~E(

λ λ $\lambda$ )

分布函数

f (x) = {1 - e - λ x ， x > 0 0, x \leq 0

$f(x)=\left\{ \begin{aligned} &1-e^{-\lambda x}，x>0 \\ &0,x≤0 \end{aligned} \right.$

性质无记忆性

$\forall s,t$ >0,有P{X > s+t | X>s}=P{X>t}
在一只X>s发生的条件下，则X>s+t发生的概率就等于{X>t}发生的概率
如，X是一个电子元件的寿命，若已知元件已经使用了s小时(X>s发生)，它能再使用t小时(一共使用s+t小时，X>s+t发生)的概率，与它从开始使用起能用t小时的概率相等。
指数分布通常来作为各种寿命的分布

正态分布高斯分布

若连续型随机变量X具有概率密度
f(x)= $1 \over {\sqrt{2\pi}\sigma}$ $e^{-{{(x-\mu)^2}} \over 2\sigma^2}$ $(-\infty <x <+\infty)$
其中 $\mu,\sigma(\sigma>0)$ 是常数，则称X服从参数为 $\mu,\sigma$ 的正态分布，记作X~N( $\mu,\sigma^2$ )
$\mu$ 为X的均值
$\sigma$ 为方差

图像性质

1.y=f(x)的图形关于直线x= $\mu$ 对称。
即f( $mu$ -h)=f( $mu$ +h)
2.y=f(x)在x= $\mu$ 处的最大值f( $\mu$ )= $1 \over {\sqrt{2\pi}\sigma}$
3.x离 $\mu$ 越远，f(x)的值越小
4.y=f(x)在x= $\mu+_\sigma$ 有两个拐点
5.y=f(x)以x轴为其水平渐近线
6.当 $\sigma$ 固定时， $\mu$ 决定y=f(x)的左右位置， $\mu$ 称为正态分布的位置参数。
7.当 $\mu$ 固定是， $\sigma$ 决定y=f(x)的集中程度。 $\sigma$ 越小，y=f(x)的图形越尖，越高，X落在 $\mu$ 附件概率越大

分布函数

F(x)= $1 \over {\sqrt{2\pi}\sigma}$ $\int_{x}^{\infty}e^-{{(x-\mu)^2} \over 2\sigma^2}$
原函数不是初等函数，只能写成积分上限函数

标准正态分布

当 $mu$ =0， $\sigma$ =1时的正态分布称为标准正态分布，记作X~N(0,1)
$\varphi(x)$ = $1 \over {\sqrt{2\pi}}$ $e^{x^2 \over 2}$

标准化

若X~N（ $\mu,\sigma^2$ ）则Z={X- $mu$ \over $\sigma$ }~N{0,1}
F(x)= $\phi$ ( ${x-\mu} \over \sigma$ )

公式

P{X ≤ x}= $\phi$ ( ${x-\mu} \over \sigma$ )
P{|X| ≤ x}= $2\phi$ ( ${x-\mu} \over \sigma$ )-1
P{x1 < X ≤ x2}= $\phi$ ( ${x2-\mu} \over \sigma$ )- $\phi$ ( ${x1-\mu} \over \sigma$ )