tju-概率论-第二章随机变量及分布

关于想换昵称但不知道换什么这件事

已于 2023-10-29 10:04:09 修改

阅读量90

点赞数

分类专栏：概率论文章标签：概率论

于 2023-10-27 20:22:56 首次发布

本文链接：https://blog.csdn.net/weixin_73024415/article/details/133704412

版权

概率论专栏收录该内容

4 篇文章 0 订阅

订阅专栏

文章目录

2.1-随机变量及分布函数
2.2 离散型随机变量及其分布
2.3-随机变量分布函数
2.4 连续型随机变量机器概率密度
2.5-随机变量的函数的分布

2.1-随机变量及分布函数

定义2.1

设随机试验的样本空间Ω，如果对每一个w∈Ω，都有一个确定的实数X(w)与之对应，则称Ω上的实值函数X(w) 为随机变量简写为X

所以—》随机变量X是样本点w的一个函数，它的定义域是样本空间Ω 而值域是实数域或其子集，且它的取值随试验的结果的不同而变化

e.g.2.1

一袋子三黑球（b1，b2 ，b3）两红球（r1，r2）的袋中任取两球则此试验的样本空间为
Ω={（b1，b2），（b1，b3），（b2，b3），（b1，r1），（b1，r2），（b2，r1），（b2，r2），（b3，r1）（b3 ，r2）（r1，r2）}
设 X（w）= 0 if w=(r1,r2)
X（w）= 1 if w=(b1,r1),(b1,r2),(b2,r1),(b2,r2)(b3,r1)(b3,r2) X（w= 2 if w=(b1,b2)(b1,b3) (b2,b3)
则X(w) 是定义在Ω 上的一个随机变量，值域为{0,1,2}，它表示取到的黑球数量这里我们用{X=0}表示事件 {两红},概率P{X=0}…同理1,2

定义2,2+(算P{a<x<b})

设X是随机变量对任意给定的实数x∈（-∞，+∞）令
F（x）=P{X<=x}
则称 F(x)为随机变量X的概率分布函数，简称分布函数
分部函数F(x)是一个普通的函数，它的定义域是实数域，F(x)在x点处的函数值表示事件{X<=x}的概率即随机变量x落在区间（-∞，x】内的分部概率
对于F(x)有以下性质：

(1):对于任意实数x，都有0<=F(x)<=1，且F（-∞）=lim(x->-∞)F(x)=0,F(+∞)=lim(x->+∞)F(x)=1
(2):F(x)是x的单调不减函数，即对任意x1<=x2,F(x1)<=F(x2)
(3):F(x)是右连续函数，即对任意实数a，有
$\lim_{x\rightarrow a+}F(x)=F(a+0)=F(a)$
数学上可以证明，满足上述三条性质的函数一定可以作为某个随机变量的分布函数

若已知随机变量X的分布函数，则可计算X落在任一区间的概率，比如对任意实数x1，x2（x1<x2）
P{x1<X≤x2}=P{X<=x2}-P{X<=x1}=F(x2)-F(x1)
P{x1<X<x2}=P{x1<X<=X2}-P{X=x2}
P{x1≤X≤x2}=P{x1<X≤x2}=P{x1<X≤x2}+P{X=x1}
P{x1≤X<x2}=F(x2)-F(x1)+P{X=x1}-P{X=x2}

2.2 离散型随机变量及其分布

一，离散型随机变量及其分布律

1.定义

设 $x_k$ (k=1,2,3…)是离散型随机变量X所取的一切可能值，称等式 $P(X=x_k)=P_k$ ,K=1,2,3,…
为X的分布律或概率分布
其中 $P_k(k=1,2,3.....)满足$
(1) $p_k>=0,k=1,2,3.....$
(2) $\sum_{k=1}^∞p_k=1$

2.离散型随机变量X概率分布的表示方法

（1）列表法：分布律可以用表格形式表 $x_n^{->}$ 一般从小到大排列
x $x 1$ $x 2$ … $x_n$
$p_k$ $p_1$ $P_2$ … $p_n$
（2）公式法 e.g. P{X=k}= ${C_3 ^{3-k} C_2^k} \over C_5^3$
3(图示法）在这里插入图片描述

二 . 三种常用离散型随机变量的分布

1. 两点分布、

如果随机变量只能取 0，1两个值，其分布律为
P{X=1}=p, P{X=0}=1-p (0<p<1)
或P{x=k}= $p^k(1-p)^1-k,k=0,1,(0<p<1)$
则称X服从参数为p的（0-1）分部或；两点分布
（0-1）分部分部列

X  0   1

$p_k$ 1-p p
举例：可用两点分布的：新生婴儿性别明天下不下雨种子发不发芽

2.二项分布

伯努利试验

伯努利试验：只有A和 ${\over A}$ 的实验
n重伯努利试验：设E为伯努利试验，将E独立的重复进行n次

n重伯努利试验

n重伯努利试验性质：（1）每次试验结果是A或者 ${\over A}$
(2)将E独立重复n次
(3)各次实验相互独立
(4)共进行了n次
定理：P{x=K}= $C_n^Kp^kq^{n-k}$
由于这n次实验互不相容，由概率有限可加性得到：
$\sum_{k=0}^nC_n^kp^kq^{n-k}=(p+q)^n=1$

二项分布

定义：若离散型随机变量X的分布律为
$P{X=k}=C_n^kp^kq^{n-k},k=1,2,.....n$
其中0<p<1 ,q=1-p,则称参数为n,p的二项分布，记为
X~B(n,p).

3.泊松分布

P{x=k}= $λ^ke^{-λ}\over k!}$ ,k=0,1,2…,
其中λ是常数，则称X服从参数为λ的泊松分布
记为
X~P(λ)

二项分布和泊松分布关系

我们把每次实验中出现概率很小的时间成为稀有事件
由泊松定理
即λ=np
$C_n^pp^k(1-p)^{n-k}={λ^k e^{-λ}\over k! }$

几何分布

定义：在伯努利试验中，记实验中事件A发生概率为p，如果X为事件A首次发生时实验次数，X=1,2…
则称X为服从参数p的几何分布
概率分布为：
$P{x=k}=(1-p)^{k-1}p$ k=1,2…

定理：几何分布的无记忆性

设X服从参数为p的几何分布，则对任意正整数m,n,
$P\{X>m+n|X>m \}=P \{ X>n \}$

超几何分布

从N物品中(其中M件不合格)抽出n个产品（不放回），其中不合格产品X服从超几何分布
$P{x=k}={C_M^K C_{N-M}^{n-k} \over C_N^n}$
当n<<N时，每次抽取对不合格率p=M/N改变很小，可近似看为放回抽样，
这时，超几何分布可近似为二项分布：
$C_M^kC_{N-M}^{n-k}\over C_M^{n} }=C_n^kp^k(1-p)^{n-k}，其中p={M \over N}。$

2.3-随机变量分布函数

一, 概念

需要知道X在任意有限区间(a,b)内取值的概率
例如：求随机变量X落在区间(x1,x2]内的概率
$P\{x_1<x<=x_2\}=P\{X<=x_2\}-P\{X<=x_1\}=F(x_2)-F(x_1)$

二.定义

设X是随机变量，x为任意实数，称函数
F(x)=P{X<=x}（-∞<x<+∞）
为x的分布函数
X分布函数是F(x)基座X~F(x)或者 $F_X(x)$
表示X落在（-∞，x】的概率

三：分布函数的性质

1.单调不减即若 $x_1<x_2$ 则F(x_1)<=F(x_2);
2.非负有界
0<=F(x)<=1(-∞<x<+∞),
且
$\lim\limits_{x->-∞}F(x)=F(-∞)=0,$
$\lim\limits_{x->+∞}F(x)=F(+∞)=1$
3.右连续 F(x+0)=F(x)
性质1–3是鉴别一个函数是否时某随机变量的分布函数的充分必要条件

离散型分布函数特点

$F(x)=P\{X<=x\}=\sum_{x_k<=x}P\{X=x_k\}=\sum_{x_k<=x}P_k$
其中 $P\{X=x_k\}=p_k,k=1,2...$
离散型随机变量的分布函数的图形特点
1.它的图形是一条有连续的阶梯型曲线
2.在随机变量的每一个可能取值点 $x=x_k$ ,该图形都有一个跳跃跳跃高速为 ${p_k}$

2.4 连续型随机变量机器概率密度

连续型随机变量

1 .定义

定义：随机变量所取的可能值可以连续地充满某个区间，叫做连续型随机变量

概率密度的概念与性质

（1）f（x）>=0
（2） $\int_{- \infty}^{+\infty}f(x)dx=1$ ;
(3) $P\{x_1<X<=x_2\}=F(x_2)-F(x_1)=\int_{x_1}^{x_2}f(x)dx$
几何意义：x落在区间（ $x_1,x_2$ 】的概率P{ $x_1<x<=x_2$ }，等于区间（ $x_1,x_2$ 】上y=f(x)之下的曲边梯形面积。
可得计算公式
P{X<=a}=F(a)= $\int_{-\infty}^{a}f(x)dx$
P{x>a}=1-P{x<=a}=1-F(a)
(4)若f(x)在点x处连续则有 $F^’(x)=f(x)$
因为F(x)= $\int_{-\infty}^xf(t)dt$ 当f(x)连续时，F(x)可导，所以f(x)的连续点处， $F^‘(x)=f(x)$
注：(1)在F（x）不可导的点x处，f(x)在x的函数值可任意给出
(2)对于任意值a,连续型随机变量取a的概率等于0，即P{X=a}=0;

三种重要的连续型随机变量

1.均匀分布 X~U（a，b）

设连续随机变量X具有概率密度
$f(x)=\{_{0,(其他)}^{{1\over b-a},(a<x<b)}$
则称X在区间（a,b）上服从均匀分布，记为X~U(a,b)
在这里插入图片描述

2.指数分布（无记忆性）X~EXP( $\lambda$ )

若随机变量X的概率密度
$=\begin{cases} \lambda e^{-\lambda x},x>=0\\0,x<0 \end{cases}$
$\lambda$ 为常数且大于0，则称X服从 $\lambda$ 的指数分布
显然 f(x)>=0且 ${\int_{-\infty}^{+\infty}f(x)dx=1}$
X的分布函数为
$F(x)=\begin{cases}1-e^{-\lambda x},x>=0 \\ 0,x<0 \end{cases}$
注：指数分布无记忆性：若随机变量X对任意的s>0,t>0有
P{X>s+t|X>s}=P{x>t}则称X的分布有无记忆性，指数分布具有无记忆性

3.正态分布X~N( $\mu,\sigma^2$ )

正态分布性质

$1\over \sqrt{2π}\sigma}e^{-{(x-\mu)^2\over2\sigma^2}},-\infty<x<+\infty$
其中 $\mu,\sigma(\sigma>0)$ 为常数，则称X服从参数为 $\mu,\sigma$ 的正态分布，记为X~N( $\mu,\sigma^2$ )
正态分布的概率密度函数f(x)的性质
在这里插入图片描述
(3)当x= ${\mu \pm\sigma}$ 处曲线有拐点，且以x轴为渐近线；
(4)对固定的 ${\sigma}$ ,改变 $\mu$ 的值，图形沿着Ox轴平移
(5)对固定的 ${\mu},改变\sigma ,\sigma越小，图形越尖$
正态分布的分布函数:
$\over \sqrt{2π}\sigma}\int_{-\infty}^xe^{-{(t-\mu)^2\over 2\sigma^2}}dt$

标准正态分布

当 $\mu=0,\sigma=1$ 时，称X服从标准正态分布
记作X~N(0,1).其概率密度和分布函数分别用 $\phi(x),\Phi(x)$ 表示，即在这里插入图片描述

$\phi(x) 和 \Phi(x)$ 的性质

(1) $\phi(x)是偶函数，即\phi(x)=\phi(-x)$
(2)当x=0时， $\phi(x)取最大值{1 \over \sqrt{2π}}，\Phi(0)={1 \over 2}$
(3) $\Phi(-x)=1-\Phi(x)$ ;
（为便于计算 $\Phi$ 的函数表已被画出，可查阅书）

X~N( $\mu,\sigma^2$ 的计算（化为标准正态分布）

1.设X~N( $\mu,\sigma^2$ ，则Z= ${X-\mu\over \sigma}$ ~N(0,1)
2. 若X~N( $\mu,\sigma^2$ ),则F(x)= $\Phi({x-\mu\over\sigma})$
3. $P\{x_1<X<=x_2\}=\Phi({x_2-\mu\over\sigma})-\Phi({x_1-\mu\over\sigma})$

3 ${\sigma}$ 准则

X~N(0,1)时
x取值几乎全集中在【-3,3】
推广到一般正态分布
Y~N（ $\mu,\sigma^2$ ）时
X在【 $\mu-3\sigma,\mu+3\sigma$ 】概率为0.9974，成为3 $\sigma$ 准则

2.5-随机变量的函数的分布

一. 离散型随机变量函数的分布律

设X是离散型随机变量，则Y=g(X)一般也是离散型随机变量
此时，由X求Y分布律几颗
e.g. 在这里插入图片描述

二.连续型随机变量函数的概率密度

设随机变量X的概率密度为 $f_X(x)$ ,求随机变量Y=g(x)（g连续）的概率密度

1.一般方法–分布函数法

第一步：求出Y的分布函数 $F_Y(y)$ 的表达式:
$F_Y(y) = {P\{Y<=y\}=P\{g(X)<=y\}}=\int_{g(x)<=y}f_X(x)dx$
第二步： $f_Y(y)=F^‘_Y(y)$

2.公式法

定理设随机变量 X的具有概率密度$f_X(x),其中
$-\infty<x<+\infty$
设g(x)为 $（-\infty，+\infty）$ 严格单调可导函数
则Y=g(x)是连续型随机变量其概率密度为
$f_Y(y)=\begin{cases} f_X[h(y)]|h^‘(y)|，a<y<b\\0,其他 \end{cases}$
其中a=min(g(- $\infty$ ),g(+ $\infty$ )),b=max(g(- $\infty$ ),g(+ $\infty$ ))
h(y)是g(x)的反函数
**