统计-随机变量

随机变量

定义

设随机试验E的样本空间为S={e},若X=X(e)是定义在样本空间S的上的一个单值实函数,则称X=X(e)为随机变量
简单说,让每一个样本点e对应着唯一的实数X(e),便得到随机变量X=X(e)

离散型随机变量

若随机变量只可能取有限个或可数无限个值时

连续型随机变量

若随机变量只可能取一个区间中的所有实数时

随机变量的概率

随机变量X取某个值x的事件用记号{X=x}表示,其概率记为{X=x}
若L是一个实数集,将随机变量X在L中取值的事件记作{X∈L},其概率记为P{X L}
P{X∈L}=P{e|X(e)∈L}

离散型随机变量及其分布律

设离散型随机变量X所有可能的取值为xk,X取xk的概率为P{X=xk}=pk (k=1,2,…)

性质

1.非负性 Pk≥0,k=1,2,…
2.规范性 p1+p2+…+pn =1

分布律
xx1 x2 … xk
pkp1 p2 … pk

k=1Pk=1 ∑ k = 1 ∞ P k = 1

X的每一个取值各占一些概率,这些概率加起来为1,即概率1以一定的规律分布着各个可能的值上。

0-1分布

定义

只取0和1两个值的随机变量所服从的分布称为0-1分布
设P{X=1}= p (0 < p <1) ,则P{X=0}=1-p
PX=k=pk(1p)1k(k=0,1) P X = k = p k ( 1 − p ) 1 − k ( k = 0 , 1 )

x0 1
p_k1-p p

二项分布

设X表示n重伯努利试验中事件A发生的次数,则X是一个随机变量,X可能的取值为0,1,…,n。
用Ai表示事件A在第i次试验中发生(i=0,1,…,n)
假设A发生在第n1,..,nk次的试验,
这k次试验A发生概率为P( A1 A 1 ¯ An1 A n − 1 ¯ An An+1 A n + 1 ¯ Ak1 A k − 1 ¯ Ak Ak+1 A k + 1 ¯ )=(1-p)…(1-p)p(1-p)…(1-p)p(1-p)…(1-p)=pk(1-p)n-k
由于A发生在哪k次试验有 Ckn C n k

公式

P{X=k}= Ckn C n k pk(1-p)n-k
随机变量X服从参数n,p的二项分布,记为X~b(n,p)

规范性
k=0nCkn ∑ k = 0 n C n k pk(1-p)n-k=[p+(1-p)]n=1

二项分布为0-1分布b(1,p)
P{X=k}=pk(1-p)n-k (k=0,1) (C_0^1 = = C_1^1$=1)

例子

某人进行射击,每次射中命中率0。02,独立射击400次,至少中两次概率
P~b(400,0.02)
P{X=k}=C400k0.02k(1-0.02)400-k
P{X≥2}=1-P{X=0}-P{X=1}
=1- C4000 C 4 00 0 0.020(1-0.02)400-0- C4000 C 4 00 0 0.021(1-0.02)400-1=0.9972

泊松分布

知道发生的的平均次数 λ λ
P=λn P = λ n
X~b(n, λn λ n )推出

limn+Ckn(λn)k(1λn)nk=λkk!eλ lim n → + ∞ C n k ( λ n ) k ( 1 − λ n ) n − k = λ k k ! e − λ

定义

设随机变量X所以可能的取值为一起自然数0,1,2…,且取值k(k=0,1,2,..)的概率为

Pk P k = P{X=k} = λkk!eλ λ k k ! e − λ
其中 λ λ >0的常数,则称X服从参数为 λ λ 的泊松分布。X~π(\lambda)

可以通过泊松分布表计算

规范性

例子

保险公司承保5000张同年龄为期一年的保单。如果合同期死亡,则赔付3万元。设1年内死亡概率为0.0015,且投保人是互为独立时间。求保险公司对于这批保险人赔付不超过30w的概率
X~b(5000,0.0015)
总赔付额为3X万元
求概率P{3X≤30}=P{X≤10}
二项分布
P{X≤10}= k=010Ck5000 ∑ k = 0 10 C 5000 k 0.0015k(1-0.0015)5000-k

计算困难,用泊松分布
\lambda=np=5000×0.0015=7.5
P{X≤10}= k=0107.5kk!e7.5 ∑ k = 0 10 7.5 k k ! e − 7.5
直接查表

几何分布 试验直到成功的概率

用Ai表示事件A在第i次试验中发生(i=0,1,…,n)假设第kci试验中A第一次发生,则
P{X=k}=P( A1 A 1 ¯ Ak1 A k − 1 ¯ Ak)=(1-p)…(1-p)p=(1-p)k-1p

定义

设多重伯努利试验中,事件A发生的概率为p(0 < p < 1),记X为A第一次发生时的试验次数,则X取值k的概率
P{X=k}=(1-p)k-1p (k=1,2…)
称X服从参数为p的几何分布,记作X~G(p)

x1 2 … k …
pkp (1-p)p … (1-p)k-1p …

规范性

k=1(1p)k1p=pk=1(1p)k1=p11(1p)=p1p=1 ∑ k = 1 ∞ ( 1 − p ) k − 1 p = p ∑ k = 1 ∞ ( 1 − p ) k − 1 = p 1 1 − ( 1 − p ) = p 1 p = 1
几何级数(等比级数)
等比级数的和= 1 首 项 1 − 公 比

超几何分布

设有N件产品,其中有D件次品。今从中任取n件,问其中恰有k件次品(k≤D)的概率是多少?
在N件产品中取n件(不放回)的取法有 CnN C N n
在D件次品中取k件的取法有 CkD C D k
在N-D件正品中取n-k件的取法有 CNDnk C N − D n − k
在N件产品中取n件,其中恰有k件次品的取法有 CkD C D k CNDnk C N − D n − k
P(A)=CkDCNDnkCnN P ( A ) = C D k C N − D n − k C N n

定义

设有N件产品,其中有M件次品。从中任取n件,则其中恰有k件次品(k≤M)的概率是
设随机变量X表示取出n件产品中的次品数,
则P{X=k}={ CkM C M k CNMnk C N − M n − k }\over { CnN C N n } k=0,1,…,n
称X服从参数为n,M,N的超几何分布

与二项分布关系

当N很大时候,超几何分布和二项分布近似

随机变量的分布函数 累积分布函数

分布函数概率

定义

设X是一个随机变量(离散型或连续型),x是任意实数,称事件{X≤x}的概率P{X≤x}为X的分布函数,记作
F(x)=P{X≤x} 定义域整个实数域
对于任何实数x1,x2 (x1 < x2) , 都有P{x1 < X ≤ x2}=P{X ≤ x2}-P{X ≤ x1}=F(x2)-F(x1)

性质1

分布函数F(x)是实数域上( ,+ − ∞ , + ∞ )的单调不减函数

性质2

0≤F(x)≤1
F( − ∞ )=0 F( + + ∞ )=1

性质3

分布函数F(x)至多有可数个跳跃间断点,且处处都是右连续的,即对任何实数x0,都有
F(X0+0)=limxx0F(x)=F(x0) F ( X 0 + 0 ) = lim x → x 0 F ( x ) = F ( x 0 )

公式

P{X≤a}=F(a)
P{X<a}=F(a-0)
P{X=a}=F(a)-F(a-0)
P{X>a}=1-F(a)
P{X≥a}=1-F(a-0)
P{a≤X<b}=F(b-0)-F(a-0)
P{a<X<b}=F(b-0)-F(a)
P{a≤X≤b}=F(b)-F(a-0)

离散型随机变量的分布函数

函数概率的累积

连续型随机变量及其密度函数

连续型随机变量及其密度函数的概念

定义

如果随机变量X的分布函数F(x)可以写成以下形式:

F(x)=xf(t)dt(<x<+) F ( x ) = ∫ − ∞ x f ( t ) d t ( − ∞ < x < + ∞ )

其中f(x)是定义在 (,+) ( − ∞ , + ∞ ) 上的非负可积函数,则称X为连续型随机变量,
f(x)称为X的概率密度函数。

性质1

f(x)≥0 非负性

性质2

F(x)=+f(x)dx=1 F ( x ) = ∫ − ∞ + ∞ f ( x ) d x = 1 规范性

性质3

若f(x)在x处联系,则F(x)在x处可导,且
F’(x)=f(x)

性质4

对任意实数x1,x2(x1

均匀分布

定义

若连续随机变量X具有概率密度

f(x)=1baa<x<b0, f ( x ) = { 1 b − a , a < x < b 0 , 其 他

则称X在区间[a,b]上服从均匀分布,记为X~U(a,b
)

意义

若X~U(a,b),则X落在区间(a,b)中任意长度的子区间的可能性是相同的。
随机变量X落入每一个小区间概率都是
1ba 1 b − a = (ba)nba ( b − a ) n b − a = 1n 1 n
即落入每一个小区间都是等可能的,所以概率被均匀的分布在区间[a,b]上。

分布函数

f(x)=0x<axabaax<b1,xb f ( x ) = { 0 , x < a x − a b − a , a ≤ x < b 1 , x ≥ b

指数分布

定义

若连续型随机变量X具有概率密度

f(x)={λeλxx>00,x0(λ>0) f ( x ) = { λ e − λ x , x > 0 0 , x ≤ 0 ( 常 数 λ > 0 )

则称X服从参数为 λ λ 的指数分布,记为X~E( λ λ )

分布函数

f(x)={1eλxx>00,x0 f ( x ) = { 1 − e − λ x , x > 0 0 , x ≤ 0

性质 无记忆性

s,t ∀ s , t >0,有P{X > s+t | X>s}=P{X>t}
在一只X>s发生的条件下,则X>s+t发生的概率就等于{X>t}发生的概率
如,X是一个电子元件的寿命,若已知元件已经使用了s小时(X>s发生),它能再使用t小时(一共使用s+t小时,X>s+t发生)的概率,与它从开始使用起能用t小时的概率相等。
指数分布通常来作为各种寿命的分布

正态分布 高斯分布

若连续型随机变量X具有概率密度
f(x)= 12πσ 1 2 π σ e(xμ)22σ2 e − ( x − μ ) 2 2 σ 2 (<x<+) ( − ∞ < x < + ∞ )
其中 μ,σ(σ>0) μ , σ ( σ > 0 ) 是常数,则称X服从参数为 μ,σ μ , σ 的正态分布,记作X~N( μ,σ2 μ , σ 2 )
μ μ 为X的均值
σ σ 为方差

图像性质

1.y=f(x)的图形关于直线x= μ μ 对称。
即f( mu m u -h)=f( mu m u +h)
2.y=f(x)在x= μ μ 处的最大值f( μ μ )= 12πσ 1 2 π σ
3.x离 μ μ 越远,f(x)的值越小
4.y=f(x)在x= μ+σ μ + σ 有两个拐点
5.y=f(x)以x轴为其水平渐近线
6.当 σ σ 固定时, μ μ 决定y=f(x)的左右位置, μ μ 称为正态分布的位置参数。
7.当 μ μ 固定是, σ σ 决定y=f(x)的集中程度。 σ σ 越小,y=f(x)的图形越尖,越高,X落在 μ μ 附件概率越大

分布函数

F(x)= 12πσ 1 2 π σ xe(xμ)22σ2 ∫ x ∞ e − ( x − μ ) 2 2 σ 2
原函数不是初等函数,只能写成积分上限函数

标准正态分布

mu m u =0, σ σ =1时的正态分布称为标准正态分布,记作X~N(0,1)
φ(x) φ ( x ) = 12π 1 2 π ex22 e x 2 2

标准化

若X~N( μ,σ2 μ , σ 2 )则Z={X- mu m u \over σ σ }~N{0,1}
F(x)= ϕ ϕ ( xμσ x − μ σ )

公式

P{X ≤ x}= ϕ ϕ ( xμσ x − μ σ )
P{|X| ≤ x}= 2ϕ 2 ϕ ( xμσ x − μ σ )-1
P{x1 < X ≤ x2}= ϕ ϕ ( x2μσ x 2 − μ σ )- ϕ ϕ ( x1μσ x 1 − μ σ )

随机变量的函数的分布

定义

设g(x)是定义在随机变量X的一切可能取值x的集合上的函数。
如果对于X的每一个可能的取值x,另一个变量Y取值相应的值y=g(x),则称Y为X的函数。记作Y=g(x)

离散型随机变量的函数的分布
连续型随机变量的函数的分布
  • 3
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值