学习笔记——概率论与数理统计（第二章）

追风赶月莫停留-_-

已于 2023-05-24 15:04:28 修改

阅读量945

点赞数

分类专栏：概率论与数理统计（宋浩）文章标签：概率论学习笔记

于 2023-05-23 15:19:24 首次发布

本文链接：https://blog.csdn.net/weixin_44351720/article/details/130809100

版权

概率论与数理统计（宋浩）专栏收录该内容

9 篇文章

订阅专栏

学习笔记——概率论与数理统计（第二章）

第二章

学习来源：https://www.bilibili.com/video/av36206436/

第二章

2.1 随机变量的概念

定义： $\Omega$ 是样本空间， $X=X(\omega)$ 是该样本空间上的实值函数（定义域是样本空间），X 称为随机变量，一般用 $X，Y，Z，\xi，\eta，\varsigma$ 表示

$\{\omega|X(\omega)=a\}事件：\{X=a\}事件$

离散型：有限个/无限可列个
非离散型：主要研究连续型

2.2

2.2.1 离散型随机变量及其概率分布

X的所有取值 $x_k(k=1,2,\cdots)$ （可列个）
$P(X=x_k)=P_k$ 概率函数/概率分布
概率分布表：
$\begin{array}{ccc} {X}&{1}&{0}\\ \hline {P}&{\cfrac{1}{2}}&{\cfrac{1}{2}}\\ \end{array}$

$P_k\geq 0$
$\sum P_k=1$

连续型随机变量及其概率密度函数
频数直方图和频率密度直方图

每个小长方形的面积等于该组的频率
所有小长方形的面积之和等于1
介于 x=a 和 x=b 之间的面积近似等于 ( a , b ] 之间的频率

定义：非负可积函数 $)，f(x)\geq 0，a\leq b$
$\displaystyle P(a<x\leq b)=\int_a^bf(x)dx$
x：连续型随机变量
f ( x ) ：x 的概率分布密度函数
记作 $X\sim f(x)$
性质：

$f(x)\geq 0$
$\displaystyle\int_{-\infin}^{+\infin}f(x)=1$
连续型随机变量取个别值的概率为0

连续型不考虑端点
$P(a\leq x\leq b)=P(a<x\leq b)=P(a\leq x<b)=P(a<x<b)$

概率为0的事件未必是不可能事件
概率为1的事件未必是必然事件

X取 x 附近值的概率大小
$\displaystyle\lim\limits_{\Delta x\to 0} \frac{P(x<X<x+\Delta x)}{\Delta x}=\frac{\displaystyle\int_x^{x+\Delta x}f(x)dx}{\Delta x}$
$P(x<X<x+\Delta x)\approx f(x)\Delta x$

2.2.2 分布函数的定义

定义： $F(x)=P(X\leq x)$ （普通的实函数）
X 取值不超过 x 的概率
$x\in(-\infin,+\infin)，F(x)\in[0,1]$

离散型的分布函数

性质：

$0\leq F(x)\leq 1，x\in(-\infin,+\infin)$
F ( x ) 不减： $\forall x_1<x_2,F(x_1)\leq F(x_2)$ $\lim\limits_{x\to +\infin}F(x)=F(+\infin)=1$ $\lim\limits_{x\to -\infin}F(x)=F(-\infin)=0$
F ( x ) 是右连续的，至多有可列个间断点 $\lim\limits_{x\to a^+}F(x)=F(a)$

公式：
$P(X\leq a)=F(a)$
$P (X > a) = 1 - F (a)$
$P(a<X\leq b)=P(X\leq b)-P(X\leq a)=F(b)-F(a)$
$P (X = a) = F (a) - F (a - 0)$
$P(a\leq X\leq b)=F(b)-F(a-0)$
$P (X < a) = F (a - 0)$
$P(X\geq a)=1-F(a-0)$

连续型的分布函数

$F(x)=P(X\geq x)=\displaystyle\int_{-\infin}^xf(t)dt$

2.2.3 常见的分布

离散型常见分布

0-1分布
$\begin{array}{ccc} {X}&{1}&{0}\\ \hline {P}&{p}&{1-p}\\ \end{array}$ $P(X=k)=p^k(1-p)^{1-k}$ （二项分布的特例）

有两种结果
试验只做一次

几何分布
P ( A ) = p
第 k 次首次发生，前 k − 1 次未发生
$P(X=k)=(1-p)^{k-1}p^k,k=0,1,2,\cdots$
$X\sim G(p)$

二项分布
P(A)=p
n 次试验，发生了 k 次
$P(X=k)=C_n^kp^k(1-p)^{n-k}, k=0,1,2,\cdots,n$
$X\sim B(n,p)$
n = 1 时， $P(X=k)=C_1^kp^k(1-p)^{1-k},k=0,1$ （0-1分布）
最可能值：

( n + 1 ) p 不为整数，[(n + 1)p]达到最大值
( n + 1 ) p 为整数，( n + 1 ) p 和( n + 1 ) p + 1都是最大值

泊松分布
$\cfrac{\lambda^k}{k!}e^{-\lambda}，k = 1,2,3,\cdots$
$\lambda>0$
$X\sim P(\lambda)$
电台收到的呼叫次数，公用设施（候车，收银台，一员挂号处）
计算方式：查表
二项分布可以用泊松分布近似
条件：n 较大，p 较小，np 适中（ $n\geq100,np\leq10$ ）

超几何分布
定义：N 个元素， $N_1$ 个属于第一类， $N_2$ 个属于第二类，取 n 个，X：n 个中属于第一类的个数
$\displaystyle P(X=k)=\frac{C_{N_1}^kC_{N_2}^{n-k}}{C_N^n},k=0,1,2,\cdots,\min\{n,N_1\}$
超几何分布可以用来描述不放回抽样的实验
当 N 很大，n 相对 N 很小时， $p=\frac{M}{N}$ 改变甚微，不放回抽样可以看作放回抽样
$\displaystyle P(X=k)=\frac{C_M^kC_{N-M}^{n-k}}{C_N^n}\approx C_n^kp^k(1-p)^{n-k}$

连续型常见分布

均匀分布
$\begin{cases} \cfrac{1}{b - a}& \text{a ≤ x ≤ b}\\ 0& \text{else} \end{cases}$

$X\sim U[a,b]$

分布函数：

$F(x)=\displaystyle\int_{-\infin}^xf(t)dt= \begin{cases} 1& \text{x < a}\\ \cfrac{x - a}{b - a}& \text{a ≤ x < b}\\ 1& \text{x ≤ b} \end{cases}$

$X\sim[a,b],[c,d]\subset[a,b]$
$P(c\leq x\leq d)=\displaystyle\int_c^d\frac{1}{b-a}dt=\frac{d-c}{b-a}$

落在[a, b]上任意子区间的概率与子区间的长度成正比，与子区间的位置无关

指数分布
$\begin{cases} \lambda e^{-\lambda x} & \text{x > 0}\\ 0 & \text{x ≤ 0} \end{cases}$

$\lambda \gt 0, X\sim E_{xp}(\lambda)$

$\begin{cases} 1 - e^{-\lambda x} & \text{x > 0}\\ 0 & \text{x ≤ 0} \end{cases}$

服务系统的服务时间，电话的通话时间，消耗性产品的寿命

正态分布
密度函数：
$\phi(x)=\displaystyle\frac{1}{\sqrt{2\pi}\sigma}e^{-\displaystyle\frac{(x-\mu)^2}{2\sigma^2}},-\infin<x<+\infin$

记作 $X\sim N(\mu,\sigma^2)$

已知 $\displaystyle\int_{-\infin}^{+\infin}e^{-x^2}dx$ （高数知识）

则有：

$\displaystyle\int_{-\infin}^{+\infin}\Phi(x)dx\\ =\displaystyle\int_{-\infin}^{+\infin}\displaystyle\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}}dx\\ =\displaystyle\frac{1}{\sqrt{2\pi}\sigma}\displaystyle\int_{-\infin}^{+\infin}e^{-\frac{(x-\mu)^2}{2\sigma^2}}dx\\ =\displaystyle\frac{\sqrt{2}\sigma}{\sqrt{2\pi}\sigma}\displaystyle\int_{-\infin}^{+\infin}e^{-(\frac{x-\mu}{\sqrt{2}\sigma})^2}d(\frac{x-\mu}{\sqrt{2}\sigma})\\ =\frac{1}{\sqrt{\pi}}\sqrt{\pi}\\ =1$

分布函数：

$\Phi(x)=\displaystyle\frac{1}{\sqrt{2\pi}\sigma}\int_{-\infin}^xe^{-\frac{(x-\mu)^2}{2\sigma^2}}dt$

性质：

$y=\phi(x)$ 以 $x=\mu$ 为对称轴
$x=\mu$ 时， $\phi(x)$ 取最大值 $\frac{1}{\sqrt{2\pi}\sigma}$
$y=\phi(x)$ 以 x 轴为渐近线， $x=\mu\pm\sigma$ 时有拐点
$\sigmaσ$ 固定， $\mu$ 变化：图像左右移动
$\mu$ 固定， $\sigma$ 变化： $\sigma$ 变小，最高点上移（变陡）； $\sigma$ 变大，最高点下移（变缓）

标准正态分布：
$\mu=0,\sigma=1$
$\phi_0(x)=\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}},-\infin<x<+\infin$
$\Phi_0(x)=\frac{1}{\sqrt{2\pi}}\displaystyle\int_{-\infin}^xe^{-\frac{t^2}{2}}dt$

性质：

y 轴为对称轴（偶函数）
$\phi_0(x)=\phi_0(-x)$
$\Phi_0(-x)=1-\Phi_0(x)$

如果一个指标的影响因素有很多，每个因素起的作用都不太大，则这个指标服从正态分布

一般正态分布向标准正态分布转化：

$\phi(x)=\displaystyle\frac{1}{\sigma}\phi_0(\frac{x-\mu}{\sigma})$
$\Phi(x)=\displaystyle\Phi_0(\frac{x-\mu}{\sigma})$
$X∼N(μ,σ^2)$
$P(|X-\mu|<\sigma)=0.6826$
$P(|X-\mu|<2\sigma)=0.9544$
$P(|X-\mu|<3\sigma)=0.9974$

3σ准则：
如果一个系统设计时服从正态分布，在检验时不符合 3 $\sigma$ 准则，则不合格

X∼(0,1)，给定 $\alpha(0<\alpha<1)$ ，找到 $u_\alpha$ 满足 $P(X>u_\alpha)=\alpha$ ， $u_\alpha$ 称为上 $\alpha$ 分位数
$u_{0.05}=1.645$
$u_{0.025}=1.96$
$u_{0.01}=2.33$

2.3

2.3.1 随机变量函数的分布

已知 X 是某分布，求Y = f ( X ) 是什么分布

离散型

例
已知：
$\begin{array}{ccccc} {X}&{7}&{8}&{9}&{10}\\ \hline {P}&{0.1}&{0.3}&{0.4}&{0.2}\\ \end{array}$
Y = 4X
则有：
$\begin{array}{ccccc} {Y}&{28}&{32}&{36}&{40}\\ \hline {P}&{0.1}&{0.3}&{0.4}&{0.2}\\ \end{array}$