[编辑中,未完]
基本概念
随机试验
- 可以在相同条件下重复进行
- 每次实验的可能结果不止一个,并且能事先证明实验的所有可能
- 进行一次实验之前不能确定哪一个结果会出现
样本空间
将随机试验 E E E 的所有可能结果组成的集合称为 E E E 的 样本空间,记为 S S S
样本空间中的元素,即 E E E 的每个结果,称为 样本点
随机事件
称试验 E E E 的样本空间 S S S 的子集为 E E E 的 随机事件,简称 事件
每次试验,iff 这一子集中的一个样本点出现时,称事件发生
有一个样本点组成的单点集,称基本事件
样本空间 S S S 包含所有样本点,每次试验中总发生,称必然事件
空集 ∅ \varnothing ∅ 不包含任何样本点,每次试验都不发生,称不可能事件
事件运算
若 A ⊂ B A\subset B A⊂B,称 事件B包含事件A,A发生必导致B发生
若 A ⊂ B , B ⊂ A A\subset B,B\subset A A⊂B,B⊂A,即 A = B A=B A=B,称 相等
若 A ∪ B = { x ∣ x ∈ A o r x ∈ B } A\cup B=\{x|x\in A~or~x\in B\} A∪B={
x∣x∈A or x∈B},称 和事件
若 A ∩ B = { x ∣ x ∈ A a n d x ∈ B } A\cap B=\{x|x\in A~and~x\in B\} A∩B={
x∣x∈A and x∈B},称 积事件,也记 A B AB AB
若 A − B = { x ∣ x ∈ A a n d x ∉ B } A-B=\{x|x\in A~and~x\notin B\} A−B={
x∣x∈A and x∈/B} 称为差事件,A发生B不发生
若 A ∩ B = ∅ A\cap B=\varnothing A∩B=∅,称 互斥 ,且 A ∪ B = S A\cup B=S A∪B=S,AB互为 逆事件,又称 对立事件
- 满足定律
交换律,结合律,分配率
德摩根定律(De Morgan’s laws) : A ∪ B ‾ = A ‾ ∩ B ‾ \overline{A\cup B}=\overline{A}\cap \overline{B} A∪B=A∩B ; A ∩ B ‾ = A ‾ ∪ B ‾ \overline{A\cap B}=\overline{A}\cup \overline{B} A∩B=A∪B
频率
n次实验中,事件发生次数 n A n_A nA,称 频数, n A n \displaystyle \frac{n_A}{n} nnA称 频率
概率
对 E E E 的每一件事 A A A 赋予一个实数,记为 P ( A ) P(A) P(A),称为事件A的 概率
满足:非负性;规范性(必然事件 S S S, P ( S ) = 1 P(S)=1 P(S)=1);可列可加性(若 A i A j = ∅ A_iA_j=\varnothing AiAj=∅,有 P ( ⋃ A i ) = ∑ P ( A i ) P(\bigcup A_i)=\sum P(A_i) P(⋃Ai)=∑P(Ai))
性质
- P ( ∅ ) = 0 P(\varnothing)=0 P(∅)=0
- (有限可加性)可列可加性
- P ( B − A ) = P ( B ) − P ( A ) ; P ( B ) ≥ P ( A ) P(B-A)=P(B)-P(A)~;~P(B)\geq P(A) P(B−A)=P(B)−P(A) ; P(B)≥P(A)
- P ( A ) ≤ 1 P(A)\leq 1 P(A)≤1
- (逆事件) P ( A ‾ ) = 1 − P ( A ) P(\overline{A})=1-P(A) P(A)=1−P(A)
- (加法公式) P ( A ∪ B ) = P ( A ) + P ( B ) − P ( A B ) P(A\cup B)=P(A)+P(B)-P(AB) P(A∪B)=P(A)+P(B)−P(AB)
等可能(古典)
S S S 包含有限元素,每个事件可能性相同,称等可能概型(古典概型)(Equally Likely Outcomes Model)
条件概型
在事件 A A A 发生的条件下事件 B B B 发生 ,称 条件概率(Conditional Probability), P ( B ∣ A ) = P ( A B ) P ( A ) \displaystyle P(B|A)=\frac{P(AB)}{P(A)} P(B∣A)=P(A)P(AB) (A已发生,B多大可能发生)
可得 P ( A B ) = P ( B ∣ A ) P ( A ) P(AB)=P(B|A)P(A) P(AB)=P(B∣A)P(A) (乘法公式)
全概率公式
P ( A ) = P ( A ∣ B ) P ( B ) + P ( A ∣ B ‾ ) P ( B ‾ ) P(A)=P(A|B)P(B)+P(A|\overline{B})P(\overline{B}) P(A)=P(A∣B)P(B)+P(A∣B)P(B)
P ( A ) = ∑ P ( A ∣ B i ) P ( B i ) P(A)=\sum P(A|B_i)P(B_i) P(A)=∑P(A∣Bi)P(Bi)(把每个在不同情况下目标事件发生的概率加起来就是目标事件总的发生概率)(Total Probability)
贝叶斯
P ( B ∣ A ) = P ( A B ) A = P ( A ∣ B ) P ( B ) P ( A ∣ B ) P ( B ) + p ( A ∣ B ‾ ) P ( B ‾ ) \displaystyle P(B|A)=\frac{P(AB)}{A}=\frac{P(A|B)P(B)}{P(A|B)P(B)+p(A|\overline{B})P(\overline{B})} P(B∣A)=AP(AB)=P(A∣B)P(B)+p(A∣B)P(B)P(A∣B)P(B)
P ( B i ∣ A ) = P ( B i ) P ( A ∣ B i ) ∑ P ( B j ) P ( A ∣ B j ) \displaystyle P(B_i|A)=\frac{P(B_i)P(A|B_i)}{\sum P(B_j)P(A|B_j)} P(Bi∣A)=∑P(Bj)P(A∣Bj)P(Bi)P(A∣Bi) (已知结果,问导致这个结果的第 i i i 原因的可能性是多少)(Bayes’ Theorem)
P ( B ) P(B) P(B)为以往数据已知的 先验概率, P ( B ∣ A ) P(B|A) P(B∣A)为根据修正后的 后验概率
独立
P ( A B ) = P ( A ) P ( B ) P(AB)=P(A)P(B) P(AB)=P(A)P(B),称 相互独立(Independents),相互独立 与 互不相容不能同时成立
- P ( B ∣ A ) = P ( B ) P(B|A)=P(B) P(B∣A)=P(B),AB相互独立
- 若AB独立,则 A − B ‾ , A ‾ − B , A ‾ − B ‾ A-\overline{B},\overline{A}-B,\overline{A}-\overline{B} A−B,A−B,A−B也相互独立
一般的,任意 n n n 个事件的积事件等于各事件概率之积,称相互独立
随机变量
- PDF (Probability Density Function) 概率密度函数 也称为连续概率分布 ,记作 f ( x ) f(x) f(x) ,有 $\displaystyle f(x)\geq 0~&\int f(x)=1 $
- CDF (Cumulative Distribution Function) 累积分布函数: 记作 F X ( x ) = P ( X ≤ x ) = ∫ − ∞ + ∞ f X ( t ) d t F_X(x)=P(X\leq x)=\displaystyle \int_{-\infty}^{+\infty}f_X(t)dt FX(x)=P(X≤x)=∫−∞+∞fX(t)dt
- PMF (Probability Mass Function) 概率质量函数 也称为离散概率分布
- PF (Probability Function) 分布律
离散型随机变量
可取值或可列无限多个,称 离散型随机变量(Discrete Random Variable)
(0-1)分布
随机变量 X X X 只取0或1 , 分布律为 P { X = k } = p k ( 1 − p ) ( 1 − k ) P\{X=k\}=p^k(1-p)^{(1-k)} P{ X=k}=pk(1−p)(1−k)
伯努利分布
E E E 只有两种结果: A , A ‾ A,\overline{A} A,A,称 E E E 为 伯努利试验(Bernoulli),将 E E E 独立重复进行 n n n 次,称 重伯努利试验
二项分布
若 E E E 为 n n n 重伯努利试验,每次成功概率为 p p p , X X X 代表成功次数,则 X X X 的PF称 二项分布(Binomal Distribution),记 X ∽ B ( n , p ) X\backsim B(n,p) X∽B(n,p)
pmf为: P ( X = k ) = C n k p k ( 1 − p ) ( n − k ) P(X=k)=C_n^kp^k(1-p)^{(n-k)} P(X=k)=Cnkpk(1−p)(n−k)
伯努利分布是二项分布在 n = 1 n=1 n=1 时的特例
泊松分布
P { X = k } = λ k e − λ k ! , λ > 0 \displaystyle P\{X=k\}=\frac{\lambda^ke^{-\lambda}}{k!},\lambda > 0 P{
X=k}=k!λke−λ,λ>0 称 泊松分布(Poisson Distribution),记作 X ∼ P ( x ) X \sim P(x) X∼P(x), λ \lambda λ 是单位时间内随机事件的平均发生次数
泊松分布适合于描述单位时间内随机事件发生的次数
泊松分布的 期望 和 方差 均为 λ \lambda λ
超几何分布
从有限 N N N 个物件(其中包含 M M M 个指定种类的物件)中抽出 n n n 个物件,成功抽出该指定种类的物件的次数(不放回),称 超几何分布(Hypergeometic Distribution),记 X ∼ H ( N , M , n ) X \sim H(N,M,n) X∼H(N,M,n)
随机抽取 n n n 件产品抽查,发现 k k k 件中不合格的概率为 P ( X = k ) = C M k C N − M m − k C N m \displaystyle P(X=k)=\frac{C_M^kC^{m-k}_{N-M}}{C_N^m} P(X=k)=CNmCMkCN−Mm−k
数学期望为 E X = n M N \displaystyle EX=\frac{nM}{N} EX=NnM
连续随机变量
对于 X X X 的分布函数 F ( x ) F(x) F(x),存在非负可积函数 f ( x ) f(x) f(x) ,则称 X X X 为 连续随机变量(Continuous Random Variable)
均匀分布
Uniform Distribution PDF:
f ( x ) = { 1 b − a a < x < b 0 o t h e r w i s e f(x)= \left\{ \begin{array}{l l} &\displaystyle \frac{1}{b-a} &a<x<b\\ &0 &otherwise \end{array} \right. f(x)={
b−a10a<x<botherwise
记作 X ∼ U ( a , b ) X \sim U(a,b) X∼U(a,b)
THe CDF is
F ( x ) = ∫ − ∞ x f ( t ) d t = { 0 x < a x − a b − a a ≤ x ≤ b 1 x > b F(x)=\int_{-\infty}^xf(t)dt= \left\{ \begin{array}{l l} 0 &x<a\\ \displaystyle \frac{x-a}{b-a} &a \leq x \leq b\\ 1&x>b \end{array} \right. F(x)=∫−∞xf(t)dt=⎩⎪⎨⎪⎧0b−ax−a1x<aa≤x≤bx>b
指数分布
Exponential distribution PDF:
f ( x ) = { 1 θ e − x θ x > 0 0 o t h e r w i s e f(x)= \left\{ \begin{array}{l l} &\displaystyle \frac{1}{\theta}e^{-\frac{x}{\theta}} &x>0\\ &0 &otherwise \end{array} \right. f(x)=