概率与概率分布
0X00 前言
推断统计就是在搜集、整理观测样本拿数据的基础上,对有关总体做出推断,其特点是根据随机的观测样本拿数据以及问题的条件和假定,对未知事物做出的以概率形式表述的推断。
0X01 随机事件及其概率
1.1 随机事件的几个概念
在同一组条件下,对某事物或现象所进行的观察或实验叫做试验,把观察或实验的结构或叫做事件。
事件类型如下:
- 随机事件:在同一组条件下,每次实验可能出现也可能不出现的事件,也叫偶然事件,用大写字母A B C表示。
- 必然事件:在同一组条件下,每次实验一定出现的事件。
- 不可能事件:在同一组条件下,每次实验一定不出现的事件。
如果一个事件不能分解成两个或更多个事件,则这个事件称为基本事件,或简单事件。
一个试验中,所有简单事件的全体称为样本空间或基本空间,用 Ω \Omega Ω 表示。
1.2 事件的概率
事件 A A A 的概率是对事件A在实验中出现的可能性大小的一种度量。记事件 A A A 出现的可能性大小的数值为 P ( A ) P(A) P(A) , P ( A ) P(A) P(A)称为事件 A A A 的概率。
1.2.1 概率的古典定义
满足以下条件:
- 结果有限,机基本空间只含有限个元素
- 各个结果出现的可能性被认为是相同的
据由上面两个特点的随机试验所研究的问题称为古典概型。
如果某一随机实验的结果有限,而且各个结果出现的可能性相等,则某一事件A发生的概率为该事件所包含的基本事件个数
m
m
m 和样本空间中所包含的基本事件个数
n
n
n 的比值
P
(
A
)
=
m
n
P(A) = \frac{m}{n}
P(A)=nm
1.2.2 概率的统计定义
在相同的条件下随机实验
n
n
n 次,某事件A出现
m
m
m 次 (
m
≤
n
m \leq n
m≤n),则比值
m
/
n
m / n
m/n 称为事件A发生的频率。随着n的增大,该频率围绕某一常熟p上下波动,且波动的幅度逐渐表笑趋于未定,这个频率的为定值即为该事件的概率,为
P
(
A
)
=
m
n
=
p
P(A) = \frac{m}{n} = p
P(A)=nm=p
1.2.3 概率的主观定义
是指一些无法重复的实验,智能根据以往的经验,人为确定这个事件的概率。
0X02 离散型随机变量及其分布
2.1 随机变量的概念
把不采用数量标识表示华为采用数量标识表示,称为实际时间的数量化。
同一组条件下, P ( X i ) = P ( X = x i ) P(X_i) = P(X = x_i) P(Xi)=P(X=xi) ,称为师旅函数,则 X X X 称为 P ( X ) P(X) P(X) 的随机变量, P ( X ) P(X) P(X) 称为随机变量 X X X 的概率密度函数。随机变量是用随机事件描述随机现象的数量关系的推广。概率论与数理统计是研究随机变量的数学。按照随机变量的特性,通常可以将随机变量分为两类,离散型随机变量和连续性随机变量。
- 如果随机变量 X X X 的所有取值都可以列举出来则称 X X X 为离散型随机变量。
- 如果随机变量 X X X 无法列举,而是去树枝上某一区间内的任一点,称 X X X 为连续型随机变量。
2.1.1 离散型随机变量几个概念
离散型随机变量的所有事件的概率之和等于1。如果随机变量 X X X 的取值的概率都相等,这种分布叫均匀分布。
期望值
离散型随机变量 X X X 的完备组中,各可能值 x i x_i xi与其对应概率的乘积值和称为该 离散型随机变量 X X X 的期望值,也称为 离散型随机变量 X X X 的数学期望。是加权算术平均数的一种推广。
方差
每一个随机变量取值与期望值的离差平方之期望值。
标准差
随机变量反差的平方根为标准差
离散系数
离散系数可用来比较不同期望值总体之间的离中趋势
2.1.2 二项分布与泊松分布
二项分布如下特点:
- 包含n个相同的试验
- 每次实验只有两个可能的结果
- 某事件出翔的概率对每一次试验都是相同的
- 试验总是互相独立的
- 试验事件可以计数
通常据由上述特征的
n
n
n 次重复试验为
n
n
n 重伯努利试验, 离散型随机变量
X
X
X 服从二项分布,记作
X
B
(
n
,
p
)
X ~ B(n,p)
X B(n,p)
E
(
X
)
=
n
p
D
(
X
)
=
n
p
(
1
−
p
)
E(X) = np\\D(X) = np(1 - p)
E(X)=npD(X)=np(1−p)
特别的,当n = 1时,称为0-1分布
泊松分布
是用来描述在一指定事件范围内或指定面积或体积内某一事件出现的次数的分布
在n重伯努利分布实验中,当成功的概率很小,试验次数很大时,二项分布近似等于泊松分布
0X03 连续性随机变量的概率分布
概率密度与分布函数
连续型随机变量概率密度函数满足如下条件
f ( x ) f(x ) f(x)大于等于0
随机变量概率密度函数积分等于1
需要指出的时 f ( x ) f(x) f(x) 并不是一个概率,称为概率密度函数,而 P ( X = x ) P(X = x) P(X=x) 在连续分布的条件下为零。在连续分布的情况先,以曲线下面的面积表示概率。连续性随机变量的概率密度是其分布函数的导数。
3.2 正态分布
具有钟形概率分布的随机变量,称为正态随机变量,相应的概率分布称为正态分布