统计学笔记（四）概率与概率分布

WhyNot?

已于 2023-09-01 17:14:36 修改

阅读量214

点赞数 1

分类专栏：统计学文章标签：笔记概率论

于 2023-08-24 21:05:52 首次发布

本文链接：https://blog.csdn.net/JESSIENOTCAR/article/details/132481487

版权

统计学专栏收录该内容

8 篇文章 6 订阅

订阅专栏

本文概述了随机事件的基本概念，包括试验、事件、概率的定义，重点介绍了离散型随机变量（如二项分布和泊松分布）和连续型随机变量（如正态分布）的概率分布及其特性。

摘要由CSDN通过智能技术生成

文章目录

1、随机事件及其概率
- 1.1 随机事件的几个基本概念
- 1.2 事件的概率
2、离散型随机变量及其分布
3、连续型随机变量的概率分布
- 3.1 基本概念
- 3.2 正态分布
参考资料

1、随机事件及其概率

1.1 随机事件的几个基本概念

试验和事件：在同一组条件下，对某事件或现象进行观察或实验叫作『试验』，把观察或试验的结果叫作『事件』。
随机事件：在同一组条件下，每次试验可能出现也可能不出现的事件。随机事件是概率论研究的范畴。
必然事件
不可能事件
基本事件/简单事件：如果一个事件不能分解成两个或多个事件，则称这个事件未基本事件；
样本空间：一个试验中所有基本事件的全体称为样本空间或基本空间。

1.2 事件的概率

事件A的概率是对事件A在试验中出现的可能性大小的一种度量。概率的「统计定义如下」：

在『相同条件下』随机试验n次，某事件A出现m次（m<=n），则比值m/n称为事件发生的「频率」。随着n的增大，该频率围绕某一常数p上下波动，且波动的幅度逐渐减小，趋于稳定，这个『频率的稳定值』即为该事件的概率，记为：

$\frac{m}{n}=p$

2、离散型随机变量及其分布

2.1 基本概念

$P (x)$ ： $x$ 称为 $P (x)$ 的随机变量， $P (x)$ 称为 $x$ 的概率函数；
随机变量分为『离散型随机变量』和『连续型随机变量』；
期望值和加权平均数的区别：加权平均数是具体数据的平均指标，而期望值一般指随机变量 $x$ 的期望指标；
离散系数 = 标准差 / 期望，可以用来比较不同期望值的总体之间的离中趋势。

2.2 分布

2.2.1 二项分布

又叫 $n$ 次重复独立试验、 $n$ 重贝努里试验
包含 $n$ 个相同的试验；
每次试验只有两种可能的结果；
出现“成功”的概率 $p$ 是相同的，出现“失败”的概率 $q$ 也是如此， $p + q = 1$ ；
试验是互相独立的；
试验“成功”或“失败”可以计数，即试验结果对应于一个离散型随机变量；

如果随机变量 $x$ 服从参数为 $n$ 和 $p$ 的二项分布，我们记为： $X ～ B (n, p)$ 。

n次试验中正好得到k次成功的概率由概率质量函数给出：

$P(X = x) = C_n^xp^xq^{n-x}, x = 0, 1, 2, ..., n$
当 $n = 1$ 时得到0-1分布：
$P(X = x) = p^xq^{1-x}, x = 0, 1$

如果 $X$ 是服从二项分布的随机变量，那么 $X$ 的期望值为：
$E (x) = n p$
$X$ 的方差为：
$D (x) = n p (1 - p)$

二项分布的概率质量函数图像为：
在这里插入图片描述

二项分布的累积分布函数为：
在这里插入图片描述

2.2.2 泊松分布

定义：泊松分布是用来描述指定时间范围内或在指定面积或体积内，某一事件出现次数的分布。
例如：某企业每月发生事故的次数、单位时间内到达服务柜台需要服务的顾客人数；
在n重贝努里试验中，当成功的概率很小（即p→0），试验次数很大时，二项分布近似等于泊松分布。
在实际应用中，当p<=0.25, n>20, np<=5时，用泊松分布近似二项分布的效果良好。

如果随机变量 $x$ 服从参数为 $\lambda$ 的二项分布，我们记为： $X ～ P oss i o n (n, p)$ 或 $～\pi(n,p)$ 。

泊松分布的概率质量函数为：
$\frac{\lambda^xe^{-\lambda}}{x!}$
如果 $X$ 是服从泊松分布的随机变量，那么 $X$ 的期望值为：
$\lambda$
$X$ 的方差为：
$=\lambda$

泊松分布的概率质量函数为：
在这里插入图片描述
泊松分布的累积分布函数为：

3、连续型随机变量的概率分布

3.1 基本概念

由于连续型随机变量可以取某区间上的任意一个值，所以我们不能跟对离散型随机变量一样列出每个值及其相应的概率，而是通常用数学函数和分布函数的形式来描述。

当用 $f (x)$ 来描述连续型随机变量时，我们称 $f (x)$ 为『概率密度函数』(PDF: probability density function)（对应的离散型概率分布称为概率质量分布，PMF：probability mass function）。

概率密度函数应该满足以下两个条件：
(1) $\ge 0$
(2) $\int_{-\infty}^{\infty}f(x)dx = 1$

需要指出的是， $f (x)$ 并不是一个概率，即 $f (X)! = P （ X = x ）$ ， $f (x)$ 称为概率密度函数，而 $P (X = x)$ 在连续分布的条件下为0。在连续分布的情况下，以曲线下面的面积表示概率：

连续型随机变量的概率也可以用「分布函数」 $F (x)$ 来表示，显然，分布函数是建立在密度函数f(x)之上的，连续型随机变量的概率密度是其分布函数的导数。

3.2 正态分布

– 正态分布的定义及图形特点：「对称钟形」
– 均值决定了图形的中心位置，方差决定了图形曲线的陡峭程度；方差越小曲线越陡峭，方差越大曲线越平缓。
–标准正态分布：标准正态分布的重要性在于，任何一个一般的正态分布都可以通过线性变换转化为标准正态分布。

如果**随机变量 $x$ 服从平均数为 $\mu$ 、标准差为 $\sigma$ 的常态分布，我们记为： $～N(\mu,\sigma^2)$ 。

泊松分布的概率质量函数为：
$\frac{\lambda^xe^{-\lambda}}{x!}$
正态分布的概率密度函数为：
在这里插入图片描述
正态分布的累积分布函数为：

参考资料

[1] 贾俊平. (2018). 统计学 (第7版). 中国人民大学出版社。
[2] 对泊松分布的通俗理解
[3] 维基百科二项分布
[4] 维基百科泊松分布
[5] 维基百科正态分布

WhyNot?

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录