数据科学-概率与概率分布

最新推荐文章于 2022-10-21 14:26:00 发布

yxjwhhhh

最新推荐文章于 2022-10-21 14:26:00 发布

阅读量444

点赞数

分类专栏：数据科学之统计学

本文链接：https://blog.csdn.net/yxjwhhhh/article/details/103336931

版权

本文详细介绍了数据科学中的概率理论，包括随机事件及其概率，离散型随机变量及其分布，如0-1分布，以及连续型随机变量的概率分布和正态分布。深入探讨了期望值、方差和离散系数等统计概念，为理解和应用概率论在数据科学中的角色奠定了基础。

摘要由CSDN通过智能技术生成

数据科学-概率与概率分布

1. 随机事件及其概率

1.1 随机事件的几个基本概念

试验和事件
在同一组条件下，对某事物或现象所进行的观察或实验叫做试验，把观察或试验的结果叫做事件
**随机事件：**在同一组条件下，每次试验可能出现也可能不出现的事件，也叫偶然事件
**必然事件：**在同一组条件下，每次试验一定出现的事件
**不可能事件：**在同一组条件下，每次试验一定不会出现的事件
如果一个时间不能分解为两个或更多个事件，则这个事件成为基本事件或简单事件。
基本事件特征：在一次试验中，只能观察到一个且仅有一个简单事件。
如果试验中所有的简单事件的全体称为样本空间或基本空间。

1.2 事件的概率

事件 $A$ 的概率是对事件 $A$ 在试验中出现的可能性大小的一种度量，记事件 $A$ 出现的可能性大小的数字为 $P (A)$ ， $P (A)$ ，称为事件 $A$ 的概率。

概率的古典定义
古典概率的特点

结果有限。即样本空间中只含有限个元素。如，掷硬币试验中，只能出现正面朝上和反面朝上两种结果。
各个结果出现的可能性被认为是相同的。如掷硬币，出现正面或反面的机会是相等的。

定义：如果某一随机试验的结果有限，而且各个结果出现的可能性相等，则某一事件 $A$ 发生的概率为该事件所包含的基本事件格式m与样本空间所包含的基本事件格式n的比值，记为
在这里插入图片描述
古典概率的局限在随机试验只有有限个可能结果的范围内，这使其应用受到很大的限制。

概率的统计定义
在相同条件下随机试验 $n$ 次，某事件 $A$ 出现 $m$ 次 $\leqslant n)$ ，则比值 $m / n$ 称为事件 $A$ 发生的概率。随着 $n$ 的增大，该频率围绕某一常数 $p$ 上下波动，且波动的幅度逐渐减小，趋于稳定，这个频率的稳定值即为该事件的概率，记为
$P(A)=\frac{m}{n}=p$
主观概率定义
指一些无法重复试验，只能根据以往经验，人为确定这个事件的概率。

2. 离散型随机变量及其分布

2.1 随机变量的概念

随机事件的数量化
为了把随机事件数量化，以便作数学上的处理，有必要把不采用数量标识表示化采用数量标识表示。
随机变量的定义
在同一组条件下，如果每次试验可能出现这样或那样的结果，并且所有的结果都能列举出来，即 $X$ 的所有结果， $x_{1}$ , $x_{2}$ ,… $x_{n}$ 都能列举出来，而且 $X$ 的可能值 $x_{1}$ , $x_{2}$ ,… $x_{n}$ 具有确定的概率 $P\left(x_{1}\right)$