数据科学-概率与概率分布

本文详细介绍了数据科学中的概率理论,包括随机事件及其概率,离散型随机变量及其分布,如0-1分布,以及连续型随机变量的概率分布和正态分布。深入探讨了期望值、方差和离散系数等统计概念,为理解和应用概率论在数据科学中的角色奠定了基础。
摘要由CSDN通过智能技术生成

数据科学-概率与概率分布

1. 随机事件及其概率

1.1 随机事件的几个基本概念

试验和事件
在同一组条件下,对某事物或现象所进行的观察或实验叫做试验,把观察或试验的结果叫做事件
**随机事件:**在同一组条件下,每次试验可能出现也可能不出现的事件,也叫偶然事件
**必然事件:**在同一组条件下,每次试验一定出现的事件
**不可能事件:**在同一组条件下,每次试验一定不会出现的事件
如果一个时间不能分解为两个或更多个事件,则这个事件成为基本事件或简单事件。
基本事件特征:在一次试验中,只能观察到一个且仅有一个简单事件。
如果试验中所有的简单事件的全体称为样本空间或基本空间。

1.2 事件的概率

事件 A A A的概率是对事件 A A A在试验中出现的可能性大小的一种度量,记事件 A A A出现的可能性大小的数字为 P ( A ) P(A) P(A) P ( A ) P(A) P(A),称为事件 A A A的概率。

概率的古典定义
古典概率的特点

  1. 结果有限。即样本空间中只含有限个元素。如,掷硬币试验中,只能出现 正面朝上和反面朝上两种结果。
  2. 各个结果出现的可能性被认为是相同的。如掷硬币,出现正面或反面的机会是相等的。

定义:如果某一随机试验的结果有限,而且各个结果出现的可能性相等,则某一事件 A A A发生的概率为该事件所包含的基本事件格式m与样本空间所包含的基本事件格式n的比值,记为
在这里插入图片描述
古典概率的局限在随机试验只有有限个可能结果的范围内,这使其应用受到很大的限制。

概率的统计定义
在相同条件下随机试验 n n n次,某事件 A A A出现 m m m ( m ⩽ n ) (m \leqslant n) (mn),则比值 m / n m / n m/n 称为事件 A A A发生的概率。随着 n n n的增大,该频率围绕某一常数 p p p上下波动,且波动的幅度逐渐减小,趋于稳定,这个频率的稳定值即为该事件的概率,记为
P ( A ) = m n = p P(A)=\frac{m}{n}=p P(A)=nm=p
主观概率定义
指一些无法重复试验,只能根据以往经验,人为确定这个事件的概率。

2. 离散型随机变量及其分布

2.1 随机变量的概念

随机事件的数量化
为了把随机事件数量化,以便作数学上的处理,有必要把不采用数量标识表示化采用数量标识表示。
随机变量的定义
在同一组条件下,如果每次试验可能出现这样或那样的结果,并且所有的结果都能列举出来,即 X X X的所有结果, x 1 x_{1} x1, x 2 x_{2} x2,… x n x_{n} xn 都能列举出来,而且 X X X的可能值 x 1 x_{1} x1, x 2 x_{2} x2,… x n x_{n} xn具有确定的概率 P ( x 1 ) P\left(x_{1}\right)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值