1. 随机试验
满足以下3个条件的试验可以称为随机试验:
- 相同条件下可重复
- 试验结果明确可知且不只一个
- 试验前不知道哪个结果会发生
例如:我们平时做的抛硬币、掷骰子试验都是随机试验。以抛硬币试验为例:①该试验可以重复进行多次;②试验结果我们明确知道要么正面朝上,要么反面朝上;③在试验开始前我们也不知道哪种结果会发生。因此这是一个随机试验。
2. 随机事件
在一次试验中,可能出现,有可能不出现的结果称为随机事件,常用大写字母A、B、C表示。
例如:在抛硬币试验中,正面朝上是一个随机事件,反面朝上也是一个随机事件,可用A={正面向上},A={反面向上}表示。
3. 随机变量
将随机试验的结果用一个变量来表示,这个变量就被称为随机变量,常用X、Y、Z来表示。随机变量包含了试验的各种结果。
例子1:在抛硬币试验中,硬币朝上的花色结果是随机变量,用X表示,假设正面朝上为1,反面朝上为0,则X=0,1。
例子2:在掷骰子试验中,掷出的点数是随机变量X,则X=1,2,3,4,5,6;
总之,引入【随机变量】是为了将【随机试验的结果】数量化,这样我们才能用统一的数学语言去进行分析和计算。
4. 随机变量的分类
随机变量分为两类:离散型随机变量和连续型随机变量。
- 离散型随机变量:随机变量X的取值是有限的(或无穷可列的)。
- 连续型随机变量:随机变量X的取值是无限的,是不能逐个列出的。
4.1 离散型随机变量的概率分布
以下是离散型随机变量的概率分布:
其中,
x
k
x_k
xk 表示随机变量X的k种结果,
p
k
p_k
pk表示在第k种结果下的概率
我们也常用这样的方式表示:
看到这里就很熟悉了吧,
举个例子:有5个球,2个白球,3个红球,从中任取3个,设随机变量X为取到的白球数,求X的概览分布。
4.2 连续型随机变量的概率分布
如果随机变量X的分布函数可以表示为:
其中,
f
(
x
)
f(x)
f(x) 是非负可积函数,则称X为连续型随机变量,称
f
(
x
)
f(x)
f(x)为概率密度。
再次强调,连续型随机变量的取值是无限多个的,即有无限多个随机变量的结果,且不可以枚举出来。
例如:公交车每30分钟一班,某人的等车时间是一个随机变量X,X的取值范围是[0,30),可以看出,这是一个区间,而不是某几个点,即X可取在0-30分钟这个时间轴上的任意一点,如3分钟、5分钟7毫秒、7√2分钟等,它是连续的而不是离散的,因此我们称X为连续型随机变量。
下面再来看概率密度,由于连续型随机变量计算某个点的概率没有意义,需要计算的是某个区间的概率,因此引入了概率密度。我们可以把概率密度看成是纵坐标,区间看成是横坐标,概率密度对区间的积分就是面积,而这个面积就是事件在这个区间发生的概率,所有面积的和为1。下面这张图的阴影面积就是X在[a,b]区间上的概率。