作者:Vamei 出处:http://www.cnblogs.com/vamei 欢迎转载,也请保留这段声明。谢谢!
样本空间中包含了一次实验所有可能的结果,而事件是样本空间的一个子集。我们将讨论随机变量。
随机变量(random variable)的本质是一个函数,是从样本空间到实数的映射。根据样本空间中的元素不同(即不同的实验结果),随机变量的值也将随机产生。
离散随机变量
在连续掷两次硬币的例子中,样本空间为:
$$\Omega = \{ HH, HT, TH, TT \}$$
如果我们取以下随机变量,即结果中正面的次数,将有2, 1, 0三种可能的取值。这样一种取值离散的随机变量称为离散随机变量。
映射关系如下:
实验结果 | 随机变量 |
HH | 2 |
HT | 1 |
TH | 1 |
TT | 0 |
我们通常用一个大写字母来表示一个随机变量,比如X。
如果每个结果等概率,那么随机变量取值可能性为:
$$P(X=2) = 0.25$$
$$P(X=1) = 0.5$$
$$P(X=0) = 0.25$$
注意到,X=1实际上有两个对应的样本空间元素,HT, TH。因此,X=1出现的概率较高。所有可能取值的概率和为1。
[$P(X=x)$]表示了随机变量在不同取值下的概率,称为概率质量函数(PMF, probability mass function)。我们将看到其他的表示概率分布的方式。
累积分布函数
我们刚才看到了随机变量在不同取值下的概率。我们可以用累积分布函数(CDF, cumulative distribution function)来表示概率分布的状况。即
$$F(x) = P(X \le x), -\infty < x < \infty$$
我们可以绘制上面例子的CDF。
上面的图片可以用如下代码生成:
# By Vamei
# Plot the CDF of total number of heads in two flips
import matplotlib.pyplot as plt
x = [-1, 0, 0, 1, 1, 2, 2, 3]
y = [0, 0, 0.25, 0.25, 0.75, 0.75, 1.0, 1.0]
fig = plt.figure()
ax = plt.subplot(111)
ax.plot(x, y)
ax.set_ylim([-0.1, 1.1])
ax.set_title("CDF, total number of heads")
plt.show()
累积分布函数是一个递增函数,并在正无穷时为1。
连续随机变量
随机变量还可以是连续取值,这样的随机变量称为连续随机变量(continuous random variable)。当这样取值时,任意区间能实际上都有无穷多个结果,每个结果的可能性都是无穷小。为了数学上的方便,在这种情况下,我们讨论的是区间的概率,即[$P(a<X<b)$],而不是具体某一结果的概率。
累积分布函数表示的是一个随机变量在一个区间概率,所以可以直接用于连续随机变量。即
$$F(x) = P(X \le x), - \infty < x < \infty$$
我们经常使用密度函数(density function),而不是累积分布函数,来表示一个连续随机变量的概率分布,
$$f(x) = \frac{dF(x)}{dx}$$
即密度函数是累积分布函数的微分,或者说,
$$F(x) = \int_{-\infty}^x f(u)du$$
即累积分布函数是密度函数从负无穷到x的积分。
密度函数满足:
$$\int_{-\infty}^{+\infty} f(u)du = 1$$
假设我们有一个随机数生成器,产生一个从0到1的实数,每个实数出现的概率相等。这样的一个分布被称为均匀分布(uniform distribution)。它的密度函数可以写成:
$$f(x) = \left\{ \begin{array}{l} 1, 0 \leq x \leq 1 \\ 0, x<0 \, or \, x>1 \end{array}\right.$$
可以画出该密度函数
根据积分的定义,我们知道,密度曲线下某个区间的面积,代表了随机变量在该区间的概率。总体的概率为1。
上面的图片可以利用下面代码生成:
# By Vamei
# Density function for uniform distribution
import matplotlib.pyplot as plt x = [-1, 0, 0, 1, 1, 2] y = [0, 0, 1, 1, 0, 0] fig = plt.figure() ax = plt.subplot(111) ax.plot(x, y) ax.set_xlim([-1, 2]) ax.set_ylim([-0.1, 1.1]) ax.set_title("density function for uniform distribution") plt.show()
总结
随机变量,随机变量的概率分布
累积分布函数
密度函数
<script type="text/javascript"> </script><script type="text/javascript" src="http://pagead2.googlesyndication.com/pagead/show_ads.js"></script>