概率论04 随机变量

作者:Vamei 出处:http://www.cnblogs.com/vamei 欢迎转载,也请保留这段声明。谢谢!

 

样本空间中包含了一次实验所有可能的结果,而事件是样本空间的一个子集。我们将讨论随机变量。

随机变量(random variable)的本质是一个函数,是从样本空间到实数的映射。根据样本空间中的元素不同(即不同的实验结果),随机变量的值也将随机产生。

 

离散随机变量

在连续掷两次硬币的例子中,样本空间为:

$$\Omega = \{ HH, HT, TH, TT \}$$

如果我们取以下随机变量,即结果中正面的次数,将有2, 1, 0三种可能的取值。这样一种取值离散的随机变量称为离散随机变量

映射关系如下:

实验结果随机变量
HH2
HT1
TH1
TT0

 

我们通常用一个大写字母来表示一个随机变量,比如X。

如果每个结果等概率,那么随机变量取值可能性为:

$$P(X=2) = 0.25$$

$$P(X=1) = 0.5$$

$$P(X=0) = 0.25$$

注意到,X=1实际上有两个对应的样本空间元素,HT, TH。因此,X=1出现的概率较高。所有可能取值的概率和为1。

[$P(X=x)$]表示了随机变量在不同取值下的概率,称为概率质量函数(PMF, probability mass function)。我们将看到其他的表示概率分布的方式。

 

累积分布函数

我们刚才看到了随机变量在不同取值下的概率。我们可以用累积分布函数(CDF, cumulative distribution function)来表示概率分布的状况。即

$$F(x) = P(X \le x), -\infty < x < \infty$$

我们可以绘制上面例子的CDF。

上面的图片可以用如下代码生成:

# By Vamei
# Plot the CDF of total number of heads in two flips

import matplotlib.pyplot as plt
x = [-1, 0, 0, 1, 1, 2, 2, 3]
y = [0, 0, 0.25, 0.25, 0.75, 0.75, 1.0, 1.0]

fig = plt.figure()
ax  = plt.subplot(111)

ax.plot(x, y)
ax.set_ylim([-0.1, 1.1])
ax.set_title("CDF, total number of heads")
plt.show()

 

累积分布函数是一个递增函数,并在正无穷时为1。

 

连续随机变量

随机变量还可以是连续取值,这样的随机变量称为连续随机变量(continuous random variable)。当这样取值时,任意区间能实际上都有无穷多个结果,每个结果的可能性都是无穷小。为了数学上的方便,在这种情况下,我们讨论的是区间的概率,即[$P(a<X<b)$],而不是具体某一结果的概率。

 

累积分布函数表示的是一个随机变量在一个区间概率,所以可以直接用于连续随机变量。即

$$F(x) = P(X \le x), - \infty < x < \infty$$

 

我们经常使用密度函数(density function),而不是累积分布函数,来表示一个连续随机变量的概率分布,

$$f(x) = \frac{dF(x)}{dx}$$

即密度函数是累积分布函数的微分,或者说,

$$F(x) = \int_{-\infty}^x f(u)du$$

即累积分布函数是密度函数从负无穷到x的积分。

 

密度函数满足:

$$\int_{-\infty}^{+\infty} f(u)du = 1$$

 

假设我们有一个随机数生成器,产生一个从0到1的实数,每个实数出现的概率相等。这样的一个分布被称为均匀分布(uniform distribution)。它的密度函数可以写成:

$$f(x) = \left\{ \begin{array}{l} 1, 0 \leq x \leq 1 \\ 0, x<0 \, or \, x>1 \end{array}\right.$$

 

可以画出该密度函数

根据积分的定义,我们知道,密度曲线下某个区间的面积,代表了随机变量在该区间的概率。总体的概率为1。

上面的图片可以利用下面代码生成:

 

# By Vamei
# Density function for uniform distribution

import
matplotlib.pyplot as plt x = [-1, 0, 0, 1, 1, 2] y = [0, 0, 1, 1, 0, 0] fig = plt.figure() ax = plt.subplot(111) ax.plot(x, y) ax.set_xlim([-1, 2]) ax.set_ylim([-0.1, 1.1]) ax.set_title("density function for uniform distribution") plt.show()

 

总结

随机变量,随机变量的概率分布

累积分布函数

密度函数

 


<script type="text/javascript"> </script><script type="text/javascript" src="http://pagead2.googlesyndication.com/pagead/show_ads.js"></script>
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值