接下里我们讨论两个随机变量的例子。连续掷三次硬币并考虑有序数对(前两次
H
的个数,三次中
那么
X1,X2
是定义在样本空间
C
上的实值函数,从样本空间映射到有序数对空间
X1,X2 是定义在样本空间 C 上的两个随机变量,在本例中,这些随机变量的空间是二维集合 D ,它是二维欧几里得空间 R2 的子集,这里 (X1,X2) 是从 C 到 D 的向量,现在我们形式化随机向量的定义。
定义1: (随机向量)给定一个样本空间为 C 的随机试验,考虑两个随机变量 X1,X2 ,对 C 中的每个元素c只分配一个有序数对 X1(c)=x1,X2(c)=x2 ,那么我们称 (X1,X2) 是一个随机向量。 (X1,X2) 的空间是有序数对 D={(x1,x2):x1=X1(c),x2=X2(c),c∈C} 的集合。
我们常用向量符号 X=(X1,X2)′ ,其中 ′ 表示行向量 (X1,X2)′ 的转置。
令
D
是随机向量
(X1,X2)
关联的空间,
A
是
因为
X1,X2
是随机变量,所以上面相加事件中的每个事件都是原始样本空间
C
中的事件,因此上面的表达式是明确的。与随机变量一样,我们可以将
P[{X1≤x1}∩{X2≤x2}]
写成
P[X1≤x1,X2≤x2]
,并且
因此所有形如 (a1,b1]×(a2,b2] 集合的概率可以用cdf的形式表述出来, R2 中这种形式的集合生成了 R2 子集的博莱尔 σ 域,cdf唯一地确定一个 R2 上的概率,我们常称这种cdf为 (X1,X2) 的联合累积分布函数。
与随机变量一样,我们主要关系两种类型的随机向量,即离散与连续,首先讨论离散情况。
随机向量
(X1,X2)
,如果它的空间
D
是有限的或可数的,那么我们称它是离散随机向量,因此
X1,X2
都是离散的,对于所有的
(x1,x2)∈D
,
(X1,X2)
的联合概率质量函数(pmf)定义为
与随机变量一样,pmf唯一的确定cdf,它也可以用两个性质表征:
对于事件
B∈D
,我们有
例1:
考虑定义在文章开头实例中的离散随机向量
(X1,X2)
,我们可以用下表表示其pmf:
表格横向的 0,1,2,3 表示 X2 的支撑,纵向 0,1,2 表示 X1 的支撑。
这样也便于叙述离散随机向量 (X1,X2) 的支撑,他们是 (X1,X2) 空间中使得 p(x1,x2)>0 的所有点 (x1,x2) ,上面的例子中支撑是由六个点 {(0,0),(0,1),(1,1),(1,2),(2,2),(2,3)} 组成的。
对于空间为
D
的随机向量
(X1,X2)
,如果它的cdf
FX1,X2(x1,x2)
是连续的,那么我们称该随机向量是连续的。在以后的文章中,有cdf的连续随机向量用非负函数的积分表示,即对于所有的
(x1,x2)∈R2,FX1,X2(x1,x2)
可以表示成
我们称被积部分为
(X1,X2)
的联合概率密度函数(pdf),对于
fX1,X2(x1,x2)
连续的点,我们有
pdf基本可有两个性质表征:
对于事件
A∈D
,我们有
注意
P[(X1,X2)∈A]
仅仅是集合
A
上曲面
注: 与单随机变量一样,我们经常省略cdf,pdf与pmf中的下标 (X1,X2) ,我们也常用符号 f12 而不是 fX1,X2 。除了 (X1,X2) ,我们也常用 (X,Y) 表示随机向量。
例2:
令
是两个连续随机变量
X1,X2
的pdf,那么我们有
注意这个概率是矩形集合 {(x1,x2):0<x1<34,13<x2<1}∈R2 上曲面 f(x1,x2)=6x21x2 下的体积。
对于连续随机向量 (X1,X2) , (X1,X2) 的支撑包含所有 f(x1,x2)>0 的点,我们用 S 表示随机向量的支撑,与单变量一样 S⊂D 。
对于
R2
上pdf
fX1,X2(x1,x2)
的定义,我们通过将其他地方设为零进行扩展,这样的话就可以避免麻烦的
D
,这样的话我们就能将
替换为
离散情况同样如此,可将
替换为
最后如果一个或多个变量的pmf或者pdf已经显示的给定,那么通过观察就能看出随机变量是离散还是连续类型,例如显然
是两个离散变量
X,Y
的pmf,而
显然是两个连续随机变量 X,Y 的pdf。
令
(X1,X2)
是随机向量,那么
X1,X2
每一个都是随机变量,我们用
(X1,X2)
的联合分布形式得到他们的分布,回忆一下定义在
x1
处
X1
cdf的事件是
{X1≤x1}
,然而
取概率得对于所有的
x1∈R
将上式重写成 FX1(x1)=limx2↑∞F(x1,x2) ,由此我们得到cdf之间的关系,根据 (X1,X2) 是离散的或连续的,我们可以将其扩展到pmf或者pdf。
首先考虑离散情况,令
DX1
是
X1
的支撑,对于
x1∈DX1
,上式等价于
根据cdf的唯一性,括号中的量肯定是
X1
在
w1
处的pmf;即对于所有的
x1∈DX1
注意,为了找出
X1
是
x1
的概率,保持
x1
不变然后在所有
x2
上求和
pX1,X2
,如下表所示。表的最后一行是
X2
的pmf,最后一列是
X1
的pmf,一般而言,因为这些分布记录在表的边缘,所以我们常称他们为边缘pmf。
例3:
考虑一个随机试验,从包含10个同样大小球的盒子中随机抽一个球,每个球上标有数字对,一个为
(1,1)
,一个为
(2,1)
,两个为
(3,1)
,一个为
(1,2)
,两个为
(2,2)
,三个为
(3,2)
。令随机变量
X1,X2
分别表示有序对的第一个与第二个数,那么
X1,X2
的联合pmf
p(x1,x2)
如下表所示,其中
p(x1,x2)
在其他地方等于零。
每行与每列的联合概率进行相加,这些边缘的和分别给出了 X1,X2 的边缘概率密度函数,注意为了求出他们我们没必要知道 p(x1,x2) 。
接下来考虑连续情况,令
DX1
表示
X1
的支持,对于
x1∈DX1
根据cdf的唯一性,括号中的量一定是
X1
在
w1
处的pdf;即对所有
x1∈D_{X_1}
因此对于连续情况, X1 的pdf通过积分 x2 得到,同样的 x2 的pdf可以通过积分 x1 得到。
例4:
X1,X2
的联合pdf为
X1
的边缘pdf为
其他地方为零,
X2
的边缘pdf为
其他地方为零。像
P(X1≤12)
的概率既可以从
f1(x1)
也可以从
f(x1,x2)
中计算得到,因为
然而为了求出像
P(X1+X2≤1)
,我们必须用联合pdf
f(x1,x2)
,如下所示:
这个概率就是集合 {(x1,x2):0<x1,x1+x2≤1} 上曲面 f(x1,x2)=x1+x2 下的体积。
(X1,X2)
是一个随机向量,
Y=g(X1,X2)
是某个实值函数,即
g:R2→R
,那么
Y
是一个随机变量且通过
假设
(X1,X2)
是连续类型,那么如果
则
E(Y)
存在,
类似的,如果
(X1,X2)
是离散的,那么如果
则
E(Y)
存在,
现在我们说明 E 是一个线性运算。
证明:
我们证明连续情况。
k1Y1+k2Y2
期望值的存在性直接从三角不等式以及积分的线性可以求出,即
利用积分的线性可得
得证。
注意对于
X2
的任意函数
g(X2)
的期望可以通过两种方式得到:
最后的式子是通过先积分 x1 得到的,下面的例子说明了这个想法。
例5:
X1,X2
的pdf为
那么
另外
因为
X2
的pdf
f2(x2)=4x32,,0<x2<1
,其他地方为零,后者的期望可以用
求出,因此
例6:
继续考虑例5,假设随机变量
Y
定义为
因此
Y
的pdf为
由此得出
对于第二种方法,我们直接求
E(Y)
接下来我们定义随机向量的矩生成函数。
定义2: (随机向量的矩生成函数)令 X=(X1,X2)′ 是一个随机向量,如果对于 |t1|<h1,|t2|<h2,E(et1X1+t2X2) 存在,其中 h1,h2 是正的,那么它可以用 MX1,X2(t1,t2) 表示且成为 X 的矩生成函数(mgf)。
与随机变量一样,如果它存在,那么随机向量的mgf唯一确定随机向量的分布。
令
t=(t1,t2)′
,那么我们可以将
X
写成
所以它与随机变量很相似。另外 X1,X2 的mgf直接可以从 MX1,X2(t1,0),MX1,X2(0,t2) 得到,在不产生混淆的情况下,我们取消 M 上的下标。
这个联合分布的mgf是
假设
t1+t2<1,t2<1
。进一步,
X,Y
边缘分布的矩生成函数分别是
这些矩生成函数分别是边缘概率密度函数
其余地方为零,与
其余地方为零。
我们也需要定义随机向量自身的期望值,但是这不是一个新的概念,因为它用元素的期望形式进行定义:
定义3:
(随机向量的期望值)
X=(X1,X2)′
是随机向量,那么如果
X1,X2
的期望存在,则
X
的期望值存在,期望值为