在了解了一维随机变量、分布、随机变量函数的分布之后,进入到多维随机变量及其分布。总的来讲多维随机变量的及其分布与一维答题是类似的,是将一维拓展到了多维,毕竟我们研究的对象都是高维对象,呈现出来的不确定性也是多维的,需要从多个维度进行刻画,所以从应用的角度来讲多维随机变量的应用更广泛。
首先定义,多维随机变量可以看作是定义在一个随机事件上的一个随机向量,这个随机向量看作是多个随机变量构成的。比如体检的时候我们都会量身高、体重,所以身高、体重就是可以看作描述一个人特征的二维随机变量。随机变量的特征,由随机变量的分布刻画。所以二维随机变量的特征由二维的随机变量的分布函数来刻画,当然这个分布函数也是密度函数的不定上限积分,如果把随机变量的值看作是平面坐标中的点,那概率的几何意义就是二维随机变量围成的面积,高维的可以类推。分布函数的性质也可以类比一维随机变量的性质。一下简述几个基本概念:
1、多维随机变量的分布:同样的离散型随机变量的分布用分布律来表示,连续性的随机变量的分布用密度函数的积分来表示。称之为多维随机变量的联合分布律。
2、边缘分布:边缘分布类似于函数的偏导数,就是假设其中一维不变考察另一维随机变量的分布。如离散型随机变量的分布律是一个二维表(x为列,y为行),固定X为某个值,则Y的分布律就为表中的对应的X列,反之相同。就是一维的简单扩展,超过2维的离散型分布律怎么表示呢,可以用数据立方体来表示,假如还有(X,Y,Z),那固定其中一维的分布律就变成了表,还有没有四维空间的表示法呢?大家可以思考。
3、条件分布律:多维变量的条件分布律与一维的类似,形如P(X=xi|Y=yi)=P(X=xi,Y=yi)/P(Y=yi)。如果条件来自不同维度,求条件分布律如上式。需要知道联合分布律以及边缘分布律,同样转换到概率密度函数去以后关系依然存在。因为积分是线性操作。
4、相互独立的随机I变量:如果多维随机变量的联合分布等于边缘分布之积,则称为随机变量相互独立。(同样适用于概率密度函数)从定义出发我们知道,如果两个随机变量相互独立,那么讨论他们共同作用的时候,将他们分别作用的结果简单相乘就好了。这个和我们现实中的直觉是一直的。
5、多维随机变量的函数分布:这里要分成几个子主题:
5.1:当Z=X+Y时,就是系统的效果是两个随机变量线性和的情况下,Z的概率密度函数是X,Y的卷积。这个是不是很像信号与系统中描述,线性系统的响应是输入与系统冲击响应的卷积啊!世界是如此一致和一致呀。记住一个重要的结论,有限个相互独立的正态随机变量的线性组合仍然服从正态分布!!如果线性系统的影响因素是正态分布,我们看到最终的结果也将呈正态分布。那大家思考一下反过来是否成立呢?就是如果我得到的结果呈现正态分布,而且知道影响因素也是正态分布,那是不是可以得出系统是线性系统呢?哈哈哈,有点超纲了,简单做了一下拓展有兴趣的同学可以思考。
5.2 Z=Y/X的分布以及Z=XY的分布形式,也就是如果系统是非线性的,那么分布的结果是怎样的呢。(注意有个前提,假设这两个函数都是连续的,因为只有连续函数才能用概率密度来推导)写一个乘的吧,除的类似。f(z)=|x|f(x,xz)dx,前面有个积分符号,这里打不出来大家意念加上去就好了。如果X,Y是相互独立的则可以化为f(z)=|x|f(x)f(x)f(xz)dx,就是说上式中的f(x,xz)变成了f(x)f(xz),和独立性假设一致。数据证明有兴趣的同学可以去看看,真的佩服数学家很厉害!
5.3 M=max{X,Y}或N=min{X,Y}这种形式,假设X,Y相互独立。因为M,N均为不连续,所以无法直接用概率密度函数来计算,所以直接用定义推出Fmax(Z)=Fx(Z)Fy(Z),Fmin=1-[1-Fx(Z)][1-Fy(Z)]。这个可以举个应用的例子来理解,一个系统由两个元件组成,这两个元件寿命相互独立,那么系统的整体寿命将取决于元件的寿命,及其连接的结构。如果两个元件是串联的,那寿命模型Z=min(X,Y),如果两个系统是并联的那寿命模型Z=max(X,Y),如果采用了主备模式那系统的寿命Z=X+Y。是不是非常有用呢?相信有系统可靠性设计经验的朋友会有感觉的。
这个世界从机械论的角度看是具有确定性的,牛顿的世界观带我们进入了一个崭新的世界,但确定性世界中不确定现象闪烁着更为智慧的光芒。愿大家都能学好探索世界不确定的数据工具--概率论!(心血来潮有感)