二元随机变量

本章记录
 1二元随机变量的定义
 2二元离散型随机变量的定义、联合概率分布律、边际分布律、条件分布律
 3二元离散型随机变量联合概率分布律函数、边际分布函数、条件分布函数
 4二元连续型随机变量的定义、联合概率密度函数、边际密度函数、条件密度函数
二元随机变量
 举例:研究入学儿童的发育情况。从一个样本(儿童)的身高、体重,两个维度研究。这用面向对象的编程角度理解类似于一个实体,有两个属性。
 再个栗子:研究炮弹着点位置。每个样本(位置)由横坐标、纵坐标确定。
 这两个例子中每个样本的两个维度不是固定不变的,而是随机变化的。入学儿童的年龄在样本空间中就几乎不变(在我们国家入学年龄7岁),入学年龄就不是随机变量。
 定义:设E是一个随机试验,样本空间S={e},设X=X{e},Y=Y(e)是定义在S上的随机变量,由它们构成的向量(X,Y)称为二元随机变量,也称二维随机变量。

二元离散型随机变量
 定义:若二元随机变量(X,Y)全部可能取到不同的值是有限对,或者可列无数对,则称(X,Y)是二元离散型随机变量。
 
二元离散型随机变量的概率分布律
 定义:若(X,Y)所有可能取值为 (xi,yj) P(X=xi,Y=yj)=pij,i,j=1,2,3... 为二元离散型随机变量(X,Y)的联合概率分布律。也可简称(X,Y)的分布律。
 性质
 1 pij0
 2 i=1j=1pij=1
 3 P((X,Y)D)=xi,yjDpij ,其中 pij=P(X=xi,Y=yj)i,j=1,2,3...
 举例
 

二元离散型随机变量的边际分布律
 定义:离散型随机变量(X,Y)的边际分布律为 P(X=xi)=j=1p(xi,yj) ,记为 pi. P(Y=yj)=i=1p(xi,yj) ,记为 p.j
 

二元离散型随机变量的条件分布律
 定义:(X,Y)是二元离散型随机变量,对于固定的 yj ,如果 P(Y=yj)>0 (Y的边际分布律>0),则称 P(X=xi|Y=yj)=P(X=xi,Y=yj)P(Y=yj)=pijp.j i=i,2,3... ,为在 Y=yj 条件下,随机变量X的条件分布律。
 同样的,对于固定的 xi ,如果 P(X=xi)>0 ,则称 P(Y=yj|X=xi)=P(X=xi,Y=yj)P(X=xi)=pijpi. j=i,2,3... ,为在 X=xi 条件下,随机变量Y的条件分布律。
 例子
 
 
 
 
 
二元随机变量的联合分布函数
 定义:若(X,Y)是二元随机变量,对于任意的实数x,y二元函数 F(x,y)=P(Xx,Yy) ,称为二元随机变量(X,Y)的联合分布函数。
 二元离散型随机变量的联合分布函数: F(x,y)=P(Xx,Yy)=xix,yjyP(X=xi,Y=yj)
 性质:
 1 F(x,y)关于x,y单调不递减。
 2 0F(x,y)1 F(,+)=1
 3 F(x,y)关于x,y右连续,即 limε0+F(x+ε,y)=F(x,y) limε0+F(x,y+ε)=F(x,y)
 4 如果 x1<x<x2y1<y<y2 则有
  P(x1<Xx2,y1<Yy2)=F(x2,y2)F(x2,y1)F(x1,y2)+F(x1,y1)
 这里写图片描述

二元随机变量的边际分布函数
 定义:二元随机变量(X,Y)关于X的边际分布函数记为 FX(x) ,关于Y的边际分布函数记为 FY(y)
  FX(x)=P(Xx)=P(Xx,Y<+)=F(x,+)=limy+F(x,y)
  FY(y)=P(Yy)=P(X<+,Yy,)=F(+,y)=limx+F(x,y)

二元随机变量的条件分布函数
 定义:如果 P(Y=y)>0 ,则在Y=y条件下,X的条件分布函数为 FX|Y(x|y)=P(Xx|Y=y)=P(Xx,Y=y)P(Y=y) ,如果(X,Y)是离散型随机变量,则 P(Y=y)>0
 如果(X,Y)是连续型随机变量,P(Y=y)=0,但是 ε>0,P(y<Y<y+ε)>0 ,则在Y=y 条件下X的条件分布函数定义为 FX|Y(x|y)=limε0+P(Xx|y<Y<y+ε)

二元连续型随机变量
 定义:对于二元随机变量(X,Y)的分布函数F(x,y),如果存在非负函数f(x,y),使得对于任意x,y 有 F(x,y)=xyf(u,v)dudv ,称(X,Y)为二元连续型随机变量,称f(x,y)为二元随机变量(X,Y)的联合概率密度函数
 
二元连续型随机变量联合概率密度函数
 性质
 1 f(x,y)>=0
 2 ++f(x,y)dxdy=1 ,在几何上z=f(x,y)表示空间的一个顶曲面,介于它和x0y平面的空间体积为1。
 3 概率和。设D是xoy平面上的区域,点(X,Y)落在D内的概率为 P((X,Y)D)=Df(x,y)dxdy P((X,Y)D) 等于以D为底,曲面f(x,y)为顶面的柱体体积。
 4 在f(x,y)的连续点(x,y),有F(x,y)的二阶导=f(x,y)
 二元连续型随机变量的概率密度函数与分布函数之间就是积分与求导的关系了。

二元连续型随机变量边际概率密度函数
 定义:对于连续型随机变量(X,Y),概率密度函数为f(x,y),X,Y的边际概率密度函数为:
  fX(x)=+f(x,y)dy
  fY(y)=+f(x,y)dx
 要注意 对x积分的时候,y是不变的,x的边界是:要找到 x自己的边界以及与y的关系边界的交集。对y积分的时候也一样。
二元连续型随机变量条件概率密度函数
 定义:设二元随机变量(X,Y)的概率密度为f(x,y),(X,Y)关于Y的边际概率密度函数 fY(y) ,若对于固定的y, fY(y)>0 fY(y) 是连续的,则在Y=y的条件下,X的条件概率密度为: fX|Y(x|y)=f(x,y)fY(y)
 同理,若对于固定的X=x,且 fX(x) 连续的,在X=x的条件下,Y的条件概率密度为 fY|X(y|x)=f(x,y)fX(x)
 这里写图片描述
 
二元均匀分布
 定义:如果二元随机变量(X,Y)的概率密度函数在平面上的一个有界区域D内是常数,而在其他地方取值为0,则称(X,Y)在D上服从均匀分布。
  f(x,y)=1A,(x,y)D0,other
 A=D,也就是说在D上,f(x,y)=1/面积。
 二元均匀分布的条件分布仍然是均匀分布。
二元正态分布
这里写图片描述
 二元正态分布的两个边际分布函数都是一元正态分布,并且与 ρ 没有关系。在X=x的条件下,Y的条件分布也是正态分布。
 这里写图片描述

如果您的U是二元偏导数形式,可以通过将其转换为二元随机变量数据形式来满足copulafit函数的使用规则。具体步骤如下: 1. 将二元偏导数转换为二元累积分布函数(CDF)形式,即 $u_{ij}=F_{X_i,X_j}(x_i,x_j)$。 2. 将二元累积分布函数转换为二元随机变量数据形式,即将 $u_{ij}$ 乘以样本总量 $n$ 来得到一个整数 $m_{ij}$,然后按照 $m_{ij}$ 在 $(0,1)$ 区间均匀分布的方式随机生成一组二元随机变量 $(x_i,x_j)$。 3. 将生成的二元随机变量数据作为参数传递给copulafit函数进行参数估计。 下面是MATLAB代码示例: ```matlab % 假设您已经将二元偏导数形式的U存储在一个名为U的数组中 % 将二元偏导数转换为二元累积分布函数形式 u = U; % 将U赋值给u变量,方便后续操作 n = size(u,1); % 样本总量 for i = 1:n for j = 1:n u(i,j) = copulacdf('Gumbel', [u(i,j), u(i,j)], [1,1]); % Gumbel copula函数 end end % 将二元累积分布函数转换为二元随机变量数据形式 m = round(u * n); % 将u乘以n并四舍五入得到整数m X = zeros(n,2); % 存储生成的二元随机变量数据 for i = 1:n for j = 1:m(i,2) X(end+1,:) = [i, j]; % 在i处生成j个随机变量 end end % 使用copulafit函数进行参数估计 theta = copulafit('Gumbel', X); ``` 除了将二元偏导数转换为二元随机变量数据的方法外,还可以使用数值积分或其他数值优化算法来求解二元Gumbel copula函数的参数。但是这些方法比较复杂,需要一定的数学和编程技能。如果您对这些方法有兴趣,可以参考相关的数学和计算机科学文献。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值