最近在调研域自适应学习的时候,接触到了分布假设,即源域与目标域的边缘分布和条件分布均不同。条件分布由于用得比较多,大家应该比较熟知;而边缘分布用的比较少,在这里记录下边缘分布的定义,备忘。
##边缘分布的定义
1、定义 1
设
F
(
x
,
y
)
F(x,y)
F(x,y)为二维随机变量
(
X
,
Y
)
(X,Y)
(X,Y) 的联合分布函数,
F
(
x
,
y
)
=
P
{
X
≤
x
,
Y
≤
y
}
F(x,y)=P\{X\leq x, Y\leq y\}
F(x,y)=P{X≤x,Y≤y},分别称
P
{
X
≤
x
}
=
P
{
X
≤
x
,
Y
<
∞
}
=
F
(
x
,
∞
)
≜
F
X
(
x
)
P\{X\leq x\} = P\{X\leq x, Y <\infty \} = F(x,\infty)\triangleq F_X(x)
P{X≤x}=P{X≤x,Y<∞}=F(x,∞)≜FX(x)
P
{
Y
≤
y
}
=
P
{
X
<
∞
,
Y
≤
y
}
=
F
(
∞
,
y
)
≜
F
Y
(
y
)
P\{Y\leq y\} = P\{X< \infty, Y \leq y\} = F(\infty,y)\triangleq F_Y(y)
P{Y≤y}=P{X<∞,Y≤y}=F(∞,y)≜FY(y)
为二维随机变量
(
X
,
Y
)
(X,Y)
(X,Y)关于
X
X
X和关于
Y
Y
Y的边缘分布函数。
2、定义 2
设二维离散型随机变量
(
X
,
Y
)
(X,Y)
(X,Y)的联合分布律为
P
{
X
=
x
i
,
Y
=
y
j
}
=
p
i
j
,
i
,
j
=
1
,
2
,
⋯
P\{X=x_i,Y=y_j\}=p_{ij}, i,j=1,2,\cdots
P{X=xi,Y=yj}=pij,i,j=1,2,⋯
记
p
i
⋅
=
∑
j
=
1
∞
p
i
j
=
P
{
X
=
x
i
}
,
i
=
1
,
2
,
⋯
p_{i\cdot}=\sum_{j=1}^\infty p_{ij}=P\{X=x_i\}, i=1,2,\cdots
pi⋅=∑j=1∞pij=P{X=xi},i=1,2,⋯
p
⋅
j
=
∑
i
=
1
∞
p
i
j
=
P
{
Y
=
y
j
}
,
j
=
1
,
2
,
⋯
p_{\cdot j}=\sum_{i=1}^\infty p_{ij}=P\{Y=y_j\}, j=1,2,\cdots
p⋅j=∑i=1∞pij=P{Y=yj},j=1,2,⋯
分别称
p
i
⋅
(
i
=
1
,
2
,
⋯
)
p_{i\cdot}(i=1,2,\cdots)
pi⋅(i=1,2,⋯) 和
p
⋅
j
(
j
=
1
,
2
,
⋯
)
p_{\cdot j}(j=1,2,\cdots)
p⋅j(j=1,2,⋯)为二维离散型随机变量
(
X
,
Y
)
(X,Y)
(X,Y)关于X和关于Y的边缘分布律。
3、几何意义
这里选择定义1进行解释:由定义1,二维随机变量
(
X
,
Y
)
(X,Y)
(X,Y)可视为平面上的随机点(为方便,随机点与随机变量可视为等同),二维随机变量
(
X
,
Y
)
(X,Y)
(X,Y)的(联合)分布函数
F
(
X
,
Y
)
=
P
{
X
≤
x
,
Y
≤
y
}
F(X,Y)=P\{X\leq x, Y\leq y\}
F(X,Y)=P{X≤x,Y≤y}的几何意义显然是随机点
(
X
,
Y
)
(X,Y)
(X,Y)落在平面区域
{
(
x
,
y
)
∣
X
≤
x
,
Y
≤
y
}
\{(x,y)|X\leq x, Y\leq y\}
{(x,y)∣X≤x,Y≤y}内发生的概率,见图1。
二维随机变量
(
X
,
Y
)
(X,Y)
(X,Y)关于
X
X
X的边缘分布函数
F
X
(
x
)
F_X(x)
FX(x)表示平面上的随机点
(
X
,
Y
)
(X,Y)
(X,Y)落在平面直线
X
=
x
X=x
X=x 左边平面区域内(含直线)
{
(
x
,
y
)
∣
X
≤
x
,
Y
<
∞
}
\{(x,y)|X\leq x, Y<\infty\}
{(x,y)∣X≤x,Y<∞}发生的概率,见图2。
(
X
,
Y
)
(X,Y)
(X,Y)关于
Y
Y
Y的边缘分布函数
F
Y
(
y
)
F_Y(y)
FY(y)表示平面上的随机
(
X
,
Y
)
(X,Y)
(X,Y)落在直线
Y
=
y
Y=y
Y=y下边平面区域内(含直线)
{
(
x
,
y
)
∣
X
<
∞
,
Y
≤
y
}
\{(x,y)| X<\infty,Y\leq y\}
{(x,y)∣X<∞,Y≤y}发生的的概率,见图3。