本文主要思想来自
https://www.cnblogs.com/dan-baishucaizi/p/10096316.html
假设
a
\bf a
a、
b
\bf b
b 两个 0 1 向量
a
=
(
x
1
,
x
2
,
⋯
,
x
n
)
,
其
中
x
i
∈
{
0
,
1
}
b
=
(
y
1
,
y
2
,
⋯
,
y
n
)
,
其
中
y
i
∈
{
0
,
1
}
\begin{aligned} \bf{a} =& \ (x_1, x_2, \cdots, x_n), 其中 x_i \in \lbrace 0, 1 \rbrace \\ \bf{b} =& \ (y_1, y_2, \cdots, y_n), 其中 y_i \in \lbrace 0, 1 \rbrace \end{aligned}
a=b= (x1,x2,⋯,xn),其中xi∈{0,1} (y1,y2,⋯,yn),其中yi∈{0,1}
假设各个
x
i
x_i
xi 和
y
i
y_i
yi 相互独立,且
P
(
x
i
=
=
0
)
=
P
(
x
i
=
=
1
)
=
P
(
y
i
=
=
0
)
=
P
(
y
i
=
=
1
)
=
1
/
2
\begin{aligned} & P(x_i == 0) \\ = & P(x_i == 1) \\ =& P(y_i == 0) \\ =& P(y_i == 1) \\ =& 1/2 \end{aligned}
====P(xi==0)P(xi==1)P(yi==0)P(yi==1)1/2我们定义
I
=
=
∑
i
=
1
n
I
(
x
i
=
=
y
i
)
I
≠
=
∑
i
=
1
n
I
(
x
i
≠
y
i
)
I_= = \sum_{i=1}^n I(x_i == y_i) \\[2ex] I_{\neq} = \sum_{i=1}^n I(x_i \neq y_i)
I==i=1∑nI(xi==yi)I==i=1∑nI(xi=yi)
I
I
I 为示性函数,输入为真时取1,输入为假时取 0 . 我们可以定义一个函数,使得当
I
=
=
=
n
I_===n
I===n 时,
a
\bf a
a 和
b
\bf b
b 正相关,相关系数为 1;当
I
=
=
=
0
I_===0
I===0 时,
a
\bf a
a 和
b
\bf b
b 负相关,相关系数为 -1;当
I
=
=
=
I
≠
=
=
n
/
2
I_= == I_{\neq} == n/2
I===I===n/2 时,即
a
\bf a
a 和
b
\bf b
b 中各有一半的元素相等,一半的元素不相等,
a
\bf a
a 和
b
\bf b
b 不相关,相关系数为 0. 现在说明一下为什么
I
=
=
=
n
/
2
I_= ==n/2
I===n/2 时
a
\bf a
a 和
b
\bf b
b 不相关:
x
i
x_i
xi 和
y
i
y_i
yi 只可能有如下四种情形
A
:
x
i
=
=
0
且
y
i
=
=
0
B
:
x
i
=
=
1
且
y
i
=
=
0
C
:
x
i
=
=
0
且
y
i
=
=
1
D
:
x
i
=
=
1
且
y
i
=
=
1
A: x_i == 0 \ 且 \ y_i == 0 \\ B: x_i == 1 \ 且 \ y_i == 0 \\ C: x_i == 0 \ 且 \ y_i == 1 \\ D: x_i == 1 \ 且 \ y_i == 1 \\
A:xi==0 且 yi==0B:xi==1 且 yi==0C:xi==0 且 yi==1D:xi==1 且 yi==1当
a
\bf a
a 和
b
\bf b
b 完全不相关时,也即我们从
a
\bf a
a 的值中无法得到任何与
b
\bf b
b 有关的信息,必然有
A
、
B
、
C
、
D
A、B、C、D
A、B、C、D 四种事件等概率出现,即
P
(
A
)
=
P
(
B
)
=
P
(
C
)
=
P
(
D
)
=
1
4
P(A) = P(B) = P(C) = P(D) = \frac{1}{4}
P(A)=P(B)=P(C)=P(D)=41
A
、
D
A、D
A、D 代表
I
(
x
i
=
=
y
i
)
=
=
1
I(x_i == y_i)==1
I(xi==yi)==1 的情形,
B
、
C
B、C
B、C 代表
I
(
x
i
=
=
y
i
)
=
=
0
I(x_i == y_i)==0
I(xi==yi)==0 的情形,由此即可推出
I
=
=
=
n
/
2
I_= ==n/2
I===n/2 . 所以定义函数
f
(
a
,
b
)
=
(
−
1
)
I
(
I
≠
>
n
2
)
(
1
−
4
×
I
=
×
I
≠
n
2
)
f(\bf a, \bf b) = (-1)^{I(I_{\neq} > \frac{n}{2})}(1 - \frac{4 \times I_= \times I_{\neq}}{n^2})
f(a,b)=(−1)I(I=>2n)(1−n24×I=×I=)