现在空间有两个向量
X
=
[
a
1
a
2
]
Y
=
[
b
1
b
2
]
X=[a_1\quad a_2]\quad Y=[b_1\quad b_2]
X=[a1a2]Y=[b1b2]
点积和内积是一致的,点积是和投影相关的。
X
点
乘
Y
=
∣
∣
X
∣
∣
2
∣
∣
Y
∣
∣
2
c
o
s
θ
=
a
1
b
1
+
a
2
b
2
X点乘Y=||X||_2||Y||_2cos\theta=a_1b_1+a_2b_2
X点乘Y=∣∣X∣∣2∣∣Y∣∣2cosθ=a1b1+a2b2
向量
X
X
X在向量
Y
Y
Y上的投影是
X
点
乘
Y
∣
∣
Y
∣
∣
2
\dfrac{X点乘Y}{||Y||_2}
∣∣Y∣∣2X点乘Y
协方差和相关系数是用来做相关分析的:
现在有两个属性
X
X
X和
Y
Y
Y,当
X
X
X取值
a
1
a_1
a1的时候,
Y
Y
Y取值
b
1
b_1
b1,当
X
X
X取值
a
2
a_2
a2的时候,
Y
Y
Y取值
b
2
b_2
b2。分析属性
X
X
X和属性
Y
Y
Y的相关性。
协方差:
C
O
V
(
X
,
Y
)
=
E
[
(
a
−
a
‾
)
(
b
−
b
‾
)
]
COV(X,Y)=E[(a-\overline{a})(b-\overline{b})]
COV(X,Y)=E[(a−a)(b−b)]
皮尔逊相关系数就是:
ρ
X
,
Y
=
C
O
V
(
X
,
Y
)
σ
X
σ
Y
\rho_{X,Y}=\dfrac{COV(X,Y)}{\sigma_X \sigma_Y}
ρX,Y=σXσYCOV(X,Y)
σ
X
σ
Y
\sigma_X \sigma_Y
σXσY分别是
X
X
X和
Y
Y
Y的方差。
当
a
‾
\overline{a}
a和
b
‾
\overline{b}
b都等于0并且
X
X
X取值
a
1
a_1
a1与
X
X
X取值
a
2
a_2
a2的概率相同时:
C
O
V
(
X
,
Y
)
=
X
点
乘
Y
=
a
1
b
1
+
a
2
b
2
=
∣
∣
X
∣
∣
2
∣
∣
Y
∣
∣
2
c
o
s
θ
COV(X,Y)=X点乘Y=a_1b_1+a_2b_2=||X||_2||Y||_2cos\theta
COV(X,Y)=X点乘Y=a1b1+a2b2=∣∣X∣∣2∣∣Y∣∣2cosθ
其他情况下,协方差与点积是没有什么关系的。
协方差的物理意义理解并不是向量的投影。而是通过点
a
,
b
a,b
a,b与均值点
m
e
a
n
mean
mean所形成的矩形面积之和:
点
a
=
[
a
1
b
1
]
表
示
a=[a_1\quad b_1]表示
a=[a1b1]表示当
X
X
X取值
a
1
a_1
a1的时候,
Y
Y
Y取值
b
1
b_1
b1
点
b
=
[
a
2
b
2
]
表
示
b=[a_2\quad b_2]表示
b=[a2b2]表示当
X
X
X取值
a
2
a_2
a2的时候,
Y
Y
Y取值
b
2
b_2
b2
点
m
e
a
n
=
[
a
‾
b
‾
]
mean=[\overline{a}\quad \overline{b}]
mean=[ab]表示
X
X
X的均值为
a
‾
\overline{a}
a,
Y
Y
Y的均值为
b
‾
\overline{b}
b
如下图:
中间的点就是均值点
m
e
a
n
mean
mean
一象限的1号点:当
a
1
>
a
‾
a_1>\overline{a}
a1>a时,
b
1
>
b
‾
b_1>\overline{b}
b1>b,所以矩阵面积
a
1
b
1
a_1b_1
a1b1是正的。
二象限的2号点:当
a
2
<
a
‾
a_2<\overline{a}
a2<a时,
b
2
>
b
‾
b_2>\overline{b}
b2>b,所以矩阵面积
a
2
b
2
a_2b_2
a2b2是负的。
三象限的3号点:当
a
3
<
a
‾
a_3<\overline{a}
a3<a时,
b
3
<
b
‾
b_3<\overline{b}
b3<b,所以矩阵面积
a
3
b
3
a_3b_3
a3b3是正的。
四象限的4号点:当
a
4
>
a
‾
a_4>\overline{a}
a4>a时,
b
4
<
b
‾
b_4<\overline{b}
b4<b,所以矩阵面积
a
4
b
4
a_4b_4
a4b4是负的。
将所有矩形的面积加起来,如果是正的就是正相关,如果是负的就是负相关。
这个思想是来自于这篇文章,更详细的解释也可参见这篇文章
https://www.matongxue.com/madocs/568.html
点积、内积、协方差与皮尔逊相关系数
最新推荐文章于 2024-06-21 19:06:51 发布