在时间序列分析中,直接求特征矩阵的点积(或内积)是一种常见的方法,用于衡量两个向量(特征序列)之间的相关性。这里是详细的解释,为什么点积可以反映两个向量之间的相关性。
1. 点积的定义
两个向量 a = [ a 1 , a 2 , … , a n ] \mathbf{a} = [a_1, a_2, \ldots, a_n] a=[a1,a2,…,an]和 b = [ b 1 , b 2 , … , b n ] \mathbf{b} = [b_1, b_2, \ldots, b_n] b=[b1,b2,…,bn]的点积定义为:
a ⋅ b = ∑ i = 1 n a i b i \mathbf{a} \cdot \mathbf{b} = \sum_{i=1}^{n} a_i b_i a⋅b=∑i=1naibi
点积的结果是一个标量。
2. 点积反映相关性的原因
点积在数学上与两个向量的夹角和长度有关。具体来说:
2.1 点积的几何解释
点积可以表示为两个向量的长度(模)与它们之间夹角的余弦的乘积:
a ⋅ b = ∥ a ∥ ∥ b ∥ cos ( θ ) \mathbf{a} \cdot \mathbf{b} = \|\mathbf{a}\| \|\mathbf{b}\| \cos(\theta) a⋅b=∥a∥∥b∥cos(θ)
其中, ∥ a ∥ \|\mathbf{a}\| ∥a∥和 ∥ b ∥ \|\mathbf{b}\| ∥b∥分别是向量 a \mathbf{a} a和 b \mathbf{b} b的长度, θ \theta θ是它们之间的夹角。
- 当 a \mathbf{a} a和 b \mathbf{b} b完全正相关( θ = 0 \theta = 0 θ=0),即方向完全一致时, cos ( 0 ) = 1 \cos(0) = 1 cos(0)=1,点积为正数,且最大。
- 当 a \mathbf{a} a和 b \mathbf{b} b完全负相关( θ = π \theta = \pi θ=π),即方向完全相反时, cos ( π ) = − 1 \cos(\pi) = -1 cos(π)=−1,点积为负数,且最小。
- 当 a \mathbf{a} a和 b \mathbf{b} b不相关( θ = π / 2 \theta = \pi/2 θ=π/2),即互相垂直时, cos ( π / 2 ) = 0 \cos(\pi/2) = 0 cos(π/2)=0,点积为零。
因此,点积的值反映了两个向量在方向上的相似程度,即相关性。
2.2 点积与相关系数
为了得到标准化的相关性度量,我们可以使用余弦相似度,它是点积的归一化形式:
cos ( θ ) = a ⋅ b ∥ a ∥ ∥ b ∥ \cos(\theta) = \frac{\mathbf{a} \cdot \mathbf{b}}{\|\mathbf{a}\| \|\mathbf{b}\|} cos(θ)=∥a∥∥b∥a⋅b
余弦相似度的值介于 -1 和 1 之间,直接反映了两个向量之间的相关性,类似于皮尔逊相关系数。
3. 在时间序列中的应用
在时间序列分析中,点积常用于以下场景:
3.1 特征向量的相似性
假设有两个时间序列特征矩阵 A \mathbf{A} A和 B \mathbf{B} B,每行代表一个时间步的特征向量,通过求点积,可以判断这些时间步之间的相似性。
3.2 序列相似性度量
对于两个时间序列 x = [ x 1 , x 2 , … , x n ] \mathbf{x} = [x_1, x_2, \ldots, x_n] x=[x1,x2,…,xn]和 y = [ y 1 , y 2 , … , y n ] \mathbf{y} = [y_1, y_2, \ldots, y_n] y=[y1,y2,…,yn],可以通过点积 x ⋅ y \mathbf{x} \cdot \mathbf{y} x⋅y来衡量整体上的相似性。
具体示例
假设有两个时间序列特征向量:
-
a
=
[
1
,
2
,
3
]
\mathbf{a} = [1, 2, 3]
a=[1,2,3]
-
b
=
[
4
,
5
,
6
]
\mathbf{b} = [4, 5, 6]
b=[4,5,6]
它们的点积为:
a ⋅ b = ( 1 ⋅ 4 ) + ( 2 ⋅ 5 ) + ( 3 ⋅ 6 ) = 4 + 10 + 18 = 32 \mathbf{a} \cdot \mathbf{b} = (1 \cdot 4) + (2 \cdot 5) + (3 \cdot 6) = 4 + 10 + 18 = 32 a⋅b=(1⋅4)+(2⋅5)+(3⋅6)=4+10+18=32
这表示 a \mathbf{a} a和 b \mathbf{b} b在每个对应的维度上成正相关关系。如果将这两个向量标准化(使它们的长度为1),然后计算它们的点积,就可以得到它们的余弦相似度。
总结
点积可以反映两个向量之间的相关性,因为它将向量的每个对应元素相乘并求和,结果直接与向量之间的夹角余弦成比例。通过点积可以判断两个向量是正相关、负相关还是不相关,从而在时间序列分析中用于度量特征向量的相似性。