LSI中SVD的相关公式推导
SVD的公式为
(公式0)
其中,U、V为正交矩阵,即 , ,S为对角矩阵,即 。
利用矩阵计算法则,对上式进行分析得到
(公式1)
经过svdlibc的计算,即可得到 、 和 ,利用上述三个矩阵我们来进行相关的计算。
如果 为 ,则上式可理解为:
N: 文本对于特征的原始向量空间
V: 文本降维后的数据空间,V的每一行为一个文本降维后的结果
U、S: 为变换矩阵集合
示意图如:
图1 Term-Document示意图
则,Term-Term关系的公式可表示为
(公式2)
Docu-Docu关系的公式可表示为
(公式3)
假设任意一篇文本的原始向量为 ,经过变换后的向量为 ,则
(公式4)
从而得到原始向量 的结果变换公式
(公式5)