FM原理---为什么二次交叉项系数矩阵可以分解

该博客探讨了Factorization Machine (FM) 模型中如何通过Cholesky分解优化二阶特征组合的时间复杂度。作者指出,由于特征间的相关性使得二次交叉项的系数矩阵W对称,进一步证明其为正定矩阵,从而应用Cholesky分解。正定性的证明基于二次型的性质,即对于所有非零向量x,xTWx总大于0。这为FM模型的高效实现提供了理论基础。
摘要由CSDN通过智能技术生成

从FM的原始数学公式看
在这里插入图片描述
在进行二阶特征组合的时候,假设有n个不同的特征,那么二阶特征组合意味着任意两个特征都要进行交叉组合,时间复杂度直接为O(n*n),因此很自然需要降低时间复杂度,作者的方法是将系数矩阵分解(Cholesky分解)。那么为什么可以进行这样的一个分解?

在矩阵分析这门课中有这样一个定理
在这里插入图片描述
上面这个定理就是Cholesky分解。

那么现在的问题就是怎么证明公式中的二次交叉项系数矩阵是对称正定矩阵。显而易见的是系数矩阵W是对称的,只需要证明W是正定的即可。

可以把公式的二次交叉项部分写成二次型的矩阵形式即
f = xTWx
(T表示转置,不会用csdn的公式编辑器,手动狗头)

正定二次型的有这样的一个定义:
设有二次型f=xTWx(WT=W), 如果对于任何不为0的x都有f>0(显然x=0时f=0),则称f为正定二次型,并称对称矩阵W是正定的。

根据FM论文作者的描述,假设特征之间存在相关的联系,换而言之,二次交叉项对于目标来说是有正向增益的,因此可以认为xTWx>0,从而系数矩阵是对称正定矩阵。故根据定理可知系数矩阵能进行乔累斯基分解。

===============
更深入一步,为什么乔累斯基分解是成立的,要证明乔累斯基分解是成立的就需要用到另外一个定理
在这里插入图片描述
感兴趣的同学可以去看看矩阵分析这本书。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值