零、特征交叉
- LR
一阶特征交叉,简单方便 - POLY2模型
对于特征xi(i=1,2,…,n),二阶组合特征一共有n的平方个,每个二阶组合特征给与一个权重来学习,参数量一种n的平方 - FM
推荐的特征非常多,因此POLY2的n平方的参数巨大,FM减少了参数量。方法是给每个特征一个k维的可学习向量,然后用两个特征的向量的内积作为权重。这样可以把参数量从n的平方降低到nk - FFM
在FM的基础上引入了特征域的概念,比如有三类特征:性别(男,女),学历(大学,高中,其他), 职业(码农、非码农),按照FM每个特征就有一个k维向量,那么应该有(2+3+2)*k=7k的参数量。FFM引入了特征域,也就是特征【男】跟特征【女】、【大学】、【码农】三个特征交叉的时候用的是不同的三个k维向量,总参数量变成了7kn(其中n是特征的类别数) - Wide & Deep
wide部分是高阶特征,记忆能力好,deep部分泛化能力好,最后两者用LR结合起来得到一个分数
- DeepFM
Wide&Deep的wide部分没有特征交叉的能力,DeepFM将Wide&Deep的Wide部门换成了FM,提升了特征交叉能力。