2.1.6 LS-PLM模型
大规模分段线性模型(Large Scale Piece-wise Linear Model, LS-PLM), 又称混合逻辑回归模型(Mixed Logic Regression, MLR)模型。该方法考虑到位于不同场景的数据会对某一特定场景下的CTR分类模型照成负面影响,为了解决这一问题,该方法先对样本使用聚类函数(无监督)进行预先多分类,再用用LR模型计算样本再分片中的CTR,最终进行加权求和。
f ( x ) = ∑ i = 1 n π i ( x ) ξ i ( x ) = ∑ i = 1 n e μ i x ∑ j = 1 m e μ j x 1 1 + e − w i x f(x)=\sum_{i=1}^{n}\pi_i(x)\xi_i(x)=\sum_{i=1}^{n}\frac{e^{\mu_ix}}{\sum_{j=1}^{m}e^{\mu_jx}}\frac{1}{1+e^{-w_ix}} f(x)=i=1∑nπi(x)ξi(x)=i=1∑n∑j=1meμjxeμix1+e−wix1
其中 π i ( ∗ ) \pi_i(*) πi(∗)表示聚类得出的 x x x属于某一类别的概率, n n n表示切片数(阿里巴巴给出的经验值为12)。
优点:有着端到端的非线性学习能力。在建模时引入了L1和L2范数,提高模型的泛化能力以及参数的稀疏性,使得模型的部署更加轻量级。