融合多种特征的推荐模型
相比协同过滤推荐模型,逻辑回归模型能够总和利用物品、用户、上下文等多种不同的特征,生成较为全面的推荐结果。因此能够进行多种特征融合的逻辑回归模型成了独立于协同过滤推荐模型发展的另一个方向。逻辑回归模型将推荐问题转换成了一个点击率(CTR)预估问题。
2.4.1基于逻辑回归模型的推荐流程
1,将用户年龄、性别、职业、物品属性、当前时间、当前地点等特征成数值型特征向量。
2,确定逻辑回归模型的优化目标,利用已有的样本数据对逻辑回归模型进行训练,确定逻辑回归的内部参数。
3,在模型服务阶段,将特征向量输入到逻辑回归模型,经过逻辑回归耐磨性的推断,得到用户‘’点击‘’物品的概率。
4,利用点击概率对所有候选物品进行排序,得到推荐列表。
基于逻辑回归的推荐过程的重点在于,利用样本的特征向量进行模型训练和在线推断。
2.4.2逻辑回归模型的数学形式
逻辑回归推断过程:
1,将特征向量x=(x1,x2,x3...,xn)作为模型的输入,
2,通过各种特征赋予相应的权重(w1,w2...wn+1),来表示个特征的重要性差异,将各个特征进行加权求和,得到xTw,
3,将xTw输入到sigmoid函数中,使之映射到0~1之间,得到最终的点击率。
对于逻辑回归模型来说,要确定的参数就是特征向量相应的权重向量w,下卖弄介绍逻辑回归模型的权重向量w的训练方法。
2.4.3逻辑回归模型训练方法
1,确定逻辑回归的目标函数,对于每一个输入样本x,预测结果为正样本和负样本的概率如下:
由极大似然估计原理,可写出逻辑回归目标函数
对目标函数进行简化,两边去log,并乘以系数(m-1),将求最大值转化成求最小值的问题,最终目标函数形式如下:
得到目标函数后对每个参数求偏导,得到梯度方向,对J(w)中的参数wj求偏导:
得到剃度之后,即可得到模型参数的更新公式:
至此完成逻辑回归更新推导。
2.4.4逻辑回归的优势和局限
优势:
1,数学含义上的支撑
2,可解释性强
3,工程化需要
局限:
表达能力不强,无法进行特征交叉、特征筛选等一系列高级操作,因此不可避免的造成信息损失。