4. 逻辑回归
协同过滤:只有用户和物品之间的评价信息——改进:LR融合多种特征
4.1 LR流程
将各种先验信息(用户信息,物品信息,环境信息)用数字型特征向量表述
确定LR模型的优化目标——点击率
训练 LR,测试评估:特征信息——LR模型——用户对物品的点击率
输入所有物品得到预测的点击概率,排序得到推荐列表
4.2 算法细节
【机器学习】逻辑回归(非常详细) - 知乎 (zhihu.com) 这个很详细
LR:假设数据服从Logistic分布,然后使用极大似然估计做参数的估计
LR通过特征向量加权组合拟合决策边界(单层感知机)——再找边界面和P(Y=1/x)的关系sigmoid
特征向量加权组合后经过sigmoid非线性激活后转化为[0,1]的点击率
取整个数据集上的平均对数似然损失作为损失函数:
训练:梯度下降,牛顿,拟牛顿。梯度更新的公式见书,自己推一遍👍
4.3 LR分析
优势 | 数学含义支撑,可解释性强,工程化的需要 |
局限 | 无法进行特征交叉,特征筛选等进一步操作 |