论文阅读笔记:EHCF(异构协同过滤)
前言
文章题目:Efficient Heterogeneous Collaborative Filtering without Negative Sampling for Recommendation
这是一篇关于推荐系统训练方式设计的文章。
隐式反馈数据的学习方法:
1、非采样策略;将所有未标记的数据作为负样本
2、负采样策略:从未标记的数据中,抽取一部分作为负样本
一、解决的问题
1、提出了一种优化方法,解决了从整个数据中学习神经模型的难题,时间复杂度理想;
2、提出一个新的模型EHCF,以一种迁移的方式(transe)关联每个行为的预测,捕捉不同行为之间的复杂关系。
二、创新点
1、损失函数创新;
2、运用了自然语言处理中的Transe;
3、模型输入创新;
三、模型
1、模型特点
1、输入的是,用户、以及该用户的所有项目交互;
2、不进行采样,从整个数据中学习模型。
2、模型细节
第一层(embedding),user和item通过embedding层转化为稠密向量,输入的是,用户、以及该用户的所有项目交互;
第二层(share -layer),将第一步的embedding加入共享层,为了方便建模所有行为类型;
第三层(transfer-based prediction layer),不同行为的预测层h(k)应该相互关联;一共有k个行为,为每个行为学习一个预测层h(k)。
第四层(efficient multi-task learning),多任务学习。
公式梳理:
获取user-item的embedding:
采用预测层向量h来对共享层的embedding进行编码。用h(k)表示第k个行为的预测层,用户u对项目v执行行为k的可能性预测:
用知识表示中的迁移机制描述两种行为之间的关系,M是迁移矩阵:
第k个行为的预测层:
加权回归损失:
简化:
计算R(k)的平方:
最终损失函数:
多任务学习,计算最后的损失:
四、实验设计和结果
数据集:beibei,taobao,Movielens-1M
数据预处理:去重,不考虑购买交互少于五次的用户和商品
比较方法:分为两组,单一行为和异构数据;
评估指标:HR、NDGG
实验结果: