基于LDA的论文推荐模型-CTR(Collaborative modeling for recommendation)
论文-Collaborative Topic Modeling for Recommending Scientific Articles
PPT-Collaborative Topic Modeling for Recommending Scientific Articles
概述
本问采用的数据集是来自一个引用论文的网站,主要是为科学工作者提供论文的推荐。
本文采用了LDA+PMF的-modelP
论文中包含两种推荐:
- In-matrix prediciton --recommend old articles (already rated, easy)
- out-matrix prediction–recommend new articles(not rated before, not that easy)
本文模型
由于MF在latent space中学习的k维的特征是不具有可解释性的,而且只考虑评分矩阵,是不能完全考虑到那些从未被评分的items的,这对model的冷启动具有一定的局限性。其实这里MF的k个维度,与LDA的k个主题是对应的。本文的LDA主题模型还是词袋模型,没有考虑单词的顺序,所以有了而后来的一系列改进
Topic modeling(主题模型)这里采用LDA
主题模型的学习可以参考通俗理解LDA主题模型,和LDA基础这两篇博文。
主要算法:
图模型为:
预测:
评价指标
其实引文网络构成的矩阵也是只有0和1,其实也是隐反馈:
创新点
其实本文最大的创新点就是把LDA的主题与PMF的latent space对应起来。这样具有了可解释性。
代码
待更新!!!