[论文选读]Google News Personalization: Scalable Online Collaborative Filtering

这篇博文详细解读了Google News Personalization论文,探讨如何使用MinHash聚类、概率潜在语义索引(PLSI)和共同访问计数进行大规模在线协同过滤,以解决新闻推荐系统的挑战。通过线性模型结合不同算法的推荐结果。
摘要由CSDN通过智能技术生成

这次读一下新闻推荐领域比较经典的一篇文章:Google News Personalization: Scalable Online Collaborative Filtering,博文中会写一些我的笔记和补充知识。
Google新闻有以下两个特点:

  1. 数据量巨大;不论是用户,新闻在短短几天的时间里都是百万级别的;
  2. 新闻作为推荐的item更新速度是很快的。(新闻领域最突出的特点)

所以,鉴于已有的推荐算法并不能满足其需要,Google提出了这篇文章中的算法来solve自己的难题。
【核心想法】
collaborative filtering using MinHash clustering, Probabilistic La-tent Semantic Indexing (PLSI), and covisitation counts. We combine recommendations from different algorithms using a linear model.

【补充知识】
1. MiniHash
已知集合 X ,设Hash映射的函数是 H(X)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值