用户聚类
文章平均质量分 87
下一步
长期关注NLPMLCLinux等
展开
-
【每周一文】Googles News Personalization:Scalable Online Collaborative Filtering(2007)
概述最近因工作需要调研一下对大规模数据如何进行有效用户聚类,发现google之前论文做过相关事情。 该文从工程实现角度介绍了一种通用的在线推荐架构,可以适用于大规模数据和实时推荐。该文提到模型通过三种方式进行推荐1)MinHash 聚类2)PLSI 3)共现问题问题:根据用户对页面的点击历史进行个性化推荐。 和Netfix电影推荐的主要不同是 1)用户点击行为噪声比较多原创 2016-03-15 23:50:13 · 1479 阅读 · 1 评论 -
【每周一文】Clustering Users in Twitter Based on Interests(2012)
概述用户聚类在个性化推荐、市场分析等领域都很重要,特别是对千万级用户群体分析,单个用户的行为通常都是稀疏的。该文介绍了针对Twitter或者微博上的用户进行聚类,结果对于10亿级别的用户群可以聚合成400个类。 该文主要提到的思路是: 1. 根据用户阅读内容特征和社交特征,计算用户的相似度,可以用于相似度计算的特征包括推文信息、标签、关注信息以及转发特征。 2. 根据用户相似度,通过传统原创 2016-03-15 23:51:13 · 774 阅读 · 0 评论