文章介绍
本文是发布在C类期刊的论文,是社区发现和推荐算法的交叉结合。在介绍本文之前先要对推荐系统做简要了解,参考大佬写的总结推荐系统从入门到接着入门。
推荐系统的分类:
其中协同过滤的方法比较多,也比较常见。
协同过滤的假设是:为特定用户找到他真正感兴趣的内容的好方法是首先找到与此用户有相似兴趣的其他用户,然后将他们感兴趣的内容推荐给此用户。
此处可与社区发现结合,找出社交网络中兴趣相似的用户组成的社区,为社区内的用户推送他们该兴趣的内容。
文章内容
1.用户模型构建
使用四个方面构建用户模型,分别是用户标签,用户感兴趣的区域,用户的追随者的年龄和教育信息。
基于上述四个方面,我们使用余弦距离和Word2Vec得到了相似性。
2.局部社区发现
使用改良版的K-means进行社区发现。社区内出现明显差异时,社区尽可能的小产生的效果会比较好。
用户建模之后将用户表示为向量,通过用户向量计算出用户间的相似度作为距离进行划分社区。
3.微博排序
用户社区内的人发布的微博将会被推荐,使用排序函数进行排序找出Top-n,推送其中一条。、
实验过程:
- 数据收集与预处理
- 用户建模,将用户转化为向量表示。
- 通过SPSS找出合适的聚类中心数K。
- 使用改进版K-means获取社区结构,
- 通过排序函数找到Top-n条微博进行推送。
- 与经典的推荐算法在满意度和MAE上进行对比。
总结
这篇论文是笔者看的第一篇推荐系统的论文,这是协同过滤的方法进行推荐,先对用户进行建模计算出相似度作为距离,进行聚类,得到相似社区。然后对社区内用户的微博进行排序并推荐。
未来的研究:
1.考虑用户建模中的其他因素,如用户的影响、可信度,区分意见领袖和普通用户;
2.其他微博文本向量化的方法,并使用集成方法,如基于上下文的推荐算法。
3.采用集成方法解决了推荐系统的冷启动问题。
4.研究了大数据环境中推荐系统的效率。