《推荐系统实践》第六章利用社交网络数据

最新推荐文章于 2021-10-20 15:38:41 发布

LiuQQu

最新推荐文章于 2021-10-20 15:38:41 发布

阅读量1.2k

点赞数

分类专栏：推荐系统文章标签：推荐系统

本文链接：https://blog.csdn.net/LiuQQu/article/details/84255812

版权

本文介绍了如何获取社交网络数据，包括电子邮件、用户注册信息、位置数据、论坛、即时聊天工具和社交网站，并探讨了社交网络数据在推荐系统中的应用。基于邻域和社会化推荐算法利用用户的好友关系进行推荐，而基于图的推荐算法结合了用户行为和社交网络图。文章还提到了信息流推荐，如Facebook的EdgeRank，以及好友推荐算法，包括基于内容匹配、共同兴趣和社交网络图的好友推荐。最后，讨论了不同推荐算法的优缺点和实证研究结果。

摘要由CSDN通过智能技术生成

6.1 获取社交网络数据的途径

6.1.1 电子邮件

我们可以通过分析用户的联系人列表了解用户的好友信息，而且可以进一步通过研究两个用户之间的邮件往来频繁程度度量两个用户的熟悉程度。

如果我们获得了用户的邮箱，也可以通过邮箱后缀得到一定的社交关系信息。很多社交网站都在用户注册时提供了让用户从电子邮件联系人中导入好友关系的功能，用以解决社交网络的冷启动问题。

6.1.2 用户注册信息

有些网站需要用户在注册时填写一些诸如公司、学校等信息。这也是一种隐性的社交网络数据。

6.1.3 用户的位置数据

在网页上最容易拿到的用户位置信息就是IP地址。对于手机等移动设备，我们可以拿到更详细的GPS数据。位置信息也是一种反映用户社交关系的数据。

6.1.4 论坛和讨论组

如果两个用户同时加入了很多不同的小组，我们可以认为这两个用户很可能互相了解或者具有相似的兴趣。如果两个用户在讨论组中曾经就某一个帖子共同进行过讨论，那就更加说明他们之间的熟悉程度或兴趣相似度很高。

6.1.5 即时聊天工具

和电子邮件系统一样，用户在即时聊天工具上也会有一个联系人列表，而且往往还会给联系人进行分组。通过这个列表和分组信息，我们就可以知道用户的社交网络关系，而通过统计用户之间聊天的频繁程度，可以度量出用户之间的熟悉程度。

6.1.6 社交网站

个性化推荐系统可以利用社交网站公开的用户社交网络和行为数据，辅助用户更好地完成信息过滤的任务，更好地找到和自己兴趣相似的好友，更快地找到自己感兴趣的内容。

1. 社会图谱和兴趣图谱

Facebook和Twitter作为社交网站中的两个代表，它们其实代表了不同的社交网络结构。在Facebook里，人们的好友一般都是自己在现实社会中认识的人，而且Facebook中的好友关系是需要双方确认的。在Twitter里，人们的好友往往都是现实中自己不认识的，而只是出于对对方言论的兴趣而建立好友关系，好友关系也是单向的关注关系。以Facebook为代表的社交网络称为社交图谱（social graph），而以Twitter为代表的社交网络称为兴趣图谱（interest graph）。

但是，每个社会化网站都不是单纯的社交图谱或者兴趣图谱。

6.2 社交网络数据简介

社交网络定义了用户之间的联系，因此可以用图定义社交网络。我们用图G(V,E,w)定义一个社交网络，其中V是顶点集合，每个顶点代表一个用户，E是边集合，如果用户 v_a 和 v_b 有社交网络关系，那么就有一条边 e(v_a,v_b) 连接这两个用户，而 w(v_a,v_b) 定义了边的权重。业界有两种著名的社交网络。一种以Facebook为代表，它的朋友关系是需要双向确认的，因此在这种社交网络上可以用无向边连接有社交网络关系的用户。另一种以Twitter为代表，它的朋友关系是单向的，因此可以用有向边代表这种社交网络上的用户关系。