推荐系统实战第六章 | 利用社交网络数据
1、获得社交网络数据的方式
1)电子邮件。电子邮箱的后缀,是都来自同一个组织、公司等。
2)用户注册信息。用户在哪家公司工作、学习过等。隐形的社交网络数据。
3)用户的位置数据。IP地址、GPS数据
4)论坛和讨论组。是否对同样的事情感兴趣。
5)即时聊天工具。
6)社交网络。社会图谱和兴趣图谱。
2、社交网络数据简介
社交网络数据类型
1)双向确认的社交网络数据。
2)单项关注的社交网络数据。
3)基于社区的社交网络数据。豆瓣小组、论文数据集、同一家公司工作、同一家学校毕业。
社交网络数据中的长尾分布
1)社交网络中影响力大的用户占少数
2)在一个社交网络中,关注很多人的用户占少数,绝大多数用户只关注很少的人。
3、基于社交网络的推荐
社会化推荐的优点
1)好友推荐可以增加推荐的信任度
2)社交网络可以解决冷启动问题。
3.1 基于邻域的社会化推荐算法
3.2 基于图的社会化推荐算法
对实体之间的联系,进行图形化的表示。对他们之间的关系,进行连线和权重分配。在利用基于图的推荐算法给用户推荐物品。
3.3 实际系统中的社会化推荐算法
基于邻域的社会化推荐算法需要反复的计算和拉去数据库,导致计算时间长,反应速度慢。
引用Twitter的架构,搬到社会化推荐系统中,实现方式如下: