推荐系统冷启动问题
- 如何在没有大量用户数据的情况下设计个性化推荐系统并且让用户对推荐结果满意从而愿意使用推荐系统,就是冷启动问题。
- 冷启动问题主要分为三类:
(1) 用户冷启动:如何给新用户做个性化推荐的问题,新用户刚使用网站的时候,系统并没有他的行为数据;
(2) 物品冷启动:解决如何将新的物品推荐给可能对它感兴趣的用户;
(3) 系统冷启动:如何在新开发网站设计个性化推荐系统,此时网站上用户很少,用户行为也少,只有一些商品的信息。 冷启动的主要解决方案:
(1) 提供非个性化推荐:如热门排行榜推荐,等到用户数据收集到一定程度时,切换到个性化推荐;
用户的注册信息分为3种:
1)人口统计学信息:年龄、性别、职业、民族、学历和居住地等;典型代表是Bruce Krulwich开发的Lifestyle Finder
2)用户兴趣的描述:有些网站要求用户填写;
3)从其他网站导入的用户站外行为数据。
有两个推荐系统数据集包含了人口统计学信息:BookCrossing数据集和Lastfm数据集。
利用的用户人口统计学特征越多,越能准确地预测用户兴趣。
(2) 利用用户注册信息:如性别,年龄,做粗粒度的个性化;
基于注册信息的个性化推荐流程:
1) 获取用户的注册信息;