作者:18cyl
时间:2021-8-27
一、冷启动问题说明
在没有大量用户数据的情况下设计个性化推荐系统并且让用户对推荐结果满意从而愿意使用推荐系统就是冷启动问题。
主要有三种情况:
- 用户冷启动:解决如何给新用户做个性化推荐的问题。
- 物品冷启动:解决如何将新的物品推荐给可能对它感兴趣的用户。
- 系统冷启动:在一个新开发的网站上设计个性化推荐系统
常见的解决方案有:
- 提供非个性化推荐。主要是指热门排行榜
- 利用用户注册信息进行粗粒度的个性化推荐
- 利用用户的社交网络导入社交信息然后进行推荐
- 要求用户在登录时对一些物品进行反馈,手机用户对这些物品的兴趣信息,然后给用户推荐相似物品
- 对于新加入的物品,利用内容信息,推荐给喜欢过类似产品的用户
- 引入专家知识,快速建立起物品相关度表。
二、解决冷启动问题
利用用户注册信息
用户注册信息分为3种:
- 人口统计学信息
- 用户兴趣的描述
- 从其他网站导入的用户站外行为数据
基于注册信息的个性化推荐流程基本如下:
- 获取用户的注册信息
- 根据用户的注册信息对用户分类
- 给用户推荐他所属分类中用户喜欢的物品
选择合适的物品启动用户的兴趣
在新用户第一次访问推荐系统时,不立即向用户展示推荐结果,而是给用户提供一些物品,让用户反馈他们队这些物品的兴趣,然后根据用户反馈提供个性化推荐。
一般来说,能够用来启动用户兴趣的物品需要具有以下特点:
-
比较热门
-
具有代表性和区分性
-
启动物品集合需要有多样性
在根据物品对用户进行分类的过程类似于决策树分流。
利用物品的内容信息
物品的内容可以通过向量空间模型表示,该模型会将物品表示成一个关键词向量。从word2vec模型之后各种自然语言转向量的模型对于文本的分类、聚类、相似度计算给出令人满意的结果。
可以通过向量之间的余弦相似度计算物品的内容相似度。
而向量空间模型在语义内容数据丰富的情况下可以获得比较好的效果。
发挥专家的作用
很多系统都利用专家进行标注,从而得到一开始的物品相似度。这里可以采用半人工、半自动的方式。首先让专家标记一部分数据,然后让计算机去学习特征,然后计算机自动标记。