推荐系统算法介绍(二)——基于人口统计学的推荐算法
1.1基于人口统计学的推荐算法简介
我们拿到的是用户的一些基本信息,或者根据用户的上下文信息得到用户的标签,这些标签就属于用户的特征,根据用户的特征可以找到跟用户相似的用户。相似的用户具有相似的爱好,所以把物品推荐给用户。
最重要的信息就是用户的基本信息,如年龄,性别。
没有用户基本信息,还可以收集没有明确含义的用户信息,如用户登录时间,地域等上下文信息,因为没有明确的含义,那怎么办呢?一般通过聚类等方法,去做数据的处理,提取出用户的特征,给用户打上分类的标签,那用户就又有特征了,又可以根据用户的特征去做相似的推荐了。如果说我们已经找到特定标签的用户了,我们就可以根据预设的规则,或者训练出一个模型,去对用户做出推荐,比方预设的规则是,统计出一类人是画家,就给他推荐画板,油纸,素描纸,马克笔。用一个模型去发现规律,用标签去做这个事情。用户如果打上标签,这个过程叫用户画像。信息少,是用户画像最大问题。冷启动的时候,勾选标签。如果收集不到那么多用户信息,画像不好。收集用户的行为数据。
用户画像(User Profile)
收集用户社会属性,生活习惯,用户消费行为,抽象出一个用户的商业全貌。大数据分析的根基。大数据比你更懂你。