什么是用户画像
用户画像,英文又叫 User Profile,我们经常看到在 PPT 中展现出高大上的用户画像,展现的方式是采用标签云的方式绘制一个人的形状,或者在一个人物形象旁边列出若干人口统计学属性,以此来表达“用户画像”这个概念。
上面这种方式看上去非常炫酷,但实际上这么做的目的只是为了对外展现,用户画像最应该是给机器看,而不是给人看。如果要给机器看,那每个用户的画像应该就是一个向量。
用户向量化后的结果,就是 User Profile,俗称“用户画像”。所以,用户画像不是推荐系统的目的,而是在构建推荐系统的过程中产生的一个关键环节的副产品。
通常大型推荐系统一般都分为召回和排序两个阶段,因为全量物品通常数量非常大,无法为一个用户(User)逐一计算每一个物品(Item)的评分,这时候就需要一个召回阶段,其实就是预先筛选一部分物品(Item),从而降低计算量,用户画像除了用于最终匹配评分,还要用在召回。所以,构建用户画像就要以这两个阶段为目的。
用户画像关键因素
建立用户画像有两个关键点,一个是维度,另一个是量化。这里举个简单的例子来说明下。比如有以下几家旅店,旅店的属性(标签)如下:
名称价格环境距离A100/晚中5km
B200/晚优2km
C150/晚差10km
D150/晚优1km
对价格、环境、距离分别映射一个评分。假定都分为三个级别,价格越低评分越高,环境越好评分越高,距离越近评分越高,那么映射后的结果如下&#