目录
对自己在画像项目的一些总结
用户画像是什么?
用户画像分为画像和兴趣
- 用户画像
静态,包括基础属性、地理属性、行为属性等,应用于客群分析和营销活动。
常见的场景:APP应用架构层级的千人千面、营销活动圈定人群。
- 用户兴趣
动态,包括即时兴趣、短期兴趣、长期兴趣等,应用于推荐系统和内容推荐。
常见的场景:搜索栏、商品/内容收藏、购买等。
标签
画像和标签
用户画像:用户信息标签的一个集合,也可说用户画像通常以标签落地
- 用户画像的标签是参数化标签
- 用户画像的标签是有权重的
参数化标签?
标签背后有严格的口径定义,比如我们定义:
标签【偏好王者荣耀】代表【过去1个月下过5次王者订单的人群】
后面口径修改【过去1个月下过10次王者订单的人群】,此时需要废弃旧的标签,重新生产新的标签,这显然是不合理的
参数化即把标签口径中可变的部分设置为参数,【偏好王者荣耀】代表【过去N个月下过M次王者订单的人群】
标签的权重?
每个标签都要有权重
标签分类
标签分为几类:
1. 统计类
包括直接提取的标签,又叫事实标签
包含用户的基本信息以及用户行为聚合的比如下单次数
2. 规则类
需要自定义规则,又叫建模标签,由人来指定,满足一定条件的
3.机器学习标签
非确定性的标签,又叫预测标签
标签建模
按照维度划分标签:
将标签按照内容横向分开
基本社会属性,行为习惯,购买能力,兴趣爱好等
设置分级标签模型
将标签按照模型纵向分开
画像:用户信息标签的一个集合
用户行为可追溯,把用户的行为勾勒出一个用户的信息全貌,个性化服务
根据数据,生产标签
画像数据产出
画像有几部分组成的
特征标签
首先有一部分是一个大表,属于画像特征,这部分是统计类又叫事实标签,可以直接从数据提取,不需要建模
建模标签
还有一部分是需要建模的
这种画像标签需要你事先定义好,每一个标签对应一种口径
用户行为标签表表结构:
模型预测标签
还有预测标签,这部分我没有处理过,不是很清楚