用户画像的定义(即用户画像是什么?):
用户画像的核心是为用户打标签,即是将用户的每个具体信息抽象成标签,利用这些标签将用户形象具体化,从而为用户提供有针对性的服务。
使用场景:
用户画像的业务场景应用包括:
-
用户分群运营:
分群运营是用户画像最常使用的场景,通过对用户画像标签的筛选,筛选出目标用户群体,通过push或弹窗配置平台,进而对不同的用户群体实现精细化运营。 -
个性化推荐:
以用户画像为基础构建推荐系统、搜索引擎、广告投放系统,可以有效的提升转化率。 -
用户统计分析(人群洞察: 分析某一人群具备的特征; ):
根据用户的属性、行为特征等对用户进行分类后,统计不同特征下的用量、分布,分析不同用户画像群体的分布特征和走势。
标签类型:
- 统计类标签:
这类标签是最为基础也最为常见的标签类型,例如,对于某个用户来说,其性别、年龄、城市、星座、近7日活跃时长、近7日活跃天数、近7日活跃次数等字段可以从用户注册数据、用户访问、消费数据中统计得出。该类标签构成了用户画像的基础。
- 规则类标签
该类标签基于用户行为及确定的规则产生。例如,对平台上“消费活跃”用户这一口径的定义为“近30天交易次数≥2”。在实际开发画像的过程中,由于运营人员对业务更为熟悉,而数据人员对数据的结构、分布、特征更为熟悉,因此规则类标签的规则由运营人员和数据人员共同协商确定;
- 机器学习挖掘类标签
该类标签通过机器学习挖掘产生,用于对用户的某些属性或某些行为进行预测判断。例如,根据一个用户的行为习惯判断该用户是男性还是女性、根据一个用户的消费习惯判断其对某商品的偏好程度。该类标签需要通过算法挖掘产生。
标签权重的计算方法
- 基于TF-IDF算法的权重归类
用户标签权重 = 行为类型权重 × 时间衰减 × 用户行为次数 × TF-IDF计算标签权重
公式中各参数的释义如下:
行为类型权重:用户浏览、搜索、收藏、下单、购买等不同行为对用户而言有着不同的重要性,一般而言操作复杂度越高的行为权重越大。该权重值一般由运营人员或数据分析人员主观给出;
时间衰减:用户某些行为受时间影响不断减弱,行为时间距现在越远,该行为对用户当前来说的意义越小;
行为次数:用户标签权重按天统计,用户某天与该标签产生的行为次数越多,该标签对用户的影响越大;
TF-IDF计算标签权重:每个标签的对用户的重要性及该标签在全体标签中重要性的乘积得出每个标签的客观权重值;
应用场景:
-
新用户兴趣偏好抽取: 根据TGI公式计算公式中的每一部分
- 计算每个app群体中,各个兴趣标签的分布【统计标签数量】
- 统计每个app对应的群体数量
- 计算每个标签在总体中的概率密度
- 计算每个兴趣标签在不同的app群体中的tgi
注:【目标群体中具有某一特征的群体所占比例】= cnt1/cnt
【总体中具有相同特征的群体所占比例】= rate
根据app的安装量进行过滤,并生产app到兴趣标签的映射关系
用户行为偏好标签
- 计算用户偏好标签
参考资料