用户画像标签数据开发之组合标签计算

目录

0. 相关文章链接

1. 什么是组合标签计算

2. 应用场景

3. 数据计算


注:此博文为根据 赵宏田 老师的 用户画像·方法论与工程化解决方案 一书读后笔记而来,仅供学习使用

0. 相关文章链接

用户画像文章汇总

1. 什么是组合标签计算

组合标签计算是画像开发中的一个重要模块。当业务方根据业务规则应用标签时,是需要组合多个标签来创建对应的用户群体的,此时需要 应用到组合标签计算。

2. 应用场景

        这里看一个组合标签计算的应用场景,在如下图中用户A、B、C、 D、E已经被打上了符合自己特征的标签,业务人员想给“高价值用户 群组”发放一批优惠券促使他们消费。根据运营经验,定义了 “高价 值用户群组”的特征为:①女性用户;②25〜35岁之间;③累计消费5 次以上;④累计消费500元以上;⑤活跃度在中活跃以上的用户。可以 看到同时满足这些条件的用户为用户B、用户C、用户E。组合标签计算 的任务就是根据业务人员筛选的规则,计算出符合对应条件的用户 群。

组合标签计算的实现逻辑,总结来说分为3个过程:

  • 读取不同组合标签的计算规则;
  • 将人群规则拼接成接口传入参数的查询命令,通过接口方式进行查询;
  • 接口查询计算时,通过Elasticsearch查询符合这些条件的用户id,返回用户id作为rowkey去HBase中查询这些用户身上的标签信息。

3. 数据计算

        业务人员在画像产品端可以组合标签圈定人群(如下图),对应地在关系数据库中将会记录该条人群规则包含的用户标签。

记录圈定人群规则的表中主要包括以下主要内容(如下图):
•    人群id:创建该条人群规则对应的唯一id标识。
•    人群名称:该条人群规则在业务定义上的名称。
•    人群规则:人群组合标签规则中包含的标签及标签值。
•    人群数量:该人群对应的数量。
•    创建时间:该人群规则的首次创建时间。
•    修改时间:该人群规则的最近一次修改时间。
•    是否应用:该人群是否应用到线上。

        在调用接口查询时,将人群规则拼接成字符串,通过Elasticsearch查询符合该规则的用户id。例如针对上面id 为“100003”的人群,将其规则拼接成“ATTRITUBE_U_06_001,6||ACTI0N_U_05_003,3||C0NSUME_U_05_003,15”,柞为参数传入接 口地址。
        本博文介绍了一种组合标签计算用户人群的解决方案,总结来说包 括两个过程:首先从关系库表中(如MySQL)读取业务人员圈定人群的 规则,将人群规则拼接成接口的传入参数,然后通过接口请求 Elasticsearch的方式查询对应的用户id。


注:再次声明,此博文为根据 赵宏田 老师的 用户画像·方法论与工程化解决方案 一书读后笔记而来,仅供学习使用

注:其他相关文章链接由此进 -> 用户画像文章汇总


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

电光闪烁

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值