目录
用户画像 - 业务特点
业务应用
- 精准营销
- 广告投放,个性推荐,弹窗推送
- 群体分析
- 风险预警
- 效果分析
- 渠道分析
业务难点
- 数据体量庞大,检索方式灵活
- 组合标签计算,开发复杂度高
- 精确去重计算,资源消耗巨大
- 聚合标签集合,查询并发度高
标签类型
用户画像建模最重要的是对用户「打标签」,常见的3种分类:
统计类标签
- 基础标签类型,用户的性别、年龄、城市、星座、职业等等基础属性,可以做分布统计,
- 也包括如活跃时长、注册用户数、访问次数、消费金额等按照某些基础维度统计出的指标
规则类标签
- 基于确定的规则及用户行为产生。
- 规则,通常是需要对基础维度添加前置修饰词来限定统计的口径;或者需要提前做数据调研,如通过RFM客户价值法来科学的制定规则,从而打标签。
- 例如:时间是基础维度,天是最小粒度,而最近30天交易次数 ≥ 2就是个有修饰词限定的规则类标签
机器学习挖掘类标签
- 该类标签通过机器学习挖掘产生,用于对用户的某些属性或某些行为进行预测判断
- 例如:基于客户的行为推断客户行为上的性别
- 互联网公司花样百出的标签:
- 「女汉子」、「文艺青年」、「宅男」…
用户标签体系
上图,列出了一些常见的用户画像标签体系分类。下面举几个例子来看:
用户属性维度
可以看到这个表里设计了几个字段:标签名称、标签主题、一级归类、标签类型等等。
其中标签归类里有诸如自然性别、RFM价值度、购物风格、平台消费情况、用户身份等归类。
标签类型可以看到,有统计型、规则型、算法型等等。
风险控制维度
- 互联网用户形形色色,为了防止给平台带来损失和风险,需要在风险控制维度构建标签体系,有效监控不良用户
社交属性维度
画像标签开发
标签命名方式
为了便于对诸多标签进行管理,需要对每个标签id命名,例如
- attr_u_s_01_001表示UserID维度自然性别为男的标签
- attr_u_s_01_002表示UserID维度自然性别为女的标签
ID-Mapping
- ID-Mapping
即把不同来源的身份标识通过数据手段识别为一个用户主体
同一个用户在登录和未登录的行为数据之间需要打通,用Hive做ETL,完成uid和cookieid的映射关系
组合标签计算-客群圈选场景
- 组合标签计算,是画像开发中的一个重要模块。当业务方根据规则应用标签时,是需要组合多个标签来创建对应的用户群体的。
上一篇
下一篇
导航
StarRocks招聘:
招解决方案,DBA,数据库研发,测试,前后端开发等岗位,
有意者请投递简历到 hr@starrocks.com