用StarRocks玩转用户画像-2-方法论

目录

用户画像 - 业务特点

业务应用

业务难点

标签类型

统计类标签

规则类标签

机器学习挖掘类标签

用户标签体系

用户属性维度

风险控制维度

标签命名方式

组合标签计算-客群圈选场景

上一篇

下一篇


用户画像 - 业务特点

业务应用

  • 精准营销
    • 广告投放,个性推荐,弹窗推送
  • 群体分析
  • 风险预警
  • 效果分析
  • 渠道分析

业务难点

  • 数据体量庞大,检索方式灵活
    • 组合标签计算,开发复杂度高
  • 精确去重计算,资源消耗巨大
  • 聚合标签集合,查询并发度高

标签类型

用户画像建模最重要的是对用户「打标签」,常见的3种分类:

统计类标签

  • 基础标签类型,用户的性别、年龄、城市、星座、职业等等基础属性,可以做分布统计,
  • 也包括如活跃时长、注册用户数、访问次数、消费金额等按照某些基础维度统计出的指标

规则类标签

  • 基于确定的规则及用户行为产生。
  • 规则,通常是需要对基础维度添加前置修饰词来限定统计的口径;或者需要提前做数据调研,如通过RFM客户价值法来科学的制定规则,从而打标签。
  • 例如:时间是基础维度,天是最小粒度,而最近30天交易次数 ≥ 2就是个有修饰词限定的规则类标签

机器学习挖掘类标签

  • 该类标签通过机器学习挖掘产生,用于对用户的某些属性或某些行为进行预测判断
  • 例如:基于客户的行为推断客户行为上的性别
  • 互联网公司花样百出的标签:
    • 「女汉子」、「文艺青年」、「宅男」…

用户标签体系

上图,列出了一些常见的用户画像标签体系分类。下面举几个例子来看:

用户属性维度

可以看到这个表里设计了几个字段:标签名称、标签主题、一级归类、标签类型等等。

其中标签归类里有诸如自然性别、RFM价值度、购物风格、平台消费情况、用户身份等归类。

标签类型可以看到,有统计型、规则型、算法型等等。

风险控制维度

  • 互联网用户形形色色,为了防止给平台带来损失和风险,需要在风险控制维度构建标签体系,有效监控不良用户

社交属性维度

 画像标签开发

标签命名方式

为了便于对诸多标签进行管理,需要对每个标签id命名,例如

  • attr_u_s_01_001表示UserID维度自然性别为男的标签
  •  attr_u_s_01_002表示UserID维度自然性别为女的标签

 

ID-Mapping

  • ID-Mapping

即把不同来源的身份标识通过数据手段识别为一个用户主体

同一个用户在登录和未登录的行为数据之间需要打通,用Hive做ETL,完成uid和cookieid的映射关系

组合标签计算-客群圈选场景

  • 组合标签计算,是画像开发中的一个重要模块。当业务方根据规则应用标签时,是需要组合多个标签来创建对应的用户群体的。

上一篇

用StarRocks玩转用户画像-1-概述

下一篇

用StarRocks玩转用户画像-3-传统解决方案

导航

用StarRocks玩转用户画像-1-概述

用StarRocks玩转用户画像-2-方法论

用StarRocks玩转用户画像-3-传统解决方案

用StarRocks玩转用户画像-4-最强OLAP产品

用StarRocks玩转用户画像-5-客群圈选

StarRocks招聘:

招解决方案,DBA,数据库研发,测试,前后端开发等岗位,

有意者请投递简历到 hr@starrocks.com

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值