用户画像,即用户信息标签化,通过收集用户的社会属性、消费习惯、偏好特征等各个维度的数据,进而对用户或产品特征属性进行刻画,并对这些特征进行分析统计,挖掘潜在价值,从而抽象出用户的信息全貌。
书中的主要章节
该书主要以电商网站为例。
系统架构
ETL是什么
ETL,即Extract-Transform-Load的缩写,是将业务系统的数据经过抽取、清洗转换之后加载到数据仓库的过程。ETL是数据集成的第一步,也是构建数据仓库最重要的步骤,目的是将企业中的分散、零乱、标准不统一的数据整合到一起,为企业的决策提供分析依据。ETL一词较常用在数据仓库,但其对象并不限于数据仓库。如下图所示:
举个例子,某电商公司分析人员根据订单数据进行用户特征分析。这时需要基于订单数据,计算一些相应的分析指标,如每个用户的消费频次,销售额最大的单品,用户复购时间间隔等,这些指标都要通过计算转换得到。
开发的几个阶段
ODS数据表
(1)用户信息表
(2)商品订单表
(3)PC Web日志表
(4)APP 日志表
(5)商品评论表
(6)搜索日志表
(7) 用户搜藏表
(8)购物车信息表
画像标签
根据业务线梳理,包括用户属性、用户行为、用户消费、风险控制等维度的标签体系。
标签命名规则
计算出来的标签数据可以存放在HBASE,ES,MySQL等。
离线标签可以分为统计类,规则类,挖掘类(算法类)
统计类标签
规则类标签
用户价值类,用户活跃度也是规则类标签
挖掘类标签(算法类标签)
流式计算标签
下面是画像系统的一些图形界面,可以看到这套系统的用法
用户查询
这里查到的内容属于DWS层的
启用标签的视图![](https://img-blog.csdnimg.cn/20211003000225755.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBAU3ByaW5nSGVhdGhlcg==,size_20,color_FFFFFF,t_70,g_se,x_16)
标签详情
点击人口属性标签展开详情
这里查到的属于ADS层的内容,展示人群的统计信息,一般每天统计一次
元数据管理(标签管理)![](https://img-blog.csdnimg.cn/2021100310340458.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBAU3ByaW5nSGVhdGhlcg==,size_20,color_FFFFFF,t_70,g_se,x_16)
当前的用户自定义分群
编辑用户人群
人群分析->新建人群
人群分析—>选择维度
人群分析—>维度分析结果
人群分析—>对比人群
业务场景
用户画像在业务中的一些应用
(1)营销
营销方法包括消息推送,弹窗,推荐,短信,邮件,电话外呼等。
主动外呼
(2)风控
监控平台的不良用户,如薅羊毛、恶意刷单、借贷欺诈等,减少这类用户给平台带来的损失和风险。相关的指标如账号风险、设备风险、借贷风险等;
(3) A/B测试
(4)高价值用户实时营销
(5)商品分析
(6)渠道分析
(7)漏斗分析
(8)客服
(9)效果分析
(10)个性化推荐与服务