第2章 数据指标体系
数据指标体系是建立用户画像的关键环节,也是在标签开发之前要进行的工作,具体来说就是需要结合企业的业务情况设定的相关指标。
互联网企业在建立用户画像时一般除了基于用户维度(userid)建立一套用户标签体系外,还会基于用户使用的设备维度(cookieid)建立相应的标签体系。
基于cookieid维度的标签应用也很容易理解,当用户没有登录账户而访问设备时,也可以基于用户在设备上的行为对该设备推送相关的广告,产品和服务。
建立的用户标签按标签类型可以分为 统计类,规则类和机器学习挖掘类。从建立的标签维度看,可以将其分为 用户属性类,用户行为类,用户消费类和风险
控制类。
2.1 用户属性维度
2.1.1 常见用户属性
用户属性是刻画用户的基础。常见用户属性指标包括:用户的年龄,性别,安装时间,注册状态,城市,省份,活跃登陆地,历史购买状态,历史购买金额等。
2.1.2 用户性别
用户性别可以细分为 自然性别和购物性别两种。
1.自然性别,是指用户的实际性别,一般可以通过用户注册信息,填写问卷调查表单等途径获得。该标签只需要从相应的表中抽取数据即可,加工起来较为方便。
2.用户购物性别,是指用户购买物品时的性别取向。例如,一位实际性别为男性的用户,可能经常给妻子购买女性的衣物,包等商品,那么这位用户的购物性别则是
女性。
2.2 用户行为维度
用户行为是另一种刻画用户的常见维度,通过用户行为可以挖掘其偏好和特征。常见用户行为维度指标包括:用户订单相关行为,下单/访问行为,用户近30天行为类型指标,
用户高频活跃时间段,用户购买品类,点击偏好,营销敏感度等相关行为。
2.3 用户消费维度
对于用户消费维度指标体系的建设,可从用户 浏览,加购,下单,收藏,搜索商品对应的品类入手,品类越细越精确,给用户推荐或营销商品的准确性越高。
用户消费维度:
1.近7日流量品类
2.近7日加购品类
3.近7日收藏品类
4.近7日购买品类
这里通过一个场景来介绍构建用户消费维度的标签的应用。某女装大促活动期间,渠道运营人员需要筛选平台上的优质用户,并通过邮件,短信,Push等渠道进行营销,可以通过
圈选出"浏览" "收藏" "加购" "购买" "搜索" 与该女装相关的品类 的标签来筛选出可能对该女装感兴趣的潜在用户,进一步组合其他标签(如"性别" "消费金额" "活跃度"等)
筛选出对应的高质量用户群,推送到对应的渠道。因此将商品品类抽象成标签后,可以通过 品类+行为 的组合应用方式找到目标潜在的用户人群。
2.4 风险控制维度
互联网企业的用户可能会遇到 薅羊毛,恶意刷单,借贷欺诈等行为的用户,为了防止这类用户给平台带来损失和风险,互联网公司需要在风险控制维度构建起相关的指标体系,有效
监控平台的不良用户。结合公司业务方向,例如从 账号风险,设备风险,借贷风险等维度入手构建风控维度标签体系。
2.5 社交属性维度
社交属性用于了解用户的 家庭成员,社交关系,社交偏好,社交活跃度等方面,通过这些信息可以更好的为用户提供个性化服务。
2.6 其他常见标签划分方式
前面从 用户属性,用户行为,用户消费,风险控制,社交属性共5个维度划分归类了用户标签指标体系,通过应用场景对标签进行分类也是常见的标签划分方式。
从业务场景的角度出发,可以将用户标签体系贵归为 用户属性,用户行为,营销场景,地域细分,偏好细分,用户分层等维度。每个维度可细分为二级标签,三级标签等。
1.用户维度
包括用户的年龄,性别,设备型号,安装/注册状态,职业等刻画用户静态特征的属性。
2.用户行为
包括用户的消费行为,购买后行为,近n日的访问,收藏,下单,购买,售后等相关行为。
3.偏好细分
用户对于商品品类,商品价格段,各营销渠道,购买的偏好类型,不同营销方式等方面的偏好特征。
4.风险控制
对用户从征信风险,使用设备的风险,在平台消费过程中产生的问题等维度考量其风险程度。
5.业务专用
应用在各种业务上的标签,如A/B测试标签,Push系统标签等。
6.营销场景
以场景化进行分类,根据业务需要构建一系列营销场景,激发用户的潜在需求,如差异化服务,场景用户,再营销用户等。
7.地域细分
标识用户的常驻城市,居住商圈,工作商圈等信息,应用在基于用户地理位置进行推荐的场景中。
8.用户分层
对用户按照生命周期,RFM,消费水平类型,活跃度类型等进行分层划分。
2.7 标签命名方式
为了方便对诸多标签进行集中管理,需要对每个标签对应的标签id进行命名。
1.标签主题
用于刻画属于哪种类型的标签,如人口属性,行为属性,用户消费,风险控制等多种类型,可分别用 ATTRITUBE,ACTION,CONSUME,RISKMANAGE等单词表示各标签
主题。
2.用户维度
用于刻画该标签是打在 用户唯一标识(userid)上,还是打在用户使用的设备(cookieid)上。可用U,C 等字母分别表示 userid 和 cookieid 维度。
3.标签类型
类型可以划分为 统计型,规则型和算法型。其中统计型开发科直接从数据仓库中各主题表建模加工而成,规则型需要结合公司业务和数据情况,算法型开发需要对数据
做机器学习的算法处理得到相应的标签。
4.一级归类
在每个标签主题的大类下面,进一步细分维度来刻画用户。
对于用户的性别标签,标签主题是人口属性,用户维度是userid,标签类型属于算法型。给男性用户打上标签"ATTRITUBE_U_01_001",女性是"ATTRITUBE_U_01_002"。
其中,"ATTRITEBU" 为人口属性主题,,"_"后面的 "U" 为userid维度,"01" 为一级归类,最后面的 "001" 和 "002" 为该一级标签下面的标签明细。如果是划分高中低活跃
用户的,对应一级标签下的明细可划分为 "001" "002" "003"。
标签统一命名后,维护一张 码表 记录标签id名称,标签含义及标签口径等主要信息,后期方面元数据的维护和管理。