用户标签体系的设计和效果评估

一、什么是用户标签

用户标签是构成用户画像的核心因素,是将用户在平台内所产生的业务数据,行为数据,日志数据等分析提炼后生成具有差异性特征的形容词。即用户通过平台,在什么时间什么场景下做了什么行为,平台将用户所有行为数据提炼出来形成支撑业务实现的可视化信息。用户标签可以有很多种存在形式,可以是用户的自然属性,可以是对用户交易、资产数据的统计指标,也可以是基于某些规则,总结出的一些分层。无论是哪种形式,都是对用户的某个维度特征做描述与刻画,让使用者能快速获取信息。

二、用户标签分类

1.静态标签、动态标签:
例如“性别”这个标签,一般来说是不会随着时间变动的,所以它属于静态标签;而“最近一次访问时间”会随着每次用户登录而更新,也就是动态标签。

2.事实标签、规则标签、预测标签:
这一种分类方式是从技术开发角度区分的。
“事实标签”是从底层数据表中取出原始数据,进行简单的加减乘除运算得到的标签;例如“最近一次登录距今天数”这个标签,它反映基本事实。
“规则标签”则是进行了业务定义后的标签;例如“流失用户”这个标签,基于我们的业务认知,可以将“最近一次登录距今天数”大于30天的用户定义为流失用户,不同公司会有自己的定义方式。
“预测标签”,是需要利用算法分析预测才能得到的标签了;例如电商产品常通过用户的下单行为,去猜测用户的性别;通常算法类标签涉及复杂的逻辑与权重,开发难度大,在所有标签中占比不高。

3.单一标签、复合标签:
一般来说,上述的统计类标签可以说是单一标签,而规则类和算法类标签就是需要多个单一标签组合而成的复合标签。

4.层级标签:
同样,层级也是为了业务理解更加有序才产生的,例如一级标签是大类,按具体行业和业务可以分为:人口属性,行为属性,营销属性,商业属性等。二级标签可以具体分类,比如商业属性下二级标签可以分为优惠券,三级标签分为优惠券-敏感度高/中/低用户。当然,如果业务逻辑复杂,可能还会有三级标签。

三、为什么要建设用户标签体系

一般的中大型公司或多或少都已经有建设自己的标签,但实际使用效果却差强人意,很难驱动业务产生价值。我总结出互联网行业搭建统一的用户标签体系要解决的常见痛点:
1.标签口径不一致:
用户画像、精准营销平台人群圈选、算法特征都会涉及到用户标签,各个系统存在标签同义不同值、同值不同义的问题,举个例子:互金信贷行业的通过率,就有至少三种不同的统计口径,风控部门是以授信通过或者审核通过为准,财务部门以放款为准等。不同部门因侧重点不一样导致对这个指标的定义不一样。企业建设统一的标签平台规范口径也是数据中台的重要内容。

2.标签指标重复建设:
用户标签分散,重复建设,难以统一管理。形成了局部数据孤岛,存在重复建设的问题。比如和标签生产相关的团队就有好几个:数据团队模型开发人员要做自己的模型变量标签,存在多个模型工程师重复建设同一标签而产生大量同质的标签表;数据分析团队归纳业务需求总结出来的标签,比如用户生命周期标签,若分析团队位于不同部门则重复建设情况更为严重,再加上技术开发同学做的营销平台,消息系统,优惠券平台等需要打常规的用户标签来选人等等。

3.标签生产周期长:
互联网公司的标签生产流程大抵如下:
业务提标签需求—>数据对接人(一般是数据PM or 分析师)收集转化—> 提交给数据开发(离线开发与实时开发) —> 数据开发按业务逻辑清洗数据,导入平台系统—> 后台开发 做成数据服务统一对外输出标签。
一般如果没有做标签上线流程的配置化,此时还需要前端开发介入,整个流程耗时长,平均需求产生到上线耗时一周以上甚至更长时间,和同行朋友聊,有些国有企业生产常规运营标签耗时竟然可以达到1个月,这样的生产流程根本无法满足业务快速发展的需求。

4.业务运营靠经验,手工操作流程多周期长:
在缺乏统一标签平台或者没有精准圈人平台之前,以信贷行业为例,一般运营同学做活动的流程如下:
活动前:运营提选人需求->分析师提数—>风控人员规则过滤用户—> 运营手动分组
运营将名单导入到营销系统 —> 选择触达方式(消息/优惠券等)和触达周期(一次性/周期性/实时等) -> 触达用户
活动后:运营将名单再次给分析师 —> 分析师提数给运营—> 运营分析活动效果
这里面存在很多拍脑袋决策的节点,比如运营圈人规则看不到人群数量,容易出现圈定人群样本量过少无法进行营销活动;运营在看不到人群画像和分布的情况下,手动盲目对人群进行分组AB Test,容易导致AB Test结论不可靠。活动效果分析没有横向和纵向对比,无法客观得出活动到底做地怎么样。当然这里面还存在诸多手工操作的地方和维护困难的地方,比如每次圈人过风控规则,圈人后手工导入营销系统,手动将名单到给分析师提数做效果分析等。

四、如何设计用户标签体系

核心原则:从业务中来,到业务中去;以终为始,怎么用来倒推怎么设计。

任何脱离业务自造的标签都是自嗨,这也是很多大公司数据部门容易犯的错,数据部门想要从数据层面去驱动业务,基于自身过往从业经验,拍脑袋梳理和设计了上百个标签,却发现业务根本不买单。数据部门价值体现的唯一方式就是融入业务团队,知道业务来龙去脉和痛点。总结下来正确的顺序是明确商业目的,梳理业务流程,收集业务痛点,汇集整理标签,最后才是开发标签反哺业务。基于作者多年经验,如何设计标签可以归纳为以下两种方法:
1.基于业务主流程来设计标签:
以信贷行业为例,梳理后信贷业务主流程如下:

激活 —>注册—>登录—>认证—>申请进件—>风控—>放款—>还款—> 逾期催收

以激活到注册流程为例,为精准化识别用户渠道及后续做渠道成本结构优化,我们这个环节可能需要的标签是注册渠道,获客渠道,渠道类型,结算类型,获客成本,注册设备等。
再以申请进件到风控流程为例,结合流程中常见的业务场景,可能需要的标签:首次/最近一次申请时间/产品/额度/是否通过,总申请次数/金额,拒绝次数/放弃次数,通过类型(人工/系统自动)等。

2.基于业务场景来设计标签:
以典型运营场景为例,信贷业务主要靠老户复贷挣钱,促老户复贷是经常会做的一个运营活动,思考活动运营的三个要素(活动对象,在什么场景,执行什么策略),我们需要的标签可能是用户类型(新老户),最近一次成功还款时间/金额,最近一次借款产品,产品偏好,优惠券敏感度/响应度,额度敏感度/响应度 等等。

3.基于北极星指标来自顶向下设计标签:
一般公司每年会基于大的战略方向制定公司整体的北极星指标(指引业务发展的指标),然后基于整体业务指标自顶向下拆分到各业务部门,各业务部门再根据运营策略拆解成更细的指标。
举个例子,某信贷公司制定当年度北极星指标为:利润,注册量,放款量,逾期率。其中利润为主指标,其他三个指标围绕利润指标进行平衡。想提升利润核心是提升放款量,但提升放款量会带来获客成本上升以及坏账成本上升,所以这是三者的平衡。

五、如何评估用户标签体系的效果

为什么要进行标签效果评估:对标签的质量进行科学完整地评估,有助于控制标签质量,指导标签的管理者、开发者不断地提升标签质量。通过创建一套完整的评估体系,对于质量过差的标签,可以考虑不进行上线,等达到基本的质量要求后才能开放给业务使用。不然,既对业务带来不了价值,也容易让标签画像系统失去用户的信任。

1.数据层面:
一般使用三个指标:覆盖度,准确度,稳定性

覆盖度是指在一个标签中,有业务含义的人群数量与总人群数量的比例。
举个例子:【优惠券敏感度】标签,全量用户是100万的规模,其中20万打上了“高”标签,20万打上了“中”标签,30万打上了“低”标签,其他30万人都没有打上任何标签。那么,【优惠券敏感度】标签的覆盖度就是70%。这个覆盖度还算是可以,如果覆盖度过低可能会有下面的负面影响:用标签进行人群圈选的时候,人数过少,无法满足运营活动对样本量的最低要求;用标签统计平台用户的特征时,和真实情况会有统计偏差,即样本无法代表整体。一般而言,用户自己填的标签和模型算法打出来的标签,覆盖度会偏低。

准确度是指给用户打的标签中,准确反映事实的人群数量与总人群数量的比例。
举例子:【性别】标签,总用户100万,真实情况是男60万,女40万,系统打标成男50万,女30万,其他20万 根据交叉矩阵,真实是男且标签是男用户40万,真实是女且标签为女用户25万,则标签准确率为 (40 + 25)/ 80 = 81.25%。真实情况是现实世界标签的准确度往往是很难评估的。一般会用一些外围样本数据来辅助验证,比如对于性别标签,可以抽样让客服电话调研拿到真实性别数据,通过样本来估算整体。

稳定性是指给用户打的标签中,能在指定时间点前被准确计算出来的次数比例。举个例子,信贷行业中的关联指标【通讯录中近30天有借款逾期人员的比例】,这类指标需要计算几个亿的通讯录表,和业务表关联好几次,计算复杂度高,高峰时期容易跑不出来。稳定性标签还要根据各标签的计算复杂度来综合评估,一般静态类标签稳定性比较高,算法预测类标签复杂计算逻辑或者关联上下游表比较多的标签在特殊情况下稳定性会差一些。一般而言,稳定性要达到99%以上才能被业务接受,关键时刻不能掉链子。

2.应用层面:
1)用户覆盖度:可以使用两个指标衡量覆盖度:产品触达率和产品打开率
产品触达率= 触达用户数 / 目标用户数
举个例子:标签产品目标用户(产品,运营)共计100人,知道该产品的用户80人,则触达率为 80%
产品使用率= 使用过的用户数 / 触达用户数

2)标签使用度:
使用度可以综合从以下几个指标评估,包括 使用次数,使用热度,服务调用次数。可考虑人均聚合或者阶段汇总聚合。对于应用使用度低的标签,可以针对性地进行分析,不断提升每个标签的使用价值。

3.业务层面:
业务价值是业务人员对标签系统的主要考核价值。标签系统业务层面的应用很广泛,从精准营销,精细化运营到个性化推荐,广告匹配系统,BI系统。以精准营销平台为例,一般业务价值可以从降本增效来考虑,比如营销成本降低,营销频次提高,营销人效提升等角度来衡量。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值