木东居士
数据从业者
又是因为一张图转载的一篇文章,关于标签的分类,可以直接参考本文的划分。
在做标签的时候,首先要提的一般是用户画像,而用户画像一般是由两部分组成的:标签和特征,很多小伙伴在刚接触画像的时候,是分不清什么是画像、特征和标签的。简单来讲,画像包含了标签和特征,特征比较多的是一些统计值,比如你近期花了多少钱,那么标签是对特征的一层抽象理解,一般是高消费能力、低消费能力这些说明。一般而言,大家提到画像,应该以标签为主。
关于标签的分类,有很多划分,比如业务标签、模型标签、事实标签、统计标签、规则标签等等,很乱,每个人有每个人的玩法。而本文这种简单的三层划分是居士目前认同度最高的方式,因此,转载本文,分享给大家~
导读:标签是根据业务场景的需求,通过对目标对象(含静态、动态特性)运用抽象、归纳、推理等算法得到的高度精练的特征标识,用于差异化管理与决策。
作者:华为公司数据管理部
来源:大数据DT(ID:hzdashuju)
标签由标签和标签值组成,打在目标对象上,如图5-16所示。
▲图5-16 打标签示例
标签由互联网领域逐步推广到其他领域,打标签的对象也由用户、产品等扩展到渠道、营销活动等。
在互联网领域,标签有助于实现精准营销、定向推送、提升用户差异化体验等;
在行业领域,标签更多助力于战略分级、智能搜索、优化运营、精准营销、优化服务、智慧经营等。
标签分为事实标签、规则标签和模型标签,如图5-17所示。
▲图5-17 三种类型的标签
事实标签是描述实体的客观事实,关注实体的属性特征,如一个部件是采购件还是非采购件,一名员工是男性还是女性等,标签来源于实体的属性,是客观和静态的;
规则标签是对数据加工处理后的标签,是属性与度量结合的统计结果,如货物是否是超重货物,产品是否是热销产品等,标签是通过属性结合一些判断规则生成的,是相对客观和静态的;
模型标签则是洞察业务价值导向的不同特征,是对于实体的评估和预测,如消费者的换机消费潜力是旺盛、普通还是低等,标签是通过属性结合算法生成的,是主观和动态的。
标签管理分为标签体系建设和打标签。
01 标签体系建设
选定目标对象,根据业务需求确定标签所打的业务对象,业务对象范围参考公司发布的信息架构中的业务对象。
根据标签的复杂程度进行标签层级设计。
进行详细的标签和标签值设计,包括标签定义、适用范围、标签的生成逻辑等:
事实标签应与业务对象中的属性和属性值保持一致,不允许新增和修改;
规则标签按照业务部门的规则进行相关设计;
模型标签根据算法模型生成。
02 打标签
1. 打标签数据存储结构
打标签是建立标签值与实例数据的关系,可以对一个业务对象、一个逻辑数据实体、一个物理表或一条记录打标签。
为了方便从“用户”视角查找、关联、消费标签,可增加用户表,将标签归属到该“用户”下,这里的“用户”是泛指,可以是具体的人,也可以是一个组织、一个部门、一个项目等。
2. 打标签的实现方法
事实标签:根据标签值和属性允许值的关系由系统自动打标签。
规则标签:设计打标签逻辑由系统自动打标签。
模型标签:设计打标签算法模型由系统自动打标签。
关于作者:华为公司数据管理部,作为集团层面的数据管理组织,主要负责公司数据工作的战略规划、路标举措以及实施落地;数据从产生到消费全生命周期管理的治理框架、流程规范、方法和IT工具的制定与推行;公司级信息架构的设计和数据资产的治理维护;主持集团层面数据相关项目,推动以数据为核心的数字化转型等工作。
本文摘编自《华为数据之道》,经出版方授权发布。