一 、定义
什么是用户画像?
1、用户画像是指根据用户的属性、偏好、生活习惯、行为等信息,抽象出来的标签化用户模型。通俗说就是给用户打标签,而标签是通过对用户信息分析而来的高度精炼的特征标识。通过打标签可以利用一些高度概括、容易理解的特征来描述用户,可以让人更容易理解用户,并且可以方便计算机处理。
2、用户画像通常包含定性画像与定量画像;定性画像是描述用户的基本属性、行为刻画、兴趣模型等,定量画像主要包括用户基础变量、兴趣偏好等可量化的数据特征。一般情况,定量画像主要通过表单(问卷等)以及通过行为数据采集、清洗、统计、归约、挖掘分析等手段取的用户画像数据,相互结合,提高补充用户画像整体质量。定性画像主要是标签化,如什么人,在什么地点、做了什么事情。
二、数据来源
用户画像的数据来源主要包括两个方面:
- 属性数据,这部分数据一般是用户的注册信息,也可以是从其他数据中分析得出的。比如生日、性别、住址、爱好等
- 行为数据,这部分数据一般都是用户的访问日志记录的行为数据。比如常用的一些后端日志数据、前端埋点数据等等。
通过这两部分的数据,就能刻画出用户的画像,其实就是给用户打上一个标签,比如高富帅、白富美等等。这也就是用户画像的本质:为用户打“标签”;标签:人为规定的高度精炼的特征标识,用户特征的符号标识。
一般来说,根据具体的业务内容,会有不同的数据,不同的业务目标,也会使用不同的数据。在互联网领域,用户画像数据可以包括以下内容:
(1)人口属性:包括性别、年龄等人的基本信息
(2)兴趣特征:浏览内容、收藏内容、阅读咨询、购买物品偏好等
(3)消费特征:与消费相关的特征
(4)位置特征:用户所处城市、所处居住区域、用户移动轨迹等
(5)设备属性:使用的终端特征等
(6)行为数据:访问时间、浏览路径等用户在网站的行为日志数据
(7)社交数据:用户社交相关数据
三、应用场景
用户画像应用场景
a)用户属性
b)用户标签画像
c)用户偏好画像
d)用户流失
e)用户行为
f)产品设计
g) 个性化推荐、广告系统、活动营销、内容推荐、兴趣偏好
四、标签
用户画像是对现实用户做的一个数学模型,在整个数学模型中,核心是怎么描述业务知识体系,而这个业务知识体系就是本体论,本体论很复杂,我们找到一个特别朴素的实现,就是标签。标签是某一种用户特征的符号表示。是一种内容组织方式,是一种关联性很强的关键字,能方便的帮助我们找到合适的内容及内容分类。(注:简单说,就是你把用户分到多少个类别里面去,这些类是什么,彼此之间有什么关系,就构成了标签体系)。标签解决的是描述(或命名)问题,但在实际应用中,还需要解决数据之间的关联,所以通常将标签作为一个体系来设计,以解决数据之间的关联问题
1、标签分类:用户画像标签可以分为基础属性标签和行为属性标签。
2、标签级别(标签的体系结构)
分级有两个层面的含义,其一是:指标到最低层级的涵盖的层级;其二是指:指标的运算层级。其一非常好理解,这里重点说运算层级。
标签从运算层级角度可以分为三层:事实标签、模型标签、预测标签。
事实标签:是通过对于原始数据库的数据进行统计分析而来的,比如用户投诉次数,是基于用户一段时间内实际投诉的行为做的统计。
模型标签:模型标签是以事实标签为基础,通过构建事实标签与业务问题之间的模型,进行模型分析得到。比如,结合用户实际投诉次数、用户购买品类、用户支付的金额等,进行用户投诉倾向类型的识别,方便客服进行分类处理。
预测标签:则是在模型的基础上做预测,比如针对投诉倾向类型结构的变化,预测平台舆情风险指数。
3、标签命名和赋值的差别,只要在构建用户标签的过程种,有意识的区别标签命名和赋值足矣
4、标签属性可以理解为针对标签进行的再标注,这一环节的工作主要目的是帮助内部理解标签赋值的来源,进而理解指标含义。可以总结为5种来源:1、固有属性;2、推导属性;3、行为属性;4、态度属性;5、测试属性。
值得注意的是,一种标签的属性可以是多重的,比如:个人星座这个标签,既是固有属性,也是推导属性,它首先不以个人的意志为转移,同时可以通过身份证号推导而来。
即便你成功了建立用户画像的标签体系,也不意味着你就开启了用户画像的成功之路,因为有很大的可能是这些标签根本无法获得,或者说无法赋值。标签无法赋值的原因有:数据无法采集(没有有效的渠道和方法采集到准确的数据,比如用户身份证号)、数据库不能打通、建模失败(预测指标无法获得赋值)等等。