转载:用户画像建设过程简析

https://mp.weixin.qq.com/s?__biz=MzI0NzAwMzcyNQ==&mid=2247483655&idx=1&sn=11b9bf9c862e88ae6b744c1374e3335f&chksm=e9b7ee25dec06733a6cedf8dda35bbc841518cbd6a6d648cef1481e97b8cbfbee6624162d9af&scene=21#wechat_redirect

用户画像介绍

早期的用户画像是通过对用户多方面信息的调研和了解,将多种信息分类聚合,产出几个有典型特征和气质的虚拟用户。用户画像用于辅助产品设计,评价需求是否有价值,别让产品偏离核心用户的需求;市场营销方面,可以用于方案制定,推广渠道选择,同时对运营人员也有一定的指导意义。此种的用户画像粒度比较粗,用虚拟的用户画像代表真实的用户。用户画像会用如下的文档描述。

随着互联网的不断发展,积累的用户信息、行为记录越来越丰富,同时大数据处理和分析技术也已成熟,可以计算出每一个用户的特征。特征使用从人口基本属性、社会属性、生活习惯、消费行为等信息抽象出来的一个个具体的标签表示,标签是某一用户特征的符号化表示。为每个用户计算用户画像,这样更加贴近真实的世界,每个人都是独一无二,不能随随便便被其他人代表,用户画像精准到人。用户画像用标签集合来表示,例如:

吴某,男,32岁,河南人,北京工作,银行业,投资顾问,年收入50万,已婚,两套房,有孩子,喜欢社交,不爱运动,喝白酒,消费力强等。

基础信息可以通过用户的注册信息获得,但像是否有孩子、喜欢社交、喝白酒、消费能力等级等,用户不会告诉我们,需要建立数据模型才能计算出来。当然,用户标签的体系是需要根据业务领域去设计的,比如银行和电商用户标签体系就会不同。

基于大数据用户画像的用途

1. 应用最广泛当属个性化推荐,电商网站为准妈妈推荐婴儿用品,为摄影爱好者推荐镜头。个性化推荐中,计算出用户标签是其中一环,需要有协同过滤等推荐算法实现物品的推荐。

2. 精准广告可以根据年龄、区域、人群、天气、游戏爱好、内容偏好、购物行为、搜索行为等定向选择进行投放,例如腾讯的广点通,支持用户在微信、QQ精准投放。

3. 精细运营,例如向目标用户发送促销活动短信,避免全量投放完成的浪费。可以针对某次活动的拉新用户进行分析,评估活动效果,看是否和预期相符。

4. 辅佐产品设计,把用户进行分群,依据不同用户群特性就行产品设计和测试验证。

其它应用场景

1. 查看某次市场推广的用户画像,事后分析是否和预期一致,判断推广渠道和产品目标用户群的匹配度。

2. 查看不同地域的用户画像,不容内容频道的用户画像。

3. 个性化Push,例如新闻客户端根据用户的阅读习惯进行个性化的新闻推荐。

步骤

前一篇粗略的介绍了建立用户画像的过程,连载二更进一步,以时尚杂志全媒体为业务原型,把抽象的文字描述实例化,从战略目的分析、如何建立用户画像体系、怎么对标签进行分类分层级三个不同角度来说说用户画像建立的过程。梳理标签体系是实现用户画像过程中最基础、也是最核心的工作,后续的建模、数据仓库搭建都会依赖于标签体系。

 


可以获取到的数据分两类,一类是业务系统数据,一类是用户访问网站、APP产生的行为数据。

 

不同的企业做用户画像有不同的战略目的,广告公司做用户画像是为精准广告服务,电商做用户画像是为用户购买更多商品,内容平台做用户画像是推荐用户更感兴趣的内容提升流量再变现。

 

战略理清楚后,首先要画出描述用户画像的框架,建立用户画像体系框架的目的是进一步明确用户画像的用途、把标签限定在合理的范围内。具体要结合战略目标、数据情况、应用场景来规划标签系统,选取和战略目标一致的标签维度,把标签按照应用场景进行分门别类。同时注意聚焦和收敛,不要把没用标签装进来,以降低系统的复杂性,避免无用信息干扰分析过程。

 

用户画像体系和标签分类从两个不同角度来梳理标签,用户画像体系偏战略和应用,标签分类偏管理和技术实现侧。

 

把标签分成不同的层级和类别,一是方便管理数千个标签,让散乱的标签体系化;二是维度并不孤立,标签之间互有关联;三可以为标签建模提供标签子集,例如计算美妆总体偏好度,主要使用美妆分类的标签集合。

 

梳理某类别的子分类时,尽可能的遵循MECE原则(相互独立、完全穷尽),尤其是一些有关用户分类的,要能覆盖所有用户,但又不交叉。比如:用户活跃度的划分为核心用户、活跃用户、新用户、老用户、流失用户,用户消费能力分为超强、强、中、弱,这样按照给定的规则每个用户都有分到不同的组里。

 

标签还可以按照处理过程、标签获取的方式进行划分,分为事实标签、模型标签、预测标签。不同类别的处理方式不一样。

事实标签:直接从原始数据中提取,例如性别、年龄、住址、上网时段等等

模型标签:需要建立模型进行计算,例如美妆总体偏好度

预测标签:通过预测算法挖掘,例如试用了某产品后是否想买正品

 

但是有些事实标签,如果用户没有填写的话,就需要建立模型来预测。例如数据库中的年龄字段为空,建立依据用户行为来建立特征工程,然后做预测。

用户画像最终的结果是一张大宽表,一行为一个用户的用户画像,存储了用户对应的每个标签值。建模就是为每个标签制定合理的计算公式。


(请点击查看大图)

基础模型

基础数据一般有用户数据、内容实体数据、用户行为数据三类,需要根据用户行为构建相应的数据模型产出标签和权重。每一次的用户行为,可以详细描述为:什么用户,在什么时间,什么地点,发生了什么事。

什么用户:即用户识别,其目的是为了区分用户。用户识别的方式包括Cookie,注册ID,微信,微博,QQ,手机号等。

什么时间:在用户行为中,普遍认为近期发生的行为更能反映用户当下的特征,因此过往行为将表现为在标签权重上的衰减。

什么地点:即用户的接触点,,包含了两个潜在信息:网址和内容。内容决定标签,网址决定权重。用户在天猫浏览了iPhone6的信息和在苹果官网浏览也将存在权重的差异,因此,网址的内容反映了标签信息,网址本身则表征了标签的权重。本案例中的业务以阅读型为主,把网址权重都简化为1。

做了什么:用户的行为类型,例如访问、收藏、试用、分享、搜索等,同样反映的是标签的权重。

从上述建模方法中,我们可以简单勾画出一个用户行为的标签权重公式:

标签权重=时间衰减(何时)x网址权重(何地)x行为权重(做什么)

如果是访问行为,可以再增加访问时长的权重,10S以内权重为1,10S-30S为2,30S以上为3

最后把用户一段时间内同一个标签的权重进行累加,就获得到用户此标签的值。

根据行为的成本大小来判断标签的权重,成本越高越是真爱。例如访问页面是成本最小的,同时赋予标签的权重值就较低收藏能代表用户的喜好,权重较高。此外这里我们假设同一个页面所附属标签和页面内容的相关度都是一样的,例如一篇文章《女人懂西装是一件很性感的事 你的他穿对了吗》附带了男装、高级定制、时尚、潮流、西装 5个不同标签,其实内容和标签的相关度会有差异,可以通过编辑人工或者机器学习的方式为标签赋予不同的相关度,这样最终得出的标签权重可信度更高。以上只是基础模型,适用于内容标签、产品分类、产品标签、品牌标签。美妆总体偏好度、用户活跃度、用户价值等标签仍需要单独建立模型。潜在需求的挖掘适用回归预测等算法模型。

内容偏好度(美妆、服饰)模型

用某分类下所有标签的累加值来度量用户对内容的总体偏好度,例如:用户A的美妆偏好度为其所有美妆类标签值的加和。如果服饰总体偏好度大于美妆偏好度,说明用户访问的服饰内容较多,在本站内更偏向看服饰内容。

活跃度模型

活跃度可以根据用户来访、互动情况、核心功能使用频率等综合确定。例如:

核心用户:每周有访问、近一个月互动次数达到30次以上

活跃用户:每周有访问、互动次数10次以上

一般用户:每月有访问

流失用户:3月以上未访问

用户价值模型

消费领域最广泛应用的是RFM模型。

R是Recency,最近一次消费;R5最高,最近一周有消费,最近两周,最近一个月,最近两月,最近半年;

F是Frequency,消费频率;  最近6个月消费次数,例如:五次以上为 F5,依次类推;

M是Monetary,消费金额;

计算结果为:543,代表R5F4M3级别对用户,根据产品类型的不同,可以调整R、F、M的定义。

借鉴RFM模型的思想,我们可以把用户行为也拆解为三个维度来衡量:最近访问时间、访问频次 、互动次数;(只是一种想法,未经实践检验)

R替换成最近访问时间,R5最高,最近一周访问、最近两周、最近一个月、最近两个月、最近三个月;

F替换成访问频次(UV),F5最高,30次以上为F5,依次类推;

M替换成互动次数,R5最高,60次以上为R5,依次类推;

最后简单说下需要预测的标签模型,预测更多是推荐系统要做的事情,类似潜在需求的标签需要用到机器学习算法,根据用户标签权重、收藏了产品A、产品C、产品D的用户,挖掘还喜欢哪些产品和内容。比较常见的有贝叶斯、回归算法。

展开阅读全文

没有更多推荐了,返回首页