用户画像架构

用户画像方案
1.引言
1.1 项目名称
用户标签应用实施方案

1.2 项目背景及概要
随着用户行为数据爆发式的增长,不同业务数据的应用不尽相同,用户行为数据的标签抽取也存在较大差异。焦聚个性化场景的用户个性化推荐营销,实现数据精细化运营管理,进而深入挖掘潜在的商业价值。
本文主要基于用户行为分类其中主要包括:浏览、发回帖、发求助、发评论购车咨询等,抽取行为相关的标签,通过不同的业务权重配置以及行为时间衰减系数计算,用以综合评估用户标签的得分,以便各业务的营销推荐场景的不同应用。

1.3 项目目标
实现用户标签数据针对不同业务项目的精准定位及个性化推荐应用.

1.4 项目适用范围
各搜索及推荐业务场景的应用人员.

2.主要模块
以用户表单提交、浏览、搜索等操作行为作为数据源。通过建模、开发、产品化、帮助企业认知、了解用户、客观了解自己的产品,输出到用户端进而提供个性化产品、服务和营销方案。


3.用户画像标签类型
3.1 标签类型说明
用户画像建模其实就是对用户进行打标签,从对用户打标签的方式来看,一般分为三种类型:1、基于统计类的标签;2、基于规则类的标签、3、基于挖掘类的标签。
• 统计类标签:这类标签是最为基础也最为常见的标签类型,例如对于某个用户来说,他的性别、年龄、城市、星座、近7日活跃时长、近7日活跃天数、近7日活跃次数等字段可以从用户注册数据、用户访问、消费类数据中统计得出。该类标签构成了用户画像的基础;
• 规则类标签:该类标签基于用户行为及确定的规则产生。例如对平台上“消费活跃”用户这一口径的定义为近30天交易次数>=2。在实际开发画像的过程中,由于运营人员对业务更为熟悉、而数据人员对数据的结构、分布、特征更为熟悉,因此规则类标签的规则确定由运营人员和数据人员共同协商确定;
• 机器学习挖掘类标签:该类标签通过数据挖掘产生,应用在对用户的某些属性或某些行为进行预测判断。例如根据一个用户的行为习惯判断该用户是男性还是女性,根据一个用户的消费习惯判断其对某商品的偏好程度。该类标签需要通过算法挖掘产生。

3.2 标签分类和层级


按过程划分


3.3 标签命名方式
B110_1_1
首写字母:A代表用户属性标签 B代表用户行为标签 C代表用户偏好标签
110:1标签类型(1分类:下拉框选择的,用户分群下拉框选择、2统计:文本框直接输入值的) 1开发方式(1算法、2统计) 0是否互斥(0否1是)
_1:最后一级标签id
_1 标签值id
4.开发流


5.数据仓库架构


6.标签开发内容
标签分:人口属性标签、用户行为标签、用户偏好标签
6.1 需要开发的表


6.2 数据建模


注意:注册用户表和cookie用户表各一套

6.3 数据字典总目录

数据字典

表明

表注释

数据存储

t_user

用户表

Hive

t_vidact_tag

用户行为明细表

Hive

t_acttype

行为明细类别表

Mysql

t_actweight

行为权重表

Mysql

t_tagtype

标签类型表

Mysql

t_tag_data

标签表

Mysql

t_tag_userid

注册用户标签表

Hive

t_tag_map_userid

注册用户map表

Hive

6.4 权重配置

Id

行为类型

权重

1

浏览

0.65

2

搜索

0.8

3

收藏

0.9

4

关注

0.9

5

评论

0.7

6.5 时间衰减
公式中各参数的释义如下:
· 行为类型权重:用户浏览、搜索、收藏等不同行为对用户而言有着不同的重要性,一般而言操作复杂度越高的行为权重越大。该权重值一般由运营人员或数据分析人员主观给出;
· 时间衰减:用户某些行为受时间影响不断减弱,行为时间距现在越远,该行为对用户当前来说的意义越小;
· 时间衰减公式:F(x)=exp(ln(k)/t)x,其中衰减系数为(ln(k)/t),用来控制时间衰减的幅度。参数为k(预设衰减幅度)、t(预设衰减周期)。自变量为x,表示当然计算日期距离初始日期的间隔时间。
· 行为次数:用户标签权重按天统计,用户某天与该标签产生的行为次数越多,该标签对用户的影响越大;
· TF-IDF计算标签权重:每个标签的对用户的重要性及该标签在全体标签中重要性的乘积得出每个标签的客观权重值;
Tf:表示这个标记次数在用户P所有标签中所占的比重
TF算法:
IDF:表示标签T在全部标签中的稀缺程度,即这个标签的出现几率。如果一个标签T出现几率很小,并且同时被用于标记某用户,这就使得该用户与该标签T之间的关系更加紧密
IDF算法:
用户标签权重:TF*IDF

用户标签权重 = 行为类型权重 × 时间衰减 × 用户行为次数 × TF-IDF计算标签权重

若有收获,就点个赞吧

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

北京大龙哥

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值