大数据项目面试之用户画像项目

画像系统主要做了哪些事

1)用户信息标签化

2)对标签化的数据的应用(分群、洞察分析)

3)标签如何建模的,有哪些标签

根据用户需求,协调产品经理一起规划了四级标签。前两级是分类,第三级是标签,第四级是标签值。

项目整体架构

讲一下标签计算的调度过程

整个标签的批处理过程

四个任务:

(1)通过根据每个标签的业务逻辑编写 SQL,生产标签单表。

(2)把标签单表合并为标签宽表。

(3)把标签宽表导出到 Clickhouse 中的标签宽表。

(4)把 Clickhouse 中的标签表转储为 Bitmap 表。

四个任务通过编写 Spark 程序完成。并通过画像平台调度,以后新增标签只需要在平台填写标签定义、SQL 及相关参数即可。

你们的画像平台有哪些功能 ?

(1)标签定义

(2)标签任务设定

(3)任务调度

(4)任务监控

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值