画像系统主要做了哪些事
1)用户信息标签化
2)对标签化的数据的应用(分群、洞察分析)
3)标签如何建模的,有哪些标签
根据用户需求,协调产品经理一起规划了四级标签。前两级是分类,第三级是标签,第四级是标签值。
项目整体架构
讲一下标签计算的调度过程
整个标签的批处理过程
四个任务:
(1)通过根据每个标签的业务逻辑编写 SQL,生产标签单表。
(2)把标签单表合并为标签宽表。
(3)把标签宽表导出到 Clickhouse 中的标签宽表。
(4)把 Clickhouse 中的标签表转储为 Bitmap 表。
四个任务通过编写 Spark 程序完成。并通过画像平台调度,以后新增标签只需要在平台填写标签定义、SQL 及相关参数即可。
你们的画像平台有哪些功能 ?
(1)标签定义
(2)标签任务设定
(3)任务调度
(4)任务监控