本文摘自赵宏田老师的:“用户画像:方法论与工程化解决方案”。
搭建一套用户画像系统,整体的方案需要考虑8个模块的建设。
用户画像基础: 需要了解、明确用户画像是什么、包含那些模块、数据仓库架构是什么样子、开发流程、表结构设计、ETL设计等。这些都是系统框架、系统规划。只有明确了方向和计划,后续才能做好项目排气和人员投入预算。这些规划对于评估每个开发阶段的重要指标和关键产出也非常重要。
数据指标体系: 根据业务线,梳理出包括用户属性、用户行为、用户消费、风险控制等纬度的指标体系。
标签数据存储: 标签相关的数据可以存储在:Hive、MySQL、HBase、Elasticsearch等数据库中,不同的存储方式用于不同的应用场景。
标签数据开发: 标签数据开发是用户画像工程化的重点模块,包含统计类、规则类、挖掘类、流式计算类标签的开发,以及人群计算功能的开发,打通画像数据和各个业务系统之间的通路,提供接口服务等开发内容。
开发性能调优: 标签加工、人群计算等脚本上线调度后,为了缩短调度时间、保障数据的稳定性等,需要对开发的脚本进行迭代重构、调优。
作业流程调度: 标签加工、人群计算、同步数据到业务系统、数据监控预警等脚本开发完成后,需要调度工具把整套流程调度起来。(如开源的Airflow工具)
用户画像产品化: 为了让用户数据更好的服务业务方,需要以产品化的形态应用在业务上。产品化的模块主要包括:标签试图、用户标签查询、用户分群、透视分析等。
用户画像应用: 用户画像的应用场景包括:用户特征分析、短信、邮件、站内信、Push消息的精准推送、客服针对用户的不同话术、针对高价值用户的极速退款等服务和应用。