数仓 用户画像
1.背景
- 在数仓开发中,主要目的就是2个,一个是基于现有数据提炼出规律和信息,一个是基于现有数据训练模型,然后预测未来的数据。
- 用户画像属于前者,但由于画像的特殊性,如果一个人的画像标签较多,较完善,其实可以一定程度预测其未来行为规律。
- 具体可以看《夏洛克》中的心理侧写,就是一样的道理,一个人有哪些特质,喜爱,偏好,憎恶等等,就可以一定程度预测这个人在某个场景下的行为规律。
- 用户画像中,需要使用标签来给用户打标签,如果需要完整画像,还需要有模型来给各个标签一定权重,一定的算法。
- 标签可以分为事实标签和模型标签,事实标签一般从业务数据和行为日志数据中通过数据处理分析可以提取出来,模型标签则需要利用到算法来提取。
2. 画像
- 对于一个业务来说,如何能够更好了解客户,分析用户特征,得到用户的特点。这样就可以基于这些特点,对用户进行画像,类似心理学的侧写
- 了解客户之后,就可以针对性做运营促销等操作,这也是这几年的精准营销,精准广告的基础。将合适的内容推送给合适的用户,这样可以更加有效地提升营业额,提升效益成本地比例。
- 画像最重要就是得到用户标签,而这些标签可以分为几类
- 事实标签
事实标签,顾名思义,就是用户历史数据中提炼出来地,真实发生过地。如订单记录,退货记录,打开app频次,活跃度,浏览和购买品类偏好,访问时长,消费平均额等等
- 模型标签
模型标签,顾名思义,使用到了算法和机器学习等技术,通过用户旧地数据,训练出地算法模型,评估预测用户的属性。
如用户性别,用户流式风险,用户质量等级等等标签
- 决策标签