用户画像
Sunny️
人生在勤,不劳何获。
展开
-
用户画像系列第九篇:应用案例之表结构设计
本文摘自赵宏田老师的:“用户画像:方法论与工程化解决方案”。表结构的设计也是画像开发过程中,需要解决的一个重要的问题。表结构设计的重点是要考虑:储存哪些信息、如何储存、如何应用这三个方面的问题。不同的业务背景有不同的设计方式,这里提供两个设计思路:一是每日全量数据的表结构;二是每日增量数据的表结构。每日全量数据,即该表的日期分区中,记录这截止到当天的全量用户数据,日全量数据的优势是方便查询,缺点是不便与探查更细粒度的用户行为。每日增量数据,即该表日期分区中记录着当日的用户行为数据,日增量数据可视为OD.原创 2020-06-01 23:25:12 · 2040 阅读 · 0 评论 -
用户画像系列第八篇:应用案例之源表介绍
本文摘自赵宏田老师的:“用户画像:方法论与工程化解决方案”。在本案例中,可以获取到的源数据,可以分为:业务数据和用户行为数据两种。其中业务数据是指:用户在平台上下单、购买、收藏物品、货物配送等与业务相关的数据。用户行为数据是指:用户搜索某条信息、访问某个页面、点击某个按钮、提交某个表单等通过操作产生的数据(一般存在日志的埋点表中)。用到用户仓库中的表主要有:用户信息表、商品订单表、图书信息表、图书类目表、App端日志表、Web端日志表、商品评论表等。下面就对这些用到的数据表进行详细的介绍。用户信息表.原创 2020-05-29 14:12:30 · 704 阅读 · 0 评论 -
用户画像系列第七篇:应用案例之背景介绍
本文摘自赵宏田老师的:“用户画像:方法论与工程化解决方案”。某图书电商网站拥有超过千万的网购用户群体,所售各品类图书100余万种。用户在平台上可进行浏览、搜索、收藏、下单、购买等行为。商城的运营需要解决两个问题: 一方面在企业产品线逐渐扩张、信息资源过载的情况下,如何更好的满足消费者的需求,为用户带来更个性化的购物体验,通过内容的精准推荐,更好的提高用户的点击转化率。另一方面,在保证用户规模不断增长的目标下,运营方考虑建立用户流失预警机制,及时识别将要流失的用户群体,及时采取运营策略换回用户。自商城.原创 2020-05-28 17:03:18 · 1166 阅读 · 0 评论 -
用户画像系列第六篇:各阶段关键产出
本文摘自赵宏田老师的:“用户画像:方法论与工程化解决方案”。为保障程序上线的准时性和稳定性,需要规划好各个阶段的任务排期和关键产出。用户画像体系的开发,分为几个主要阶段,包括前期指标体系梳理、用户标签开发、ETL调度开发、打通数据服务层、画像产品端开发、面向业务方推广应用、为业务方提供营销策略的解决方案等。如下表所示:用户画像项目各个阶段的关键产出...原创 2020-05-27 10:53:29 · 780 阅读 · 0 评论 -
用户画像系列第五篇:开发上线流程
本文摘自赵宏田老师的:“用户画像:方法论与工程化解决方案”。用户画像项目建设流程,主要分为以下几个阶段:第一阶段:目标解读在建立用户画像之前,首先需要明确的是,用户画像服务于企业的对象,再根据业务方需求,明确未来产品建设目标和用户画像分析之后的预期效果。一般而言,用户画像的服务对象,包括运营人员和数据分析人员。不同的业务方,对用户画像的需求侧重点也不一样。就运营分析人员来说,他们需要分析用户特征、定位用户行为偏好,做商品或内容的个性化推送,以提高点击转化率,所以画像的侧重点就落在用户的个人行为偏.原创 2020-05-26 15:38:07 · 583 阅读 · 0 评论 -
用户画像系列第四篇:方案模块
本文摘自赵宏田老师的:“用户画像:方法论与工程化解决方案”。搭建一套用户画像系统,整体的方案需要考虑8个模块的建设。用户画像主要模块用户画像基础: 需要了解、明确用户画像是什么、包含那些模块、数据仓库架构是什么样子、开发流程、表结构设计、ETL设计等。这些都是系统框架、系统规划。只有明确了方向和计划,后续才能做好项目排气和人员投入预算。这些规划对于评估每个开发阶段的重要指标和关键产出也非常重要。数据指标体系: 根据业务线,梳理出包括用户属性、用户行为、用户消费、风险控制等纬度的指标体系。标签.原创 2020-05-25 11:56:37 · 778 阅读 · 0 评论 -
用户画像系列第三篇:数据架构
本文摘自赵宏田老师的:“用户画像:方法论与工程化解决方案”。在用户画像的整个工程化解决方案中,整个系统依赖的基础设施包括Spark、Hive、HBase、Airflow、MySQL、Redis、Elasticsearch等基础设施。除去这些基础设施外,系统主体还包括SparkStreaming、ETL、产品端这三个重要的组成部分。下图是一个用户画像数仓的架构图。用户画像数仓架构图中最下方的虚线框中的内容,是常见的数据仓库ETL加工流程,也就是将每日的业务数据、日志数据、埋点数据等经过ETL处理,.原创 2020-05-23 22:19:34 · 1224 阅读 · 0 评论 -
用户画像系列第二篇:标签类型
本文摘自赵宏田老师的:“用户画像:方法论与工程化解决方案”。用户画像建模其实就是给用户“打标签”。从给用户打标签的方式来看,一般分为三种类型:1、统计类型标签;2、规则类标签;3、机器学习类标签。下面我们介绍下这三种标签的区别:统计类标签: 这类标签是最为基础也最为常见的标签类型。例如:对于某个用户来说,其性别、年龄、城市、星座、近7日活跃时长、近7日活跃天数、近7日活跃次数等字段,可以从用户的注册数据、用户访问数据、消费数据中统计得出。该类标签是构成用户画像的基础。...原创 2020-05-22 16:08:59 · 4249 阅读 · 0 评论 -
用户画像系列第一篇:画像简介
本文摘自赵宏田老师的:“用户画像:方法论与工程化解决方案”。用户画像,即用户信息标签化。通过收集用户的社会属性、消费习惯、偏好特征等各个维度的数据,进而对用户或者产品的特征进行刻画,并对这些特征进行统计、分析、挖掘潜在的价值信息,从而抽象出用户信息的全貌。某用户标签化用户画像可以作为企业应用大数据的根基,是定向广告投放与个性化推荐的前置条件,为数据驱动运营奠定了基础。由此看来,如何从海量的数据中有价值的信息越发重要。大数据已兴起多年,其对于互联网公司的应用来说,已经如水、电、空气对人们的生活一.原创 2020-05-21 16:02:45 · 911 阅读 · 1 评论