真实案例,手把手教你构建用户画像

导读:本文通过一个贯穿本书的实践案例来将大家更好地带入实际开发画像、应用画像标签的场景中。本文主要介绍案例背景及相关的元数据,以及开发标签中可以设计的表结构样式。

在本案例的开发工作中,基于Spark计算引擎,主要涉及的语言包括HiveQL、Python、Scala、Shell等。

作者:赵宏田

来源:大数据DT(ID:hzdashuju)

41e43bd45b03c70e09d8e546cac5beeb.png

01 案例背景介绍

某图书电商网站拥有超过千万的网购用户群体,所售各品类图书100余万种。用户在平台上可进行浏览、搜索、收藏、下单、购买等行为。商城的运营需要解决两个问题:

  • 一方面在企业产品线逐渐扩张、信息资源过载的背景下,如何在兼顾自身商业目标的同时更好地满足消费者的需求,为用户带来更个性化的购物体验,通过内容的精准推荐,更好地提高用户的点击转化率;

  • 另一方面在用户规模不断增长的背景下,运营方考虑建立用户流失预警机制,及时识别将要流失的用户群体,采取运营措施挽回用户。

商城自建立以来,数据仓库中积累着大量的业务数据、日志数据及埋点数据。如何充分挖掘沉淀在数据仓库中的数据的价值,有效支持用户画像的建设,成为当前的重要工作。

02 相关元数据

在本案例中,可以获取的数据按其类型分为:业务类数据和用户行为数据。其中业务类数据是指用户在平台上下单、购买、收藏物品、货物配送等与业务相关的数据;用户行为数据是指用户搜索某条信息、访问某个页面、点击某个按钮、提交某个表单等通过操作行为产生(在解析日志的埋点表中)的数据。

涉及数据仓库中的表主要包括用户信息表、商品订单表、图书信息表、图书类目表、App端日志表、Web端日志表、商品评论表等。下面就用户画像建模过程中会用到的一些数据表做详细介绍。

1. 用户信息表

用户信息表(见表1-2)存放有关用户的各种信息,如用户姓名、年龄、性别、电话号码、归属地等信息。

▼表1-2 用户信息表(dim.user_basic_info)

08ec4b79aa75efbbf4a68a0108389e88.png

2. 商品订单表

商品订单表(见表1-3)存放商品订单的各类信息,包括订单编号、用户id、用户姓名、订单生成时间、订单状态等信息。

▼表1-3 商品订单表(dw.order_info_fact)

f4710787f3eac53b2b7f45c3148058ca.png

  • 1
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
构建自己的Linux系统是一项有趣和有挑战性的任务。下面是一个简单的手把手程,帮助你构建自己的Linux系统,并将其整理成PDF格式。 步骤一:准备工作 首先,你需要准备将要构建Linux系统的计算机。确保计算机具备足够的计算资源,并且有足够的存储空间来存放操作系统。 步骤二:选择合适的Linux发行版 选择适合你需求的Linux发行版。你可以选择像Ubuntu、CentOS或者Arch Linux这样的流行发行版,也可以选择构建自己的自定义发行版。 步骤三:下载Linux发行版的源代码 前往所选择的发行版官方网站,下载源代码。这些源代码通常以tar包的形式提供。 步骤四:解压源代码 使用适当的解压工具解压源代码。你将得到一个包含源代码树的文件夹。 步骤五:配置和编译源代码 根据不同的发行版,有不同的配置和编译选项。查看源代码中的README文件以获取更多信息。通常,你需要运行"./configure"命令生成Makefile,然后运行"make"命令来编译源代码。 步骤六:安装编译后的文件 完成编译后,你可以通过运行"make install"命令将编译的文件安装到系统中。确保你有足够的权限来执行此操作。 步骤七:配置你的系统 完成安装后,你需要配置你的系统。这可能包括设置网络、安装和配置软件包、配置用户帐户等等。根据你的需求和偏好进行配置。 步骤八:测试和优化 在配置完成后,你应该进行测试以确保系统正常运行。测试网络连接、软件包安装等功能。根据需要进行优化,以提高系统的性能和稳定性。 步骤九:整理PDF文档 将你的构建过程整理成PDF文档,可以使用文档编辑工具,如Microsoft Word或Google Docs,将需要的内容整理成适合打印或分享的PDF格式。 完成以上步骤,你将成功构建自己的Linux系统,并将其整理成PDF格式。记得保存你的PDF文档,以备将来参考或与他人分享。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值