综合项目1-01 项目背景与业务数据

(本项目为涛哥数据运营系统学习笔记)

1、项目背景

1.1 整体背景:

​ 需求1:需要针对线上访问行为、消费行为、业务行为进行统计分析!以支撑公司的业务运营,提高业务转化率,改善公司运营效果!

​ 解决:构建一个数仓系统,作为数据的管理和运算中心、数据存档、各种统计、运算任务的核心平台。


​ 需求2:基于数仓,针对每个用户进行精准营销,个性化推荐,改善用户体验、提高用记粘性、增大销售额。

​ 解决:对用户进行精准用户画像(深入分析用户后给用户打上各种规范标签:年龄、性别、地域特征、偏好特征、价值指数、行为习惯、消费习惯……)


​ 需求3:基于画像,开发推荐系统,用于支撑精细化营运:

​ 如:针对不同的人群发放不同的优惠券,定制不同的打折规则、推行不同的营销活动、针对流失率大的人群进行挽留。

​ 针对不同的人,不同的场景推荐不同的物品。


技术:可进行离线计算:如用户画像计算时间跨度长的,运算量大的任务

​ 可实时计算:统计推荐系统的营销手段进行实时效果反馈,运算相对简单的需求

 

1.2 技术架构

第一步:数据采集:数据源

​ 1、pc埋点,手机端埋点日志:使用Flume集群

​ 2、业务系统数据库:Sqoop

Flume:读取埋点日志传输到HDFS(离线)或Kafka(实时)

Sqoop:从业务数据库把数据进行迁移过来

第二步:对数据进行预处理(从非结构化转结构化)

​ 1、数据清洗

​ 2、信息回补(数据缺失)

​ 3、JSON解析

​ 4、GUID生成(同一个人数据全局区分开)

​ 5、数据集成等

第三步:数仓ODS层(结构化存储)加载到HIVE

​ 1、PC端埋点日志表

​ 2、移动端埋点日志表

​ 3、用户注册信息表

​ 4、订单信息表……

第四步:数仓DWD层(从ODS层算出来的中间表)、DWS层

​ 1、事件全量明细

​ 2、交互事件明细

​ 3、物流信息表

​ 4、广告事件明细

​ 5、商品信息表

​ 6、评论信息表

​ 7、流量事件明细

​ 8、订单信息表

第五步:数仓ADS层(从DWD中继续分析的层

​ 1、流量多维报表

​ 2、用户留存报表

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

pub.ryan

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值