- 博客(5)
- 收藏
- 关注
原创 (从电商项目认识数仓体系五)业务术语定义及系统函数
1 术语解释a.用户:用户以设备为判断标准,在移动统计中,每个独立设备认为是一个独立用户。Android系统根据IMEI号,IOS系统根据OpenUDID来标识一个独立用户,每部手机一个用户。b.新增用户:首次联网使用应用的用户。如果一个用户首次打开某app,那这个用户定义为新增用户;卸载再安装的设备,不会被算作一次新增。新增用户包括日新增用户、周新增用户、月新增用户。c.活跃用户:打开应用的用户即为活跃用户,不考虑用户的使用情况。每天一台设备打开多次会被计为一个活跃用户。d.周(月)活跃用
2020-06-30 20:38:30
568
原创 (从电商项目认识数仓体系三)行为数仓数据路径
1 日志采集(1)日志在生成之后分发时,对于本项目来说会分发至kafka,而kafka中会有多个主题,某些公司甚至会一张表一个主题进行分发,对于本项目来说分为两个主题,一个start主题,一个event主题(2)图示注释:(1)TailDir有断点续传功能2 拦截器(1)interceptor配置a1.sources.s1.interceptors=i1 i2a1.sources.s1.interceptors.i1.type=自己的jar包a1.sources.s1
2020-06-05 18:12:09
320
原创 (从电商项目认识数仓体系二)行为数仓数据格式及表
1 埋点数据基本格式公共字段:基本所有手机都包含的字段 业务字段:埋点上报字段,有具体的业务类型ps:一般使用json格式json格式示例:{"ap":"xxxxx",//产品字段 app key"cm":{ //公共字段 "mid": "", //(String) 设备唯一标识 "uid": "", //(String) 用户标识 "vc": "1", //(String) versionCode,程序版本号 "vn": "1.0", //(Strin
2020-06-05 15:27:12
618
原创 (从电商项目认识数仓体系一)数仓介绍
1 基本流程图2 基本介绍数据仓库(Data Warehouse),简写为DW或DWH,为企业做决策提供系统数据支持的集合。例:仓库中一个指标为用户浏览网页次数(UV),如果用户多次浏览该网页,如果是电商系统,则可以认为该用户有购买该商品意向,可对该用户进行商品推荐,或者可作为报表提供给决策层进行一些决策数据仓库的作用并不单单是存储,而是对数进行一些处理后,将处理后的数据,分门别类的存储,作为能够支撑业务或者分析的处理后数据源,使得对应的需求能够从对应的主题中直接提取所需要的数据,这些处理包
2020-06-04 17:33:10
2005
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅