- 博客(4)
- 收藏
- 关注
原创 PB级企业电商离线数仓项目实战(下)-HW
1. 用拉链表实现核心交易分析中DIM层商家维表,并实现该拉链表的回滚ODS层数据准备因为需要自己构造数据,我们根据已有的ods_trade_shops 创建一个新的表:create database hw;drop table if exists hw.ods_trade_shops;create table hw.ods_trade_shops( `shopid` int COMMENT '商铺ID', `userid` int COMMENT '商铺负责人', `areaid`
2021-12-20 01:40:25 604
原创 PB级企业电商离线数仓项目实战【上】- notes
PB级企业电商离线数仓项目实战【上】- 笔记第一部分 数据仓库理论数据仓库四大特征面向主题的: 抽象的,逻辑的集成的:为分析服务稳定的: 很少更新,只需定期加载反映历史变化的: 按照时间顺序追加与数据库区别OLTP(On-Line Transaction Processing 联机事务处理),也称面向交易的处理系统。主要针对具体业务在数据库系统的日常操作,通常对少数记录进行查询、修改。用户较为关心操作的响应时间、数据的安全性、完整性和并发支持的用户数等问题。传统的数据库系统作为数据管理的主要
2021-12-05 01:45:55 627
原创 stage-5 mode-1: 电商离线数仓项目实战(上)- hw
stage-5 mode-1: 电商离线数仓项目实战(上)介绍数仓项目实战的笔记作业题1本次作业要求最近七天连续三天的活跃会员数。我才用的是small_startlog小数据集,一共是三天的log:其中一天的log大概是9k~1w条数据。那么分析得一下步骤:数据采集自定义拦截器, 对数据进行一定的分类并获取时间 public Event intercept(Event event) { Map<String, String> headersMap =
2021-12-05 00:35:05 1265
原创 Stage1-Mode2
Task 1 对象和面向对象本质:类的实例化。在堆区申请一块内存空间,用于存放该对象的独有特征信息。如果没有名字:匿名对象。要起名的话需要引用(引用型变量):引用变量用于记录对象在堆区的内存地址信息。引用变量在栈区,存的就是堆区对应的地址。当使用成员变量时,七种基本数据类型默认值都是0,boolean是 false。String是null类写好了之后,是放在方法区里的。程序运行先找main 方法,在栈区(有main自己的局部变量等)。栈区对应的new的内容存的是对象在堆区的地址返回值:...
2021-03-24 23:53:53 155
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人