自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 PB级企业电商离线数仓项目实战(下)-HW

1. 用拉链表实现核心交易分析中DIM层商家维表,并实现该拉链表的回滚ODS层数据准备因为需要自己构造数据,我们根据已有的ods_trade_shops 创建一个新的表:create database hw;drop table if exists hw.ods_trade_shops;create table hw.ods_trade_shops( `shopid` int COMMENT '商铺ID', `userid` int COMMENT '商铺负责人', `areaid`

2021-12-20 01:40:25 604

原创 PB级企业电商离线数仓项目实战【上】- notes

PB级企业电商离线数仓项目实战【上】- 笔记第一部分 数据仓库理论数据仓库四大特征面向主题的: 抽象的,逻辑的集成的:为分析服务稳定的: 很少更新,只需定期加载反映历史变化的: 按照时间顺序追加与数据库区别OLTP(On-Line Transaction Processing 联机事务处理),也称面向交易的处理系统。主要针对具体业务在数据库系统的日常操作,通常对少数记录进行查询、修改。用户较为关心操作的响应时间、数据的安全性、完整性和并发支持的用户数等问题。传统的数据库系统作为数据管理的主要

2021-12-05 01:45:55 627

原创 stage-5 mode-1: 电商离线数仓项目实战(上)- hw

stage-5 mode-1: 电商离线数仓项目实战(上)介绍数仓项目实战的笔记作业题1本次作业要求最近七天连续三天的活跃会员数。我才用的是small_startlog小数据集,一共是三天的log:其中一天的log大概是9k~1w条数据。那么分析得一下步骤:数据采集自定义拦截器, 对数据进行一定的分类并获取时间 public Event intercept(Event event) { Map<String, String> headersMap =

2021-12-05 00:35:05 1265

原创 Stage1-Mode2

Task 1 对象和面向对象本质:类的实例化。在堆区申请一块内存空间,用于存放该对象的独有特征信息。如果没有名字:匿名对象。要起名的话需要引用(引用型变量):引用变量用于记录对象在堆区的内存地址信息。引用变量在栈区,存的就是堆区对应的地址。当使用成员变量时,七种基本数据类型默认值都是0,boolean是 false。String是null类写好了之后,是放在方法区里的。程序运行先找main 方法,在栈区(有main自己的局部变量等)。栈区对应的new的内容存的是对象在堆区的地址返回值:...

2021-03-24 23:53:53 155

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除