- 博客(5)
- 收藏
- 关注
原创 【无标题】
map shuffle阶段:每个map task一边处理切片中的数据,一边将数据写入内存的环形缓冲区中,缓存区默认是100m,每当内存缓冲区中写入的数据达到阈值0.8之后,会将内存中的数据溢写到磁盘,在溢写的过程中会对数据进行hash分区和快速排序,多个磁盘小文件会进行归并排序合并成一个大文件。进入sql-client创建ads的表,指定数据存储路径为mysql中指标表的路径,对dwd的表和dim的宽维表关联,获取需求指标,例如(每天每个省份的订单数);在mysql中创建相应ads的指标表,将数据导入。
2023-07-03 20:33:42 222 1
原创 MYSQL基础笔记
INSERT INTO emp(NAME,gender,salary,join_date,dept_id) VALUES('孙悟空','男',7200,'2013-02-24',1);INSERT INTO emp(NAME,gender,salary,join_date,dept_id) VALUES('唐僧','男',9000,'2008-08-08',2);INSERT INTO dept (NAME) VALUES ('开发部'),('市场部'),('财务部');
2023-07-02 21:36:27 73 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人