- 博客(3)
- 收藏
- 关注
原创 数据库设计三范式
例如我们再向表中添加一列, 列名为Info, 类型为varchar2, 用于存放雇员的爱好和地址那么该info列就是可再分, 不满足第一范式。
2024-01-09 13:18:21 424
原创 开窗函数及其作用、范式
1. 三种排序都可以全部排序也都可以组内排序, 主要看需求2. 三种排序的区别不重复排名123rank()重复且跳过113重复不跳过112。
2024-01-09 00:13:44 7070
原创 Hive SQL
-一般在hadoop集群上运行一个MapReduce会有以下步骤: input-> Map-> shuffle(落盘) -> reduce -> output。-- 如果我们采用了数据压缩,在map阶段产生的数据大小就会减少,会减少磁盘的IO,同时还能够减少网络的IO。数据文件的存储有不同的存储格式(textfile orc parquet...)1. TextFile ---Defaul 默认存储格式。Hive中数据源文件的常见存储格式有三种。2. ORC压缩格式。每种存储格式下又有不同的压缩算法。
2024-01-08 21:35:35 340
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人