Hive进阶（二）

最新推荐文章于 2022-11-20 17:39:35 发布

望隐少年

最新推荐文章于 2022-11-20 17:39:35 发布

阅读量255

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u011495642/article/details/83928932

版权

上次课复习：

1. hive的view非常简单，只是元数据层面，所以hdfs下根本找不到的。

view主要用于复杂逻辑的隐藏

2. 侧视图

行转列专置

3. select 用于查询后面可以跟where limit等条件

多用Common Table Expression来代替子查询，思路清晰

4. join

内连接左外连接右外连接全连接

in not in

exists

5.纵向合并union

union去重

union all不去重，速度快

6. hive数据加载和交换

load 相当于剪切，只能运行一次

insert into/overwrite values （，，）

insert into as select ....

还可以form 从一个公共表多次插入

7. order by比较慢尽量提前过滤数据

SORT BY 单台机器上排序

DISTRIBUTE BY 对数据分组到不同机器上

8. GROUP BY 局限性在于select的列必须出现在GROUP BY后面

having 筛选聚合函数的条件

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Hive进阶（二）

上次课复习：1. hive的view非常简单，只是元数据层面，所以hdfs下根本找不到的。view主要用于复杂逻辑的隐藏2. 侧视图行转列专置3. select 用于查询后面可以跟where limit等条件多用Common Table Expression来代替子查询，思路清晰4. join内连接左外连接右外连接全连接in not inex...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。