Hive总结

最新推荐文章于 2024-04-28 09:19:40 发布

麦才坚

最新推荐文章于 2024-04-28 09:19:40 发布

阅读量196

点赞数

分类专栏： hive 文章标签： hive

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_37786726/article/details/80051706

版权

hive 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

Hive的底层结构如下：

1.driver为中心，hql语句经过compiler编译后获取metadata

2.将获取的metadata发送回driver

3.driver根据获取的metadata和hql解析成查询树，做出查询plan，优化计划

4.转化为MapReduce模板

5.获取job执行后的数据

二.hql与SQL的不同点：

1.多表联合的格式：hql只能使用join .... on... ,以on来判断表连接的条件，SQL还可以使用where来判断

2.hive 在使用where语句时，不能使用in函数。

3.hive 排序时order 或者 sort by col1 ，其中col1 需要select col1 ，....coln 中，如果不存在将会报错。

4.hive可以使用UDF ，这个是hive的自定义函数，这个function使用，需继承UDF类，重写excute方法。

三.order与sort的不同：

使用order by会引发全局排序

select * from baidu_click order by click desc;

使用distribute和sort进行分组排序

select * from baidu_click distribute by product_line sort by click desc;

distribute by + sort by就是该替代方案，被distribute by设定的字段为KEY，数据会被HASH分发到不同的reducer机器上，然后sort by会对同一个reducer机器上的每组数据进行局部排序。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

麦才坚 CSDN认证博客专家 CSDN认证企业博客

码龄8年

62: 原创

74万+: 周排名

232万+: 总排名

14万+: 访问

: 等级

1804: 积分

39: 粉丝

50: 获赞

32: 评论

134: 收藏

私信

关注

热门文章

分类专栏

servlet 3篇
oracle 3篇
hadoop 8篇
数据可视化 2篇
hdfs 1篇
spark 6篇
sparkstreaming 1篇
sparkMlib 6篇
storm 4篇
kafka 3篇
flume 1篇
zookeeper 5篇
机器学习基础 22篇
sql 1篇
rpc 1篇
java 1篇
linux 2篇
hive 2篇
数据库 2篇
python 10篇
自然语言处理 1篇
数据结构 1篇
深度学习 3篇
硬件 1篇

最新评论

relocation error 问题解决
宇宙的尽头是编制: 这哥们的方法是杀人呢，救命方法： [code=cpp] root@caojj-PC:/home/caojj/Desktop/deepaidesigner# export LD_PRELOAD=/home/caojj/Desktop/deepaidesigner/lib/libc-2.31.so root@caojj-PC:/home/caojj/Desktop/deepaidesigner# ./AppRun ./AppRun: relocation error: /lib/x86_64-linux-gnu/librt.so.1: symbol __clock_nanosleep version GLIBC_PRIVATE not defined in file libc.so.6 with link time reference root@caojj-PC:/home/caojj/Desktop/deepaidesigner# ldd deepaidesigner 段错误 root@caojj-PC:/home/caojj/Desktop/deepaidesigner# ls ls: relocation error: /lib/x86_64-linux-gnu/libpthread.so.0: symbol __libc_vfork version GLIBC_PRIVATE not defined in file libc.so.6 with link time reference root@caojj-PC:/home/caojj/Desktop/deepaidesigner# unset LD_PRELOAD root@caojj-PC:/home/caojj/Desktop/deepaidesigner# ls AppRun components deepaidesigner default.desktop default.png doc lib plugins qt.conf translations [/code]
relocation error 问题解决
宇宙的尽头是编制: 步骤一.libc问题，先看看你是改动了哪个libc**.so 库我没有改动libc**.so库呀？？？
relocation error 问题解决
南瓜派三蔬: 不管用牙
百度文库爬虫
weixin_46500066: 2280600578@qq.com 大佬可以发一下吗？您的链接失效了
ID3 算法
weixin_42556599: 应该是错了

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。