Hive SQL查询结果写入指定hdfs路径

最新推荐文章于 2023-05-22 08:00:00 发布

zx_love

最新推荐文章于 2023-05-22 08:00:00 发布

阅读量1w

点赞数 3

分类专栏：大数据 HIVE

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zx_blog/article/details/80599259

版权

大数据同时被 2 个专栏收录

16 篇文章 0 订阅

订阅专栏

5 篇文章 0 订阅

订阅专栏

将hive查询结果写入指定hdfs路径下：

set mapred.reduce.tasks = 1;
insert overwrite directory '/xx/xx/'
ROW FORMAT DELIMITED FIELDS TERMINATED BY '~'
select cols...
from tableName
where conditions...
distribute by rand();

设置task数 set mapred.reduce.tasks = 1; 结果数据平均分区（分区数等于task数）distribute by rand();此时结果保存在一个文件中。结果数据每行以“~”分隔 ROW FORMAT DELIMITED FIELDS TERMINATED BY '~'。

如果结果数据不大（需要保存在一个或较少的几个文件）但计算量较大，tasks=1运行较慢，可以将结果先写入一张中间hive表，再调度tasks=1的任务将中间表中数据写入指定路径。

关注

3
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
Hive SQL查询结果写入指定hdfs路径

将hive查询结果写入指定hdfs路径下：set mapred.reduce.tasks = 1;insert overwrite directory '/xx/xx/'ROW FORMAT DELIMITED FIELDS TERMINATED BY '~'select cols...from tableNamewhere conditions...distribute by ran...
复制链接

扫一扫

专栏目录

zx_love CSDN认证博客专家 CSDN认证企业博客

码龄11年

78: 原创

6万+: 周排名

186万+: 总排名

23万+: 访问

: 等级

2340: 积分

30: 粉丝

45: 获赞

9: 评论

167: 收藏

私信

关注

热门文章

分类专栏

大数据 16篇
Java 10篇
HIVE 5篇
python 1篇
数据库 4篇
贪心 5篇
ACM 36篇
动态规划 3篇
并查集 10篇
最小生成树 2篇
模拟 1篇
数位DP 5篇
线段树 5篇
母函数 7篇
游戏设计 1篇
BFS

最新评论

实现童年梦想——RPG游戏入门（RPG制作大师使用教程）
weixin_43770616: 感谢
Hadoop与Spark并行度设置问题（mr、spark任务提交参数的设置、spark-submit参数调优）
zx_love 回复 Ink__Bamboo: 读取文件的并行度是取决于文件存储的block数量；spark任务执行的并行度是根据spark参数、spark执行算子中指定的并行度来控制的（如果不指定，那默认实际执行的并行度和文件读取的并行度是一致的）。意义是在于，很多人在spark任务实际执行的算子中不去指定这个并行度，导致实际执行的并行度是由文件存储时block数决定，导致并行度的不合理；如果一个会被经常使用的文件他的block数不合理，建议是重新读写一遍，重新改变他的并行度，可以避免每次使用时需要重分区的shuffle操作
Hadoop与Spark并行度设置问题（mr、spark任务提交参数的设置、spark-submit参数调优）
Ink__Bamboo: 如果spark启动并行度大于读取文件的block数量，那实际的并行度是多少啊？？若读取文件block数远大于并行度那实际的并行度又是多少啊
实现童年梦想——RPG游戏入门（RPG制作大师使用教程）
凌晨小街: 博主，我按照你的来调试为什么没有npc啊
实现童年梦想——RPG游戏入门（RPG制作大师使用教程）
凌晨小街: 大佬感谢啊

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。