hive合并小文件

最新推荐文章于 2024-08-05 17:56:25 发布

早点起床晒太阳

最新推荐文章于 2024-08-05 17:56:25 发布

阅读量437

点赞数

分类专栏： hive 文章标签： hive

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zeng6325998/article/details/110940897

版权

hive 专栏收录该内容

11 篇文章 0 订阅

订阅专栏

参考资料:https://blog.csdn.net/lalaguozhe/article/details/9053645

我们这边改为底层数据改成hive的parquet表，需要我们这边弄下优化小文件相关，特意总结下

最终参数

SET parquet.compression = snappy; //设置压缩专门针对于stored as parquet的情况
set hive.merge.mapfiles=true; //map-only 时合并
set hive.merge.mapredfiles = true; //mapreduce 时合并
//map端合并
set hive.input.format=org.apache.hadoop.hive.ql.io.CombineHiveInputFormat;
set mapred.max.split.size=256000000;
//reduce端合并
set hive.merge.size.per.task=256000000;
set hive.merge.smallfiles.avgsize=80000000;

早点起床晒太阳

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

早点起床晒太阳 CSDN认证博客专家 CSDN认证企业博客

码龄7年

94: 原创

6万+: 周排名

185万+: 总排名

18万+: 访问

: 等级

2105: 积分

13: 粉丝

48: 获赞

23: 评论

208: 收藏

私信

关注

分类专栏

spark 26篇
docker 1篇
java 6篇
elasticsearch 3篇
hive 11篇
linux 6篇
git 5篇
数据库 8篇
jvm 3篇
多线程 3篇
logback 4篇
其他 3篇
flink 2篇
presto 3篇
mysql 2篇
数据结构 1篇
hadoop 1篇
通信 1篇
日志管理 1篇
互联网 3篇
maven 1篇

最新评论

Jdbc访问hive
SILIII: 引用「发生的原因是由于 maven打的jar中hive-jdbc的版本是1.2.1，但是程序中的hive版」那要怎么改呢
presto的hive connector连接以及JDBC访问(包含kerberos方式)
wanghai159: 请问能否连接多个hive，一些hive带有kerberos，另一些hive不带有kerberos，我在配置带有kerberos的hive后，select查询不带有kerberos的hive报错：Failed on local exception: java.io.IOException: Server asks us to fall back to SIMPLE auth, but this client is configured to only allow secure connections.
hive JDBC的url的不同写法
w1047667241: [code=plain] 补充： url 中如果有自定义属性，必须设置数据库/ 比如 jdbc:hive2://${host}:${hive.port}/default;fromSys=fin; 上面的 fromSys=fin; 就是我自定义的，标识连接的请求系统 [/code]
kerberos认证下hadoop的java应用程序超时分析
micheal_hlishao: 意思只有这三个版本修复了这个bug？我2.7.3也出现这个问题
FTP和SFTP介绍(常见的和java代码遇到的问题)
小仙女_cxy: sftp inputstream is closed 嗨，这个问题怎么解决的啊？能放下解决的代码吗？谢谢了

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。