使用impala重新插入数据解决hdfs入库中得小文件问题

1.使用得impala插入方式解决:

set parquet_file_size=512M; --此处加上可以使得hdfs目录下文件大小控制为512M。若不加则默认配置文件中得最大值。
insert overwrinte table databases.table partition(sf,rq)  --此处动态分区可以达到缩小文件数目得目的,若改为sf='3333',rq='20230101' 没有动态效果好
select
id,
sj,
qian,
rk,
ck,
huohe,
sf,    --此处若不是动态分区形式,则需去掉
rq     --此处若不是动态分区形式,则需去掉
from  databases.table2 
where sf='${var:SF}'
and rq='${var:RQ}'

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值