Hive常用命令及设置

Hive常用命令及设置


alter table ad_app.app_accounting_daily add columns (return_cost bigint) cascade;


数据倾斜

set hive.map.aggr=true;

set hive.groupby.skewindata=true;


set mapreduce.job.queuename = root.data.adonline;


set mapred.reduce.tasks=8192;

set mapreduce.job.priority=VERY_HIGH;

Set hive.groupby.mapaggr.checkinterval = 100000


set mapred.output.compression.codec=org.apache.hadoop.io.compress.GzipCodec;

set mapred.map.output.compression.codec=org.apache.hadoop.io.compress.GzipCodec;

set hive.exec.compress.intermediate=true;

set mapred.compress.map.output=true;


set mapred.max.split.size=256000000;        -- 决定每个map处理的最大的文件大小,单位为B

set mapred.min.split.size.per.node=1;         -- 节点中可以处理的最小的文件大小

set mapred.min.split.size.per.rack=1;    



控制map数量

set mapred.max.split.size=128000000;

set mapred.min.split.size.per.node=64000000;

set mapred.min.split.size.per.rack=64000000;

set hive.input.format=org.apache.hadoop.hive.ql.io.CombineHiveInputFormat;


设置reducer最大个数

set hive.exec.reducers.max=8192;



控制map reduce内存

set mapreduce.map.memory.mb=4096;

set mapreduce.reduce.memory.mb=4096;

set mapreduce.reduce.java.opts=-Xmx3800M;

set mapred.child.map.java.opts=-Xmx3800M;

set mapreduce.map.java.opts=-Xmx3800M;


ALTER TABLE table_name ADD IF NOT EXISTS PARTITION (dt='20130101') LOCATION '/user/hadoop/warehouse/table_name/dt=20130101'; //一次添加一个分区



  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值