大数据培训课程:Hive配置总结

# ------------------配置相关--------------------------

0. 配置存储

在$HOME目录下的.hiverc文件中

1. 在提示符中显示数据库名

set hive.cli.print.current.db=true;

 

2. 优先使用本地模式执行

set hive.exec.mode.loacl.auto=true;

 

3. 打印列名

set hive.cli.print.header=true;

 

4. (非)严格模式

set hive.mapred.mode=strict;

set hive.mapred.mode=nonstrict;

 

5. 开启动态分区

set hive.exec.dynamic.partition=true;

 

# --------------动态分区调整--------------------

6.-- 设置动态分区模式

set hive.exec.dynamic.partition.mode=strict

 

7.-- 设置总的动态分区个数

set hive.exec.max.dynamic.partitions=300000

 

8.-- 设置每个节点上动态分区个数

set hive.exec.max.dynamic.partitions.pernode=10000

 

9. 设置全局可以产生文件的个数

set hive.exec.max.created.files=100000;

 

10.开启map site join

set hive.auto.convert.join=true;

 

11.设置小表大小(字节)

set hive.mapjoin.smalltable.filesize=25000000

 

12.强制将数据按照桶结构定义来插入数据

set hive.enforce.bucketing=true

 

13.limit优化

-- 启用limit优化

set hive.limit.optimize.enable=true;

-- 限制从最大多少条数据中进行limit

set hive.limit.row.max.size=10000;

-- 限制最多遍历的文件个数

set hive.limit.optimize.limit.file=10;

 

14. 压缩

--开启中间压缩(即map到reduce之间的数据压缩)

set hive.exec.compress.intermediate=true;

-- 开启hadoop中间压缩(即map到reduce之间的数据压缩)

set mapred.compress.map.output=true;

-- 开启hive最终压缩(即reduce输出的数据压缩)

set hive.exec.compress.output=true;

 

4. 数据仓库的存储地址

      hive-default.xml中,不一般不同

      <property>

             <name>hive.metastore.warehouse.dir</name>

             <value>/user/hive/warehouse</value>

             <description>location of default database for the warehouse</description>

      </property>

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

程序员日常

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值