hive参数优化-01

最新推荐文章于 2024-01-07 16:19:32 发布

Niki20034655

最新推荐文章于 2024-01-07 16:19:32 发布

阅读量158

点赞数

文章标签：大数据

原文链接：http://www.cnblogs.com/shenjie2017/articles/10300396.html

版权

参数优化

--启用限制
set hive.limit.optimize.enable=true
--限制最大记录行数为10万条，必须要开启启动限制才会生效
set hive.limit.row.max.size=100000
--限制最大文件数为10个，必须要开启启动限制才会生效
set hive.limit.optimize.limit.file=10


--运行速度优化,对于小的数据量,则自动使用本地数据
set hive.exec.mode.local.auto=true


--开启hive的并行运行
set hive.exec.parallel=true


--配置hive的严格模式(strict)和非严格模式(nostrict)
hive.mapred.mode=nonstrict


--设置mapreducer为本地模式(local)和集群模式(cluster)
set mapred.job.tracker=local


--配置mapreduce为并行执行
set hive.exec.parallel=false


--配置动态分区为非严格模式(nostrict，可以指定变量)和严格模式(strict，必须是参数值)
set hive.exec.dynamic.partition.mode=nostrict
--配置最大分区数
set hive.exec.max.dynamic.partitions=1000
--配置每个MR上可创建的最大分区数
set hive.exec.max.dynamic.partitions.pernode=100

--配置hive的推测执行，如果要配置mapreduce的推测执行，则需要配置mapred.map.tasks.speculative.execution=true和mapred.reduce.tasks.speculative.execution=true
--set hive.mapred.reduce.tasks.speculative.execution=true

转载于:https://www.cnblogs.com/shenjie2017/articles/10300396.html

Niki20034655

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
hive参数优化-01

参数优化--启用限制set hive.limit.optimize.enable=true--限制最大记录行数为10万条，必须要开启启动限制才会生效set hive.limit.row.max.size=100000--限制最大文件数为10个，必须要开启启动限制才会生效set hive.limit.optimize.limit.file=10--运行速度优化,对于小的数...
复制链接

扫一扫