hive 配置参数详细说明

最新推荐文章于 2023-04-19 14:07:30 发布

Chuck_lee

最新推荐文章于 2023-04-19 14:07:30 发布

阅读量728

点赞数

分类专栏： hive 文章标签： hive

本文链接：https://blog.csdn.net/lhzblog/article/details/42743645

版权

本文深入探讨了Hive的配置参数，包括其作用、设置方法及最佳实践。通过理解这些参数，可以优化Hive的性能，提升大数据处理效率。

摘要由CSDN通过智能技术生成

    hive.exec.mode.local.auto 
    决定 Hive 是否应该自动地根据输入文件大小，在本地运行（在GateWay运行） 
    true
    
    hive.exec.mode.local.auto.inputbytes.max 
    如果 hive.exec.mode.local.auto 为 true，当输入文件大小小于此阈值时可以自动在本地模式运行，默认是 128兆。 
    134217728L
    
    hive.exec.mode.local.auto.tasks.max 
    如果 hive.exec.mode.local.auto 为 true，当 Hive Tasks（Hadoop Jobs）小于此阈值时，可以自动在本地模式运行。 
    4
    
    hive.auto.convert.join 
    是否根据输入小表的大小，自动将 Reduce 端的 Common Join 转化为 Map Join，从而加快大表关联小表的 Join 速度。 
    false
    
    hive.mapred.local.mem 
    Mapper/Reducer 在本地模式的最大内存量，以字节为单位，0为不限制。 
    0
    
    mapred.reduce.tasks 
    所提交 Job 的 reduer 的个数，使用 Hadoop Client 的配置。 
    1
    
    hive.exec.scratchdir 
    HDFS路径，用于存储不同 map/reduce 阶段的执行计划和这些阶段的中间输出结果。 
    /tmp/&lt;user.name&gt;/hive
    
    hive.metastore.warehouse.dir 
    Hive 默认的数据文件存储路径，通常为 HDFS 可写的路径。 
    "
    
    hive.groupby.skewindata 
    决定 group by 操作是否支持倾斜的数据。 
    false
    
    hive.merge.mapfiles 
    是否开启合并 Map 端小文件，对于 Hadoop 0.20 以前的版本，起一首新的 Map/Reduce Job，对于 0.20 以后的版本，则是起使用 CombineInputFormat 的 MapOnly Job。 
    true
    
    hive.merge.mapredfiles 
    是否开启合并 Map/Reduce 小文件，对于 Hadoop 0.20 以前的版本，起一首新的 Map/Reduce Job，对于 0.20 以后的版本，则是起使用 CombineInputFormat 的 MapOnly Job。 
    false
    
    hive.default.fileformat 
    Hive 默认的输出文件格式，与创建表时所指定的相同，可选项为 'TextFile' 、 'SequenceFile' 或者 'RCFile'。 
    'TextFile'
    
    hive.mapred.mode 
    Map/Redure 模式，如果设置为 strict，将不允许笛卡尔积。 
    'nonstrict'
    
    hive.exec.parallel 
    是否开启 map/reduce job的并发提交。 
    false
    
    hive.security.authorization.enabled 
    Hive 是否开启权限认证。 
    false
    
    hive.exec.plan 
    Hive 执行计划的路径，会在程序中自动进行设置 
    null
    
    hive.exec.submitviachild 
    决定 map/reduce Job 是否应该使用各自独立的 JVM 进行提交（Child进程），默认情况下，使用与 HQL compiler 相同的 JVM 进行提交。 
    false
    
    hive.exec.script.maxerrsize 
    通过 TRANSFROM/MAP/REDUCE 所执行的用户脚本所允许的最大的序列化错误数。 
    100000
    
    hive.exec.script.allow.partial.consumption 
    是否允许脚本只处理部分数据，如果设置为 true ，因 broken pipe 等造成的数据未处理完成将视为正常。 
    false
    
    hive.exec.compress.output 
    决定查询中最后一个 map/reduce job 的输出是否为压缩格式。 
    false
    
    hive.exec.compress.intermediate 
    决定查询的中间 map/reduce job （中间 stage）的输出是否为压缩格式。 
    false
    
    hive.intermediate.compression.codec 
    中间 ma