CDH参数优化

本文介绍了如何在CDH环境下将Hive的计算引擎改为Spark,以及针对YARN进行内存和CPU资源的优化,包括配置Hive-site.xml和Yarn的相关参数,以提高大数据处理效率。
摘要由CSDN通过智能技术生成

一、hive优化

1、hive计算引擎修改为spark

  ①在CDH的hive中搜索配置参数:hive.execution.engine

在这里插入图片描述

 ②.第一步仅仅是修改的jdbc,也就是beeline远程连接时候还为mr,还需修改hive-site.xml , 在hive-site.xml 的 Hive 客户端高级配置代码段(安全阀) 和 hive-site.xml 的 HiveServer2 高级配置代码段(安全阀) 新增配置或者修改配置

     hive.execution.engine=spark

注:hive客户端和HiveServer2均需配置

在这里插入图片描述

二、yarn优化

1.相应的集群配置环境
cpu 88核 内存250G
2.yarn 内存配置
#表示该nodemanager节点上YARN可使用的物理内存总量 (给150G)

yarn.nodemanager.resource.memory-mb
#container内存范围的最小值(给2G)
yarn.scheduler.minimum-allocation-mb
#container内存范围的最大值(给150G 可与nodemanager内存总量相同)
yarn.scheduler.maximum-allocation-mb
#MR ApplicationMaster占用的内存量 (给10G 因为spark程序运行时ApplicationMaster可能会多 )
yarn.app.mapreduce.am.resource.mb

3.yarn cpu内核配置

#该节点上YARN可使用的虚拟CPU个数与物理CPU核数数目相同 (可取88 )
yarn.nodemanager.resource.cpu-vcores
#单个任务可申请的最小虚拟CPU个数 (如:可取1 )
yarn.scheduler.minimum-allocation-vcores
#单个任务可申请的最大虚拟CPU个数 (如:可取88 )
yarn.scheduler.maximum-allocation-vcores
#ApplicationMaster 虚拟 CPU 内核(如:可取 20 因为spark程序运行时ApplicationMaster可能会多 )
yarn.app.mapreduce.am.resource.cpu-vcores
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值