Ubuntu下部署Hadoop集群+Hive(四)

更换为Tez计算引擎

准备环境:

apache-tez-0.10.3-bin.tar.gz

下载地址:Index of /apache/tez (tsinghua.edu.cn)

步骤:

1.将apache-tez-0.10.3-bin.tar.gz包上传到安装hive的节点服务器,放到/opt/software目录下;

2.解压apache-tez-0.10.3-bin.tar.gz包到/opt/module目录下,并修改hive文件夹的名称为“tez-0-10.3”;

root@hadoopMaster:/opt/software# tar -zxvf apache-tez-0.10.3-bin.tar.gz -C /opt/module/

root@hadoopMaster:/opt/module# mv apache-tez-0.10.3-bin/ tez-0-10.3

3.将apache-tez-0.10.3-bin.tar.gz包上传到HDFS;

root@hadoopMaster:/opt/module/hadoop-3.3.6/sbin# hadoop fs -mkdir /tez
root@hadoopMaster:/opt/module/hadoop-3.3.6/sbin# hadoop fs -put /opt/software/apache-tez-0.10.3-bin.tar.gz /tez

上传完成后,打开http://HadoopMaster:9870/explorer.html#/网页,可以看到目录列表多了一个tez目录,点击目录后,可以看到刚刚上传的gz包,如下图所示:

4.进入到hive的conf目录下,新增tez-site.xml文件,新增如下内容:

<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
  <property>
     <name>tez.lib.uris</name>
     <value>${fs.defaultFS}/tez/apache-tez-0.10.3-bin.tar.gz</value>
  </property>
  <property>
     <name>tez.use.cluster.hadoop-libs</name>
     <value>true</value>
  </property>
  <property>
     <name>tez.history.logging.service.class</name>
     <value>org.apache.tez.dag.history.logging.ats.ATSHistoryLoggingService</value>
  </property>
</configuration>

5.修改hive-env.sh文件,增加如下内容:

export TEZ_HOME=/opt/module/tez-0-10.3
export TEZ_JARS=""
for jar in `ls $TEZ_HOME |grep jar`; do
export TEZ_JARS=$TEZ_JARS:$TEZ_HOME/$jar
done
for jar in `ls $TEZ_HOME/lib`; do
export TEZ_JARS=$TEZ_JARS:$TEZ_HOME/lib/$jar
done
export
TEZ_JARS=${TEZ_JARS:1}
HIVE_AUX_JARS_PATH=$TEZ_JARS

6.修改 hive-site.xml 文件,增加如下内容:

   <property>
       <name>hive.execution.engine</name>
       <value>tez</value>
   </property>

7.修改yarn-site.xml文件:

root@hadoopMaster:/opt/module/hive/conf# cd /opt/module/hadoop-3.3.6/etc/hadoop/
root@hadoopMaster:/opt/module/hadoop-3.3.6/etc/hadoop# vi yarn-site.xml

增加如下内容:

<!-- 调大内存,推荐设置项(yarn默认是1024,可以根据自己服务器的实际内存合理分配) -->
   <property>
        <name>yarn.scheduler.minimum-allocation-mb</name>
        <value>4096</value>
   </property>

<!-- 关掉虚拟内存检查 -->
   <property>
       <name>yarn.nodemanager.vmem-check-enabled</name>
       <value>false</value>
   </property>

8.将yarn-site.xml文件进行分发,重启hadoop集群,重启hive服务:

分发文件:

root@hadoopMaster:/opt/module/hadoop-3.3.6/sbin# /bin/xsync /opt/module/hadoop-3.3.6/etc/hadoop/

重启hadoop,重启hive(hive可以使用kill 9 进程号  关闭hive进程):

root@hadoopMaster:/opt/module/hadoop-3.3.6/sbin# myhadoop.sh stop
root@hadoopMaster:/opt/module/hadoop-3.3.6/sbin# myhadoop.sh start
root@hadoopMaster:/opt/module/hadoop-3.3.6/sbin# nohup $HIVE_HOME/bin/hive --service hiveserver2 &

tez的更换就此完成,可以测试一下,速度会有提升。

补充:如果新建表的时候,发现注释字段显示乱码,可以在mysql的连接工具上,更新hive的元数据字段,执行如下语句:

-- 修改表字段注解和表注解
alter table COLUMNS_V2 modify column COMMENT varchar(256) character set utf8;
alter table TABLE_PARAMS modify column PARAM_VALUE varchar(4000) character set utf8;
-- 修改分区字段注解:
alter table PARTITION_PARAMS  modify column PARAM_VALUE varchar(4000) character set utf8;
alter table PARTITION_KEYS  modify column PKEY_COMMENT varchar(4000) character set utf8;

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值