【大数据】那些简化操作的辅助脚本

最新推荐文章于 2024-09-21 18:31:49 发布

桥路丶

最新推荐文章于 2024-09-21 18:31:49 发布

阅读量179

点赞数

分类专栏：大数据文章标签：大数据 hadoop hive zookeeper kafka

本文链接：https://blog.csdn.net/qq_33876553/article/details/112730893

版权

大数据专栏收录该内容

44 篇文章 7 订阅

订阅专栏

【大数据】那些简化操作的辅助脚本

大数据常用环境中，除了hadoop、spark本身自带脚本，能够完成快速启停，其它组件的启动命令稍微复杂，而且步骤较多。

首先是hive，在多用户环境中启动时，需要启动metastore、hiveserver2服务。其次，使用beeline进行连接测试时，也略显冗长。关闭服务时，也需要先使用jps命令找到RunJar，然后手动kill掉。

在学习时，就会增加很多不便。这些可以简单封装为脚本，便于自己操作。

hive启动脚本：start_hive.sh

#!/bin/bash

# 启动HiveServer2
hive --service hiveserver2 &
# 启动Metastore
hive --service metastore &

hive停止脚本：stop_hive.sh

#!/bin/bash

jps | grep RunJar | awk '{print $1}' | xargs kill -9

hive重启脚本：restart_hive.sh

#!/bin/bash

# 停止hive服务
jps | grep RunJar | awk '{print $1}' | xargs kill -9
# 启动HiveServer2
hive --service hiveserver2 &
# 启动Metastore
hive --service metastore &

使用beeline连接hive：hive_cli.sh

#!/bin/bash

beeline -u jdbc:hive2://node03:10000 -n root

有些脚本虽然简单，但确实几行代码能节约不少时间。

除了Hive，当然还有Zookeeper，需要在各个节点中进行启停。这部分也可以封装为脚本：zookeeper.sh。

#! /bin/bash

case $1 in
"start"){
	for i in node01 node02 node03
	do
		ssh $i "source /etc/profile && /opt/app/zookeeper-3.4.10/bin/zkServer.sh start"
	done
	};;
"stop"){
	for i in node01 node02 node03
	do
		ssh $i "source /etc/profile && /opt/app/zookeeper-3.4.10/bin/zkServer.sh stop"
	done
	};;
esac

这样，启动时，一行命令简化工作。

# 集群启动
zookeeper.sh start
# 集群停止
zookeeper.sh stop

但凡提到Zookeeper，当然也少不了Kafka。这里封装为kafka.sh。

#! /bin/bash

case $1 in
"start"){
        for i in node01 node02 node03
        do
                echo " --------启动 $i kafka-------"
                # 用于KafkaManager监控

                ssh $i "source /etc/profile && export JMX_PORT=9988 && /opt/app/kafka_2.11-0.11.0.2/bin/kafka-server-start.sh -daemon /opt/app/kafka_2.11-0.11.0.2/config/server.properties "
        done
};;
"stop"){
        for i in node01 node02 node03
        do
                echo " --------停止 $i kafka-------"
                ssh $i "source /etc/profile && /opt/app/kafka_2.11-0.11.0.2/bin/kafka-server-stop.sh"
        done
};;
esac

使用时，同样根据传入的参数来进行集群的启停。

# 集群启动
kafka.sh start
# 集群停止
kafka.sh stop

这里只是给大家提供一种思路，工作中有很多繁杂的命令，无需逐条记熟，并亲力亲为逐条输入。一次投入，多次使用，封装为脚本它不香吗？呃，真不错！

后话

如果有帮助的，记得点赞、关注。在公众号《数舟》中，可以免费获取专栏《数据仓库》配套的视频课程、大数据集群自动安装脚本，并获取进群交流的途径。

我所有的大数据技术内容也会优先发布到公众号中。如果对某些大数据技术有兴趣，但没有充足的时间，在群里提出，我为大家安排分享。

公众号自取：

公众号

桥路丶

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录