【大数据】那些简化操作的辅助脚本

【大数据】那些简化操作的辅助脚本

大数据常用环境中,除了hadoop、spark本身自带脚本,能够完成快速启停,其它组件的启动命令稍微复杂,而且步骤较多。

首先是hive,在多用户环境中启动时,需要启动metastore、hiveserver2服务。其次,使用beeline进行连接测试时,也略显冗长。关闭服务时,也需要先使用jps命令找到RunJar,然后手动kill掉。

在学习时,就会增加很多不便。这些可以简单封装为脚本,便于自己操作。

  1. hive启动脚本:start_hive.sh

    #!/bin/bash
    
    # 启动HiveServer2
    hive --service hiveserver2 &
    # 启动Metastore
    hive --service metastore &
    
  2. hive停止脚本:stop_hive.sh

    #!/bin/bash
    
    jps | grep RunJar | awk '{print $1}' | xargs kill -9
    
  3. hive重启脚本:restart_hive.sh

    #!/bin/bash
    
    # 停止hive服务
    jps | grep RunJar | awk '{print $1}' | xargs kill -9
    # 启动HiveServer2
    hive --service hiveserver2 &
    # 启动Metastore
    hive --service metastore &
    
  4. 使用beeline连接hive:hive_cli.sh

    #!/bin/bash
    
    beeline -u jdbc:hive2://node03:10000 -n root
    

有些脚本虽然简单,但确实几行代码能节约不少时间。

除了Hive,当然还有Zookeeper,需要在各个节点中进行启停。这部分也可以封装为脚本:zookeeper.sh。

#! /bin/bash

case $1 in
"start"){
	for i in node01 node02 node03
	do
		ssh $i "source /etc/profile && /opt/app/zookeeper-3.4.10/bin/zkServer.sh start"
	done
	};;
"stop"){
	for i in node01 node02 node03
	do
		ssh $i "source /etc/profile && /opt/app/zookeeper-3.4.10/bin/zkServer.sh stop"
	done
	};;
esac

这样,启动时,一行命令简化工作。

# 集群启动
zookeeper.sh start
# 集群停止
zookeeper.sh stop

但凡提到Zookeeper,当然也少不了Kafka。这里封装为kafka.sh。

#! /bin/bash

case $1 in
"start"){
        for i in node01 node02 node03
        do
                echo " --------启动 $i kafka-------"
                # 用于KafkaManager监控

                ssh $i "source /etc/profile && export JMX_PORT=9988 && /opt/app/kafka_2.11-0.11.0.2/bin/kafka-server-start.sh -daemon /opt/app/kafka_2.11-0.11.0.2/config/server.properties "
        done
};;
"stop"){
        for i in node01 node02 node03
        do
                echo " --------停止 $i kafka-------"
                ssh $i "source /etc/profile && /opt/app/kafka_2.11-0.11.0.2/bin/kafka-server-stop.sh"
        done
};;
esac

使用时,同样根据传入的参数来进行集群的启停。

# 集群启动
kafka.sh start
# 集群停止
kafka.sh stop

这里只是给大家提供一种思路,工作中有很多繁杂的命令,无需逐条记熟,并亲力亲为逐条输入。一次投入,多次使用,封装为脚本它不香吗?呃,真不错!

后话

如果有帮助的,记得点赞、关注。在公众号《数舟》中,可以免费获取专栏《数据仓库》配套的视频课程、大数据集群自动安装脚本,并获取进群交流的途径。

我所有的大数据技术内容也会优先发布到公众号中。如果对某些大数据技术有兴趣,但没有充足的时间,在群里提出,我为大家安排分享。

公众号自取:

公众号

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

桥路丶

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值