自动化监控spark进程并重启

最新推荐文章于 2023-12-19 10:33:51 发布

kwu_ganymede

最新推荐文章于 2023-12-19 10:33:51 发布

阅读量4.5k

点赞数 2

分类专栏： Spark 文章标签： spark 自动化脚本

本文链接：https://blog.csdn.net/kwu_ganymede/article/details/50073583

版权

Spark 专栏收录该内容

71 篇文章 2 订阅

订阅专栏

自动化监控spark进程并重启，实际生产中可能会出现服务进程挂掉的异常，自动监控与重启是非常重要。

1、监控主节点的shell脚本

#!/bin/bash
#
master=`ps -ef | grep Master | grep spark | awk '{print $2}'`
echo $master

if [ "$master" =  "" ]; then
        echo "Spark Master is restart!"
        /opt/modules/spark/sbin/stop-master.sh
        /opt/modules/spark/sbin/start-master.sh
else
        echo "Spark Master is alive!"
fi

2、监控从节点的shell脚本

#!/bin/bash
#
slave=`ps -ef | grep Worker | grep spark | grep 7077 | awk '{print $2}'`
echo $slave

if [ "$slave" =  "" ]; then
        echo "Spark Worker is restart!"
        /opt/modules/spark/sbin/stop-slave.sh
        /opt/modules/spark/sbin/start-slave.sh spark://10.130.2.20:7077
else
        echo "Spark Worker is alive!"
fi

3、加入crontab的定时

*/1 * * * * /opt/bin/monitorSparkSlave.sh

每分钟监控一次，如果服务进程不存在，则重启该服务。

注意重启slave节点时，需要指定master的ip

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

kwu_ganymede

关注关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Apache Spark简介

程序员光剑

09-11

3123

Apache Spark™ 是由加州大学伯克利分校 AMPLab 提出并开源的快速通用计算引擎。它最初用于解决大规模数据集上的海量数据分析，但随着它的不断发展，已经成为用于云计算、机器学习和流处理等领域的核心组件。Spark 支持多种编程语言，包括 Scala、Java、Python 和 R，支持 SQL 和 DataFrame API，提供统一的批处理和流处理功能。Spark 的高性能主要源自其可扩展性、容错机制和动态调度。

hadoop组件---spark理论----spark on k8s模式的三种方式全面了解

直到世界的尽头

01-19

5789

我们在之前的文章中已经了解了 spark支持的模式，其中一种就是使用k8s进行管理。 hadoop组件—spark----全面了解spark以及与hadoop的区别是时候考虑让你的 Spark 跑在K8s 上了 spark on k8s的优势–为什么要把Spark部署在k8s上大数据和云计算一直分属两个不同的领域。大数据主要关注怎么将数据集中起来，挖掘数据的价值；云计算主要关注怎么更高效地...

参与评论您还未登录，请先登录后发表或查看评论

spark 任务运行机制

qq_42694555的博客

10-24

236

(图文结合一起看) 1 spark 任务从提交任务开始 : spark-submiit --master … 2 会去调用一个脚本 spark-class,然后这个类会调用spark-submit的 main 方法 3 这个main方法启动之后会通过反射调用我们自己写的程序的main方法. 4 自己写的main方法启动之后首先会 new sparkconf 这个参数主要设置mast...

spark streaming job 失败后自动重启

遥望......

01-24

3245

#!/bin/bash - #=============================================================================== # USAGE: ./monitor_analytics.sh # DESCRIPTION: monitor online on test # AUTHOR: Amos Ya...

spark 启动命令

太多的虚幻

09-01

1万+

启动master ./sbin/start-master.sh 启动worker./bin/spark-class org.apache.spark.deploy.worker.Worker spark://briup-virtual-machine:7077 提交作业 ./bin/spark-submit --master spark://briup-virtual-machine:7077

Spark Streaming Receiver restart 重启

BITDDD小栈

03-31

881

一.引言: Spark Streaming 支持通过 Receiver 自定义数据流，实现之后由于接受客户端的不稳定时常造成streaming程序的崩溃，最早的想法是在Receiver实现中加入try catch，通过异常处理使得数据不会中断，但是Receiver整体的中断还是会迫使程序退出，不受Reciver内部的Try Catch控制，所以需要新的策略重启Receiver，好在Spark官方早就给出了解决方案，下面看看怎么使用。二.源码： Spark Doc中共有三种restart方案，可.

如何重启spark_大话Spark(7)-源码之Master主备切换

weixin_31947509的博客

01-17

451

Master作为Spark Standalone模式中的核心，如果Master出现异常，则整个集群的运行情况和资源都无法进行管理，整个集群将处于无法工作的状态。Spark在设计的时候考虑到了这种情况，Master可以起一个或者多个Standby Master，当Master出现异常的时候，Standy Master 将根据一定规则确定一个接管Master。在Standalone模式中Spark支持...

Spark Streaming应用程序【部署、升级、监控】

踏雪无痕

07-22

390

一.部署应用要部署运行Spark Streaming应用程序，需要具备以下条件。使用集群管理器进行集群部署，这是任何Spark应用程序的一般要求。将应用程序JAR打包，必须将流式应用程序编译为JAR。如果spark-submit用于启动应用程序，则无需在JAR中提供Spark和Spark Streaming。但是，如果应用程序使用高级数据源【例如Kafka】，则必须将它们链接到的额外工件及其依赖项打包在用于部署应用程序的JAR中。例如，使用的应用程序KafkaUtils 必须将spark-stre

Spark

小道的博客

12-10

3596

Spark知识点

Python在日志分析与监控中的自动化应用

通过对系统日志和应用程序日志的分析与监控，我们可以及时发现潜在的问题、定位异常和错误，并做出相应的调整和修复。Python作为一种强大且灵活的编程语言，为日志分析与监控提供了丰富的工具和库，使得我们能够更...

Spark整合HBase、Spark 重启失败、

qq_25954159的博客

10-15

476

1.先整合Jar。复制HBase jar到Spark的lib/hbase下.。清单如下：guava-12.0.1.jar htrace-core-3.1.0-incubating.jar protobuf-java-2.5.0.jar 这三个jar加上以hbase开头所有jar。复制固定开头的文件：ls *.war| xargs -i cp {} /root

自动化部署脚本之重启tomcat

weixin_43832267的博客

05-28

271

#!/bin/bash APP_NAME=$1 APP_PORT=$2 TOMCAT_NAME=tomcat-$1-2WEBSTARTCMD=/usr/local/2 WEB_START_CMD=/usr/local/2WEBSTARTCMD=/usr/local/TOMCAT_NAME/bin/startup.sh WEB_STOP_CMD=/usr/local/TOMCATNAME/bin...

SparkStreaming程序自动重启脚本2

鸿爸爸

06-18

422

#!/usr/bin/env bash ############################################################### #检测实时程序是否存在的脚本，若不存在，则重启 #Param 1 实时程序名称后半部分 #Param 2 启动程序脚本名称 #Param 3 调度周期 ############################################################### #定义重启方法 function restart(){ cou

分享一个自己用的Linux中自动化部署脚本：一键启动、停止、重启Java应用