Linux定时监测数据库服务若掉了则启动数据库服务

Linux定时监测数据库服务若掉了则启动数据库服务

环境介绍

  • 在某些生产环境,业务系统抛异常报错,排查发现数据库连接异常,查看数据库服务已经关闭;人工定位问题解决问题需要较长时间;到人工启动数据库期间,业务系统一直处于故障状态,无法访问;
  • 配置Linux定时任务,判断数据库服务是否运行,若未运行则启动数据库服务,若已经运行则打印dmserver is running
  • DM7,DM8 通用命令,若服务器运行多个数据库,需要修改脚本;
## 测试语句
if  ps -ef|grep  "dmserver" |grep -v grep >/dev/null;then echo "dmserver is running";else "/opt/dmdba/dmdbms/bin/DmService5236" start;fi

## 编写shell脚本
vi /opt/dmdba/dms_start.sh
#!/bin/sh
if  ps -ef|grep  "dmserver" |grep -v grep >/dev/null;then echo "dmserver is running";else "/opt/dmdba/dmdbms/bin/DmService5236" start;fi

## 给shell脚本授予执行权限
chmod +x /opt/dmdba/dms_start.sh

## 手动执行脚本,监测数据库服务是否启动成功
cd /opt/dmdba;./dms_start.sh

## 编写Linux操作系统定时任务
## 每3分钟执行一次 编辑保存退出
 crontab -e
*/3 * * * * cd /opt/dmdba;./dms_start.sh
  • 5
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
IT运维之Linux服务器监控方案 随着Linux应用日益广泛,绝大部分的网络服务器都使用Linux操作系统。为了全面掌握 网络服务器的运行状况和趋势,需要对服务器进行全面的监控。 利用Linux发行版搭建一个网络服务器可能对于许多人都是一件很容易的事情,但网络服 务器正式上线后,服务器数据流动、连接数、网络流量、系统负荷等各方面都会增加, 安全问题也随之而来,再考虑到日志、数据库的重要性,我想无论是哪一位系统管理员 ,都应该迫不及待地想把服务器上线的前期工作做好吧。 那我们究竟需要做好哪些工作准备呢?之前有看过一篇文章说到系统管理员应该定期完 成的九件事情,我分析过后,认为有几件事情是必须得做的。首先是备份,做好定时备 份策略,备份所有你认为重要的数据,并且定期检查你的备份是否有效、全面;日志轮 换,无论你想用哪种轮换方式,控制日志增长避免驱动器已满是你的目的;做一定的安 全措施,如防火墙iptables的访问控制,用denyhosts防止黑客远程暴力破解,mysql远 程登录权限等等;最后就是服务器监控,也是我主要想讲述的内容。 对于服务器的硬件资源、性能、带宽、端口、进程、服务等都必须有一个可靠和持续的 监测,统计分析每天的各种数据,从而能及时反映出服务器哪里存在性能瓶颈、安全隐 患等。另外是要有危机意识,就是了解服务器有可能出现哪些严重的问题,出现这些问 题后该如何去迅速处理。比如数据库的数据丢失,日志容量过大,被黑客入侵等等。说 到底,预防是关键。 监控,是预防的其中的一项重要工作。这里先说说我需要监控的内容。系统负载、cpu使 用率、内存占用、磁盘空间、网络流量、端口、进程、apache或tomcat的连接数、mysq l的运行状态这些都是我想要监控的东西,但又能做到多少呢,我只能尽力而为了。要了 解服务器每时每刻的整体运行状态,单靠几个Linux自带的性能监测命令是很难实现的。 所以,利用shell脚本和开源监控工具进行服务器监控成为了我的两个主要的选择。 利用shell脚本监控能够很好把握的监控的内容,时间,警告峰值,以及方便地进行告警 通知,自定义监控日志内容等等;而许多开源的监控工具都十分方便和实用,比如有za bbix、cacti、nagios等,而且能够针对不同的监控内容,生成好看的便于观察的曲线图 ,多数的开源监控工具都比较成熟,至于哪个好用就得用过才知道。由于这些监控工具 都有许多热血人士写了安装和使用的文档,我这里就不写进来了。想了解下的朋友也可 以到我的博客上走走,在这里我主要是把自己写的一些shell监控脚本分享一下,希望大 家能给点意见。 我这里写了四个脚本(performance.sh 性能监控,process.sh 进程监控,network.sh 流量监控,tongji.sh流量分析统计),并使用crontab定时执行脚本进行监控数据的记 录,形成每天的监控日志放在如下相应的文件夹,并且超过自己设定的告警值后发邮件 通知,如果是腾讯企业邮箱,163邮箱那些有免费短信通知功能的可以尝试一下,收到邮 件告警后很快就能收到短信了,十分方便。 性能监控脚本 ############################################################################ ## #!/bin/bash #监控cpu系统负载 IP=`ifconfig eth0 " grep "inet addr" " cut -f 2 -d ":" " cut -f 1 -d " "` cpu_num=`grep -c 'model name' /proc/cpuinfo` count_uptime=`uptime "wc -w` load_15=`uptime " awk '{print $'$count_uptime'}'` average_load=`echo "scale=2;a=$load_15/$cpu_num;if(length(a)==scale(a)) print 0;print a" " bc` average_int=`echo $average_load " cut -f 1 -d "."` load_warn=0.70 if [ $average_int -gt 0 ] then echo "$IP服务器单个核心15分钟的平均负载为$average_load,超过警戒值1.0,请立即处理 !!!$(date +%Y%m%d/%H:%M:%S)" >>/usr/monitor/performance/performance_$(date +%Y%m%d).log echo "$IP服务器单个核心15分钟的平均负载为$average_load,超过警戒值1
服务器运维方案 为保官网的正常稳定运行,也为了更好的对服务器进行管理维护,特制定以下运维方案: 硬件系统管理 一、服务器运行稳定性 服务器在运往托管商处上架前,应对服务器的稳定性进行全面的测试,包括网站主程序的测试,网站数据库的测试,网站压力测试等多项内容,对服务器的运行稳定性进行检验,在硬件上特别是容易松动的地方进行检查加固。 服务器上架后,每天对服务器状态进行不间断的监控,每月对服务器出具一次安全检测报告,分析是否存在异常。 二、服务器性能 服务器的性能进行全面检测,特别是对服务器处理大批量数据的情况下的CPU的占用率,内存的占用率等进行查看,以确保服务器的性能。 三、服务器软硬兼容性 服务器需用windows sever自带的兼容性检查软件进行兼容性检查,列出兼容性及不兼容的硬件以备查看,特别是自行开发的程序是否有对硬件要求特别严格地方,需跟研发共同商议解决。 四、磁盘阵列等存储设备管理 如服务器有磁盘阵列,需对每块硬盘进行编号,并记录在案,对软件设置中的参数也要进行详细的记录,以备远程维护时指导机房人员进行远程操作。 五、机柜、电源、网线布局管理 1、服务器上架后,应对服务器进行拍照,确认各线路位置。 2、需对服务器的电源部分进行编号整理。 六、服务器安全 服务器上架前应对服务器各主要部件进行登记编号,如箱体可锁,应上锁,并加盖封条,对于可抽出部分,应详细记录编号。 服务器运维方案全文共5页,当前为第1页。七、服务器硬件巡检制度 服务器运维方案全文共5页,当前为第1页。 每季度安排专人进入机房对服务器进行一次常规确认,包含服务器线路检查、服务器故障排除等。巡检完成后填写巡检登记表并留档备查。 八、托管机房的联系 应制作托管机房联系人表,对365天24*7内的机房人员、电话、手机登记在案。 2.网站运行管理 一、网站不间断运行稳定性监测 为了保证网站的稳定性及不间断性应对服务器异动情况进行检测,如服务器有异常可通过邮件或短信通知管理员。 每日对网站进行7*24小时流量及安全监控,分析出是否存在恶意攻击以及攻击来源,并对此进行安全处理,每月提交一次分析报告。 二、域名服务指向管理 为保持网站的稳定性,域名管理权限应该有专人统一持有,避免因域名服务指向原因引起的网站访问失效或访问错误的问题。 三、公司所属网站一级、二级、邮件服务器域名指向管理 公司域名的制订规则,公司域名制订后应由专人向域名持有人提供书面修改方案,域名持有人根据书面修改方案进行修改,修改并对书面文件进行备案,以防责任不清的情况发生。 四、域名DNS转向稳定性监控,DNS性能监控 公司注册域名因代理商不同,所以DNS转向服务器也不相同,在DNS转向服务器出现问题后应及时寻找解决途径,应对每个域名的DNS转向服务器提供者的联系方式进行备案,方便出现问题后的查找。 五、网站ICP注册管理,其它相关的注册管理 服务器运维方案全文共5页,当前为第2页。公司网站属营业性网站,并带有论坛BLOG系统等,应相通信管理局及新闻出版局等部门申请注册管理,并对非法内容进行监管,应有专人负责。 服务器运维方案全文共5页,当前为第2页。 3.服务器软件环境管理 一、操作系统 a) 基于Windows Server操作系统升级与配置 采用windows 2003操作系统+SQL2008(系统版权),并装好杀毒软件,FTP软件(盗版问题)等。 b) 操作系统稳定性监控 定时查看操作系统日志及IIS日志,查看CPU、内存占用率,保持服务器在正常态。 c) 权限与文件管理 服务器应明确责任人及管理帐号持有人,不应出现多人单帐户,单人多帐户的情况,不利于在服务器出现问题后,对服务器进行操作维护、查找问题。 二、数据库 a)SQL Server 数据库 数据库应由开发部门配合服务器管理人员共同完成,对所需要的服务,不需要的服务,SA的密码应强调持有人及管理方式,避免人为漏洞的出现。 c)数据库备份 数据备份不同于服务器硬盘的备份,该备份需对数据库直接进行操作,应由专人定时完成,因备份占用内存较大,也不易在访问量大的情况下进行。 d)访问性能优化及数据库同步 性能优化及参数调整由开发部门完成,服务器管理人员需记录详细的设置;数据库如需要同步,应明确同步时间或实时同步等方式。 三、用户管理 a) ftp用户管理 应由专人出具书面文档给服务器管理人员,由服务器管理人员进行操作,并留档。 b)远程登录用户管理 该帐户应由专人控制管理,严格控制在一台或几台客户机上登陆,严格禁止管理人员从非办公地点登陆。 c) SQL Server数据库用户管理 该帐户由数据库管理员控制,数据库管员应指定。 d)操作系统用户管理 该帐户由服务器管理人员控制,服务器管理人员应明确。 服务器运维方案全文共5页,当前为第3页。四

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值