Saas监控--Shell脚本补充
文章平均质量分 67
iteye_15774
这个作者很懒,什么都没留下…
展开
-
09、主要服务可用性监控 (二)
1.文件按功能分类,有配置文件,主程序,下载程序.1)配置文件: 一.pso.xml 需要监控的站点; ServerIp和Port属性表示监控站点的URL和端口,MonitorPoint表示需要从哪几个IDC进行监控,当前有HZ(杭州),SZ(深圳),BJ(北京),IsAlert表示该站点如果发生探测失败的情况是否报警,默认为true即需要发送邮件报警,Des为该站点...2011-06-13 21:29:43 · 137 阅读 · 0 评论 -
08、IPMI温度获取
1、方案(1)先扫描出10.0.2.x网段有应答的机器,然后通过ipmitool逐个获取机箱温度信息,过滤出cpu温度后,设定温升30度,即60度以上温度为报警阀值(以后根据情况调整)。 (2)因为获取温度语法不一致,所以现在将IPMI地址放在配置文件ipmi.config(可以有多个)中,将IPMI地址和IP地址映射放在配置文件mapping.config中,读取ipmi.confi...2011-05-13 13:32:12 · 1160 阅读 · 0 评论 -
07、IDC机房设备与服务情况自动报备
1、技术前提:1、Slim系统2、NMAP扫描工具 2、过程:1、主机扫描过滤出有应答的机器 nmap -sP 10.10.31.0/24 > ScanIp.txt nmap -sP 10.10.30.0/24 >> ScanIp.txt 过滤成只包含机器名和ip地址的信息串 ...2011-05-13 11:32:40 · 206 阅读 · 0 评论 -
06、阿里旺旺维护
1、目的: 及时准确的获得部署在阿里旺旺内网会议服务器的情况,本期只需要获取会议数与参会人数。2、部署现况: 会议服务器部署在阿里内网,只能先通过专用软件申请通道后,才能CRT上该台机器,进行查看; 阿里内网有台sftp服务器,可进行下载; GSB可以访问阿里sftp服务器; Beta机器可以访问GSB里面机器; 3、脚...2011-03-22 10:45:59 · 152 阅读 · 0 评论 -
05、InfoSrv负载监控
1、目的: 实时从2g左右大小的日志文件获取最近5分钟的会议纪要,解析出所有会议,并汇总参会人数2、技术要点: 获取有会议信息的数据段cat ${log} |sed -n "/${newest_info}/,/UsrNum:/p" |sed -n '/ConferenceList/,/UsrNum:/p' |sed '/UsrNum:/'d|sed '/----...2011-03-21 22:37:18 · 120 阅读 · 0 评论 -
04、Apache 监控
1、目的: 编写一个脚本,4分钟执行一次,检查8分钟内有400错误就发送邮件到noc组2、技术要点: 1)date处理,x分钟前通过函数获得;curdate=`date '+%Y-%m-%d' -d '8 minutes ago' ` 2)grep多条件;|grep 'WebApi.webapi HTTP/1.1" 400' |grep -c "${m...2011-03-21 19:42:33 · 77 阅读 · 0 评论 -
03、IDCPING汇总
1、目的: 在监控脚本中增加日志功能,以一周为单位记录日志,并在每周一发送日志明细,并形成汇总数据,汇总信息列为“次数,最大丢包率,最小丢包率,平均丢包率”,每个IDC的丢包日志发送至GSB Slim服务器,并在GSB slim服务器上部署发送汇总和发送脚本,信息按照问题IDC来区分汇总 2、思维图:...2011-03-21 17:13:11 · 75 阅读 · 0 评论 -
02、初级应用--定期备份DB与Webapp
1、目的: 这个脚本是拿来给新进的值班人员培训shell的时候布置的一个小任务,是为了让他对脚本编程有个实质性的感觉,很简单,也很实用。2、技术要点: 1)存放在cron.monthly,cron.d的选择:前者是每月定时任务,后者是自定义定时任务; :放在cron.monthly目录,统一设置成系统时间每月1号4点42分运行 42 4...2011-03-21 15:18:59 · 89 阅读 · 0 评论 -
01、专题目的
从 I公司出来也快半年 了,算算做Saas的监控运维工作也快有2年了,可惜公司的Saas业务没有起来,相比较与阿里软件监控中心同时监控3000台服务器,2万多个监控点(08年的消息,现在估计又上了个数量级),我们在量上就少了一个级别。没有到达那个量,在解决监控问题上思路上都不太一样,并发量处理,分布式考量,我们考虑的不是很多。虽然在上百台机器,上千个监控点的IDC机房里面,我们的监控系统可...2011-03-20 13:34:23 · 71 阅读 · 0 评论 -
09、主要服务可用性监控 (三)
1.检测web 2.检测端口 3.定时下载配置文件(在正式环境上,经常有打patch或者发布新版本的情况,这个时候就应该把相应的监控关掉.以前的话,是通过登录在相应idc的监控服务器上手工关掉某脚本,现在的话可以通过放在服务器上,由脚本定时1小时/2小时的去获得本地需要监控的服务项及其是否需要报警等等的监控信息)...2011-06-13 23:26:20 · 205 阅读 · 0 评论 -
09、主要服务可用性监控 (一)
1、方案:1)一套代码与配置,各IDC通过调用脚本参数不同进行区分,每10分钟轮询一次服务。2)各IDC配置文件间隔7分钟从30.9机器上定时取一次。 2、xml文档属性值:属性:Service,ServerIp,Port,UrlName,UrlValue,Des,MonitoryPoint,IsAlertport 端口探测用 nmap来实现,url探测用curl/wget...2011-05-13 13:41:09 · 411 阅读 · 0 评论