服务器资源监控通用解决方案

# 服务器资源监控通用解决方案

# 背景

由于系统时常由于磁盘或内存原因,导致服务器上的k8s或docker服务异常,进而导致系统不可用,故需要监控服务器资源使用情况,但业务服务器很多,逐个登录服务器查看资源效率太低。

# 方案思路:

1、在各个需要监控资源的服务器上,通过shell命令将相关信息临时保存到"/root/error.log"文件中;

2、通过curl将保存信息的文本文件提交到B服务器上的指定API接口;

3、B服务器每天累积汇总各服务器上报的信息;

4、安全人员每天只需要关注B服务器上的上报信息即可。

# ===== 以下是方案实施相关命令和脚本参考 =====

# 服务器本地脚本编写示例

# 编写收集web系统异常日志内容的脚本: vim /root/bin/appLogRpt.sh

tail -n 150 /data/application/logs/error.log|grep -v "org.\|sun." > error.log

curl -X POST -H 'Content-type: text/plain' --data-binary '@error.log'

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
监控虽然是基础的功能,但是却是用户最需要的功能,所以我们力求做到极致,秉承这个理念,我们为用户打造了全面、精准、专业的一体化监控功能; 全面:刚刚也提到了,我们支持10大类管理对象,包括有线设备、无线设备、安全设备、服务器、动环设备、存储、标准应用、中间件、数据库以及虚拟化资源,可以实现有线无线一体化监控管理; 并且系统支持上百种软硬件品牌,可以高效管理异构IT系统;同时我们也是唯一一家能提供有线无线综合网管的厂商。 并且,我们系统中预置了非常齐全的监控指标,对不同的管理对象,我们都有不同的监控模型,比如对于数据库,我们会监控缓存占用情况、表空间使用量、缓存命中率、读写速度等,这些指标都是数据库专有的;监控指标支持用户自定义,扩展性好。 监控系统必须做到数据精准监控才有意义;我们系统支持多种采集方式,对不同类型的数据采用最适配的方式进行采集,保证所采集指标的精准性; 另外,由于各厂商对一些数据的定义有差异,所以其实采集得到的源数据有时候无法直接使用,我们的系统根据过往积累的大量经验,可以自动修正源输出的不规范指标数据,保证所展现的数据符合用户的常规理解认知。 基于丰富的监控经验为用户提供专业的监控;针对不同类型资源的不同特点,系统预设了不同的初始阈值;甚至针对同一类型不同厂商资源的差异,系统也进行了处理,预设了具有针对性的不同阈值,从而实现更为专业的监控;比如CPU利用率这一指标,思科和华三的定义就不同,华三的CPU利用率包括了系统的开销,跑到20%-30%都是正常的,而思科的CPU利用率没有包含系统开销,正常范围在0-1%;这种情况下,系统就会预置不同的CPU利用率告警阈值,对华三和思科的设备都能实现专业的监控

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值