关于监控方案的一点想法供参考

Author:Skate

Time:2017/12/11


关于监控方案的一点想法供参考

 

 

1.监控目标:

 

监控的直接目标:及时、准确的发现潜在事件,并辅助运维人员处理生产事件,消除生产事件专家和高手与一线员工的区别;

监控的增值目标:通过高度的可视化展示提供整体的运行情况、业务监控服务、趋势分析

 

监控是值班运维的窗口,预警信息要能能告知我们哪个系统、哪个应用、哪个模块、哪个负责人、出了什么问题,可能是什么原因,建议如何应急。

监控还能将一些标准化程度很高的报警自动关闭,并告知值班人员监控做了什么,实现故障自愈。

 

 

2. 以人员角色多维度展示:

一线人员:看预警、看当天趋势,巡检、故障定位、应急处理等

二线人员:看性能趋势,分析数据

业务人员/管理层:看整体应用可用性(可以收关键业务的用户视觉报警,其他不需关心)

 

3.监控解决的问题:

发现问题:通过监控最快的发现问题

定位问题:复杂的架构环境下,辅助快速定位问题

应急解决问题:定位问题后,需要应急恢复,监控可以帮助人工或自动恢复

分析问题:建立各种模型、分析模型、可视化的展示分析数据

 

4.监控的内容总结:

基础监控:如服务器、OS等各方面的性能,包括:CPU、MEM、IO、宕机等

应用系统监控:从多种类型、多模块存活性,性能、系统运行逻辑进行监控

主要包括:

Ø  端口、服务的存活性,进程个数、进程重启状态、dump事件等;

Ø  方法监控,针对服务内部的方法(方法响应、次数、可用率等)进行监控

业务监控:从业务层面按业务进行全流程监控,对业务数据、业务功能进行监控,实时收集业务数据进行配置监控

 

基础监控、应用监控和业务监控错误可以说明系统有错误需要处理,但是如果都正常就不能说明系统是正常的,我们需要有用户视觉的角度来监控,

只有这个才是最正确的,比如下几种情况可以不用及时或半夜起来处理

 

a) 如果程序架构是做了可用性保证的,一个服务挂了,用户视角的监控没有报警,说明对用户没有影响,如果此时凌晨收到报警,也是不需要马上起床来处理的

b) 用户是在全国各地进行访问的,很有可能某个地域的网络出问题,此时只有在全国布点的用户视角监控才能发现

 

实施用户视角的监控方法

(1)使用接入层的接口监控,只是,不对每一个web-server的站点ip实施监控,而是对nginx反向代理层实施监控

(2)引入第三方监控

 

 

5.监控常见问题

误报:当有告警时,可以多次、多路径验证

漏报:可以多方位监控,多IDC分别独立部署监控系统,再加上第三方等来解决

多报;可以通过重定监控基线、汇总、聚合等方法,实现比较难

全业务流程监控手段不够丰富:可以通过日志,应用程序埋点、用户反馈来解决

 

 

6.监控数据的消费场景

监控数据可以用于资源的扩容建议、应用系统的运行情况了解等,也是运维自动化的纽带





 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
1. 请介绍一下您的项目管理经验。 参考答案:我曾担任过多个项目的项目经理,主要负责项目的规划、执行和监控。我通常会在项目启动前制定详细的项目计划,包括时间表、资源分配和预算。在项目执行期间,我会与团队成员保持密切沟通,随时了解项目进展情况,并采取必要的措施解决问题。我还会定期向项目组织者和利益相关者提供项目进展报告,确保他们对项目的进展情况有清晰的了解。 2. 在您的项目管理经验中,最具挑战性的项目是哪个?您是如何处理的? 参考答案:我曾经管理过一个规模较大、时间紧迫的项目,面临着许多挑战。为了解决这些问题,我首先与团队成员和利益相关者进行了充分的沟通和协商,确保每个人都了解项目的目标和优先事项。其次,我对项目进展情况进行了紧密的监控,并及时采取措施解决问题。最后,我定期向项目组织者和利益相关者提供项目进展报告,与他们保持沟通,确保他们对项目的进展情况有清晰的了解。 3. 您是如何管理团队的? 参考答案:我通常会采用一些有效的团队管理方法,例如清晰的沟通、激励和奖励机制、培训和发展等。在项目启动前,我会明确团队成员的职责和工作范围,并确保每个人了解项目的目标和优先事项。在项目执行期间,我会与团队成员保持紧密的沟通,鼓励他们提出想法和建议,并在必要时提供支持和帮助。我还会定期与团队成员进行一对一的评估和反馈,以确保他们的工作得到充分的认可和鼓励。 4. 您是如何处理项目延期的情况? 参考答案:当项目延期的情况出现时,我会采取一系列措施来解决问题。首先,我会与团队成员和利益相关者进行充分的沟通和协商,确保每个人都了解延期的原因和影响。其次,我会重新评估项目进度和资源,调整时间表和工作计划。最后,我会与项目组织者和利益相关者进行沟通,向他们详细说明延期的原因和解决方案,并尽力减少其对项目的影响。 5. 您是如何管理项目预算的? 参考答案:我通常会对项目预算进行详细的规划和监控,确保资源得到合理的分配和利用。在项目启动前,我会评估项目的成本和风险,并制定详细的预算计划。在项目执行期间,我会定期监控项目的成本和支出,并采取必要的措施控制预算。我还会与团队成员和利益相关者保持沟通,确保他们了解项目的预算情况,并及时解决任何预算问题。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值