中高级运维工程师高频面试题(附万能回答公式)

本文主要探讨中高级运维工程师在面试中常遇到的监控、容量和变更方面的问题。内容涉及监控的目的与核心指标选择,链路监控的重要性,业界监控系统对比,容量的定义与衡量,数据来源,以及处理容量不足的策略。同时,变更的目标、减少变更影响的方法和变更机制也进行了深入讨论。
摘要由CSDN通过智能技术生成

中高级定义:对标阿里的P5-P6的岗位;百度t4-t5的岗位,一般工作3-4社招入职百度。

岗位要求是对运维已经有了初步的入门,对SRE和运维工程师有了自己的理解和思考。对于运维工程师除了扎实的基础技能之外,对于监控、变更、容量、预案等有一定的认知和思考。

一、监控篇

问题1:监控的目的是什么?

能不能发现?能不能快速发现?能不能快速定位问题?

问题2:如何添加监控?

监控添加的四个方向:

统一入口和门户
紧紧把握核心指标的准/召回率
深入业务链路加监控,比如你的上下游
完善基础监控和指标
问题3:核心指标如何选择?

第一个问题为什么一定要有核心指标,核心指标的目的是发现问题,是对全局稳定性的把控,核心指标管理越好对业务的掌控会越好。比如当有故障的时候如果去评估影响,那么核心指标的波动就是需要在第一时间去观察和判断的。

说一下我的理解和看法,一切核心指标一定要从业务需要去出发和选取。举个例子,比如是搜索系统,那么搜索的时间就是一个非常核心指标。如果是推荐系统,比如抖音和快手,那么时长就是一个非常核心的指标。如果是存储系统,比如网盘,那么上传文件数和存储文件数就是核心指标,比如电商的成交量,成交金额等。

链路监控:
什么是链路?链路就是一个功能,一个请求的完整流程,比如:cdn→Lvs→nginx→server→db。

如果一个人不了解这个业务如何快速判断问题呢,那么就必须有完整的链路监控,让每个人看到链路就可以对全局的链路有个完整的理

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

teayear

读后有收获可以获取更多资源

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值