运维管理层面试题

这篇博客讨论了运维管理层面试中涉及的故障等级定义流程、全用户下单故障的降级措施、管理者的经典名言及管理方法。重点介绍了如何在5分钟内发现故障、20分钟内定位并25分钟内恢复的处理目标,以及运维在故障中的支持角色。此外,还探讨了确保业务稳定性的措施,包括高可用架构、业务链路梳理和监控机制建设。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

运维管理层篇

(1)故障等级定义流程是什么?

p1级的故障整个流程是什么。是noc通过监控和大盘发现问题然后拉群,(如何拉到对的人的呢?),拉群之后再分析问题吗?然后再干嘛了?另外这种p1主流程故障响应时间多少,处理问题的时间是多少有定义嘛?

这是xx芒面试题,运维总监问我的问题。

p1 以上的拉稳定性组的所有成员。每个研发组有一名同事在稳定性组。

p1 以下的通过appid拉人,并且是自动的,拉的人是相对于服务的appid的owner,之前写在数据库里面的,通过飞书自动拉人。

我们这边定义的是 5 20 25  --> 5分钟内发现,20分钟内定位,25 恢复。

(2)如果全部用户无法下单,有什么降级措施嘛?运维需要做什么?

如果全部无法下单,得先定位问题在哪,才知道怎么降级。目前这边是没有同城多活,或者多机房降级预案的。

运维充当整个故障的支持角色。

(3)有什么管理者的经典名言?

  • 你知识的水平决定了你团队的水平
  • <
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

叱咤少帅(少帅)

如果文章对你有帮助就打赏下吧!

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值