为什么说可观测性Observability对运维没用？

最新推荐文章于 2024-05-21 17:50:16 发布

forrestzhaoc

最新推荐文章于 2024-05-21 17:50:16 发布

阅读量807

点赞数

文章标签：运维大数据人工智能 java 编程语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/forrestzhaoc/article/details/124054215

版权

本篇文章是跟浙江移动信息技术部总经理，中国移动首席专家的王晓征总交流探讨后形成。

首先，再复述下本文标题，Observabilty对运维没用，如果硬要说的精确点，exactly，对绝大多数的运维没用。

为啥呢？

Observability的三个环节是什么？

Detect发现—Trouble Shoot定位—Root Cause找到根因

而真正在出现问题的时候，对于运维也好，还是对于处理故障的人也好，最需要做的是什么？

是快速恢复，快速止损，这个时候定位和找根因很重要，但不是最重要的。

真正发生故障时，对于运维来说，真正重要的是：

Detect发现—Recover&Mitigate恢复和止损

这个角度，我们常用的“三板斧”、“一指禅”这样的预案和套路会更重要。

所以，Observability产品的逻辑跟运维的逻辑是不一样的。

拿业界现在经常提到的故障处理标准1-5-10，也就是1分钟发现，5分钟定位，10分钟恢复来讲，经过大量实践验证，其实把要求换成1-15，也就是1分钟发现，15分钟恢复会更合理。

而且已经有很多企业不再提故障时精准定位，有问题能快速恢复反而更实际一些。

这里再往深里分析下的话，快速恢复和止损，也就是Recover和Mitigate换成我们常用的稳定性和词汇又是什么呢？

一个是切换，切换之后可以Recover，这是完美的故障应急效果。但如果切换不行，咱就限流、降级、熔断等各种预案都执行起来，降低故障影响程度，这就是Mitigate。

而Recover和Mitigate的能力，其实根本上取决于产品的架构设计和实现，也就是产品的反脆弱性是不是足够强，单纯的Observability是解决不了这些问题的。

如果要是这么讲，Observability是不是就没存在的价值和意义了呢？

当然不是，

如果让我来定义系统稳定性或运维能力层级的话，我会分为四层：

第一层，产品运维自动化的达成，自动化的扩缩容，CI/CD等。

第二层，产品反脆弱能力的达成，快速切换、限流、降级、熔断等。

第三层，AIOps能力的达成，这一部分我17年专门写文章分享过《AI时代，我们离AIOps还有多远？》，单纯AIOps能力的存在是没有意义的，它必然是建立在第一、二层基础之上，与之相辅相成才有意义。

第四层，混沌工程Chaos Engineering 和可观测性Observability能力的达成，同样的，它们必然要依托于前面的几层能力才有意义。

因为试想，当我们的系统内部服务都无法做到自动切换，无法通过AIOps能力识别服务过载，需要自动化降级或者执行扩缩容的时候，混沌工程的破坏性测试又有什么意义呢？

而我们的Observability，能够发挥的最大价值就是，帮助我们在这些日常的各种异常、全站大容量压测、以及混沌破坏性测试时，很好的给到我们指导，帮我们找出薄弱点在那里，指导SRE和产品在架构和逻辑层面做出优化。

所以，Observability的价值和作用一定是在平时，而不是紧要时刻。

而我们讨论Observability，一定要全局地看，系统性地看，而不是单一维度的看。

不然，Observability真的就是空中楼阁，景象很美好，但是没法落地。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

forrestzhaoc CSDN认证博客专家 CSDN认证企业博客

码龄5年

23: 原创

-: 周排名

9万+: 总排名

1万+: 访问

: 等级

216: 积分

9: 粉丝

6: 获赞

7: 评论

24: 收藏

私信

关注

热门文章

最新评论

为什么说可观测性Observability对运维没用？
jeff.sheng: 不觉得，很多时候你没有找到问题的原因，盲目的采取措施反而让问题扩大。而可观测性此时就起到关键作用，可观测性利用高纬度、高基数的数据分析帮助我们快速定位问题根因，进而采取措施。
AIOps做根因定位靠不靠谱？
周英俊520: 说的好，现在在打一个AIOPS比赛，自我折磨中
故障复盘的简洁框架-黄金三问
不正经的kimol君: 谢谢分享，很有用
AIOps做根因定位靠不靠谱？
LaoYuanPython: 谢谢分享!点赞支持！希望点赞给博主带来好运气！祝博主新的一年平安健康、幸福快乐！本人正参与博客之星评选，1月24日前每天都可投多票，敬请您支持！谢谢！投票链接：[code=python] https://bss.csdn.net/m/topic/blog_star2020/detail?username=laoyuanpython [/code] 或到老猿博文首页内的置顶博文跳转！
AIOps做根因定位靠不靠谱？
Java劝退师、: 感谢博主分享，讲的挺不错，希望后面有更多的文章～最近我也在学习写博客,有空来看看我呀，一起互相学习。期待你的关注与支持

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。