混沌工程
文章平均质量分 78
牛麦康纳
主攻运维安全基础平台架构设计与落地
展开
-
混沌工程-经典案例分享
混沌工程是一种产生新数据的技术,通过演练不仅能提前发现隐患避免故障的大范围爆发,还能发现运维体系的盲区和整体架构设计的缺陷,可以说混沌工程本身就是优秀架构设计的试金石。原创 2024-03-06 18:09:03 · 860 阅读 · 0 评论 -
混沌工程-自动巡检前的阵痛期
混沌工程是推动监控体系完善的动力和方向,换句话说凡是混沌需要关注的指标就是有意义的指标,所以为了解决上述问题我们必须把这些指标数字化并纳入监控体系。对于用户行为此类复杂的指标设计在DataOps体系中不难找到标准答案,但对于混沌工程来说痛苦的点在于如何确定这些指标的结果是正确的?...原创 2022-07-11 18:43:29 · 210 阅读 · 0 评论 -
混沌工程-故障工具的安全问题
前言: 影响混沌工程进入生产环境的两大阻碍,我们前篇已经详细分析了第一个阻碍“最小爆炸半径”,本篇我们详细分析下第二个阻碍“故障工具的安全问题”。故障工具: 混沌工程的核心之一是故障演练,而模拟故障的组件就是所谓的故障工具。目前国内最好的故障工具应该是阿里开源的ChaosBlade,它可以覆盖到系统和网络层面大部分的演练场景,而且对容器云也有很好的支持。更详细的ChaosBlade的介绍请参考这里https://github.com/chaosblade-io/chaosblade/...原创 2022-05-27 11:44:57 · 1316 阅读 · 0 评论 -
混沌工程之-最小爆炸半径
自混沌工程理念提出来之后,追随者甚多,实践者甚少,这是为什么?因为混沌工程是把双刃剑,稍不留神就会弊大于利,所以大家对混沌工程,特别是生产环境的混沌工程是慎之又慎。本篇将围绕最小爆炸半径提出3个问题,并给出自己的一些解法。混沌工程可直接在生产环境进行么? 混沌工程的五大原则中有一条“在生产环境中进行试验”,混沌工程五级成熟度也把混沌实验的环境(预发布、灰度、生产)作为了评判标准之一,所以这个慢慢趋于生产的递进过程也就成为了行业大部分混沌工程推广的潜规则了。 其实这里面我个人觉得我们...原创 2022-04-02 18:13:39 · 2337 阅读 · 0 评论 -
混沌工程-为什么推广的如此困难
前言 2019年开始接触混沌工程,2020年开始我们的运维体系开始引入混沌工程相关的设计,2022年准备正式在生产环境落地。期间走过不少弯路,基本是摸着石头过河,该犯的错误犯过之后我们对自己混沌工程的前景充满信心!本篇博文想着重介绍下,混沌工程大家都或多或少有所了解,火了也有几年的时间,为什么能落地生产的还是寥寥无几,混沌工程的推广为何如此困难呢?五大原则 混沌工程的提出者给出了五大原则,很好的给我们指明了目标和方向,在项目中一切设计的准绳都必须围绕这五大原则,一旦偏离其中一个原则就...原创 2022-02-15 20:07:20 · 1054 阅读 · 0 评论 -
混沌工程-Netflix的捣蛋猴
前言:混沌工程这一工程学理念已慢慢被人所接受,称它为工程学是因为虽然是由国外互联网巨头netflix提出并应用到IT技术中,但是它的思想和应用场景远远超过了互联网领域,可以独立成为一个很有价值的学科。关于它理念上的介绍,网上有大量的资料,我这边就不再搬砖了,我这里只想跟大家分享实战中的一些实践经验和混沌工程架构过程中真实的感悟。核心理念:第一,混沌工程依赖优秀的系统架构混沌工程是系统架构高阶形态,它的落地需要很扎实的系统架构和配套设施,包括Devops、持续集成平台、监控、统一网关等,否则就原创 2020-09-23 20:46:12 · 637 阅读 · 0 评论