可靠性工程
文章平均质量分 89
架构师研究会
架研年近半百 ,有20多年IT工作经历,目前在一家500强做企业架构。因为工作需要,另外也因为兴趣涉猎比较广,为了自己学习建立了三个博客,分别是【全球IT瞭望】,【架构师研究会】和【开发者开聊】,有更多的内容分享。
最近因为工作需要打算先备考CPA,然后CFA,如果可能也想学习法律,备战律考。
不满足是向上的车轮,是我的座右铭。
展开
-
【可靠性工程】GCP 定义您的可靠性目标
Google Cloud 架构框架中的这份文档提供了最佳做法,用于定义适当的方法来衡量您的服务的客户体验,以便您可以运行可靠的服务。您将了解如何迭代您定义的服务级别目标 (SLO),并使用错误预算来了解如果发布其他更新,可靠性可能会受到影响。选择合适的 SLI选择适当的服务水平指标 (SLI) 以充分了解您的服务执行情况非常重要。例如,如果您的应用程序具有多租户架构,这是由多个独立客户使用的典型 ...原创 2022-08-24 20:44:54 · 140 阅读 · 0 评论 -
【可靠性工程】GCP 可靠性核心原则
Google Cloud Architecture Framework 中的这份文档解释了在云平台上运行可靠服务的一些核心原则。这些原则有助于您在阅读架构框架的其他部分时达成共识,这些部分向您展示了一些 Google Cloud 产品和功能如何支持可靠的服务。关键术语在架构框架可靠性类别中,使用了以下术语。这些术语提供了对如何运行可靠服务的关键理解。服务水平指示器 (SLI)服务水平指标 (SLI...原创 2022-08-25 21:10:46 · 153 阅读 · 0 评论 -
【韧性工程】所有开发人员都应该知道的韧性软件策略
失败是不可避免的。然而,正确的软件设计和开发选择可以帮助最大限度地减少其影响、隔离问题并加快恢复时间。许多架构师努力设计具有避免灾难性故障的能力的应用程序系统。不幸的是,在现实世界中,导致崩溃的错误和过载是不可避免的。为了正确处理此类故障,开发团队必须为自己配备正确的软件弹性实践。在追求设计风格(例如基于微服务的架构)时,这一点尤为重要,在这种架构中,故障可能会蔓延到分布式组件并导致广泛的中断。各...原创 2022-08-29 21:39:42 · 151 阅读 · 0 评论 -
【可靠性工程】Microsoft 可靠性模式
可用性可用性以正常运行时间的百分比来衡量,并定义了系统正常运行和工作的时间比例。可用性受系统错误、基础设施问题、恶意攻击和系统负载的影响。云应用程序通常为用户提供服务水平协议 (SLA),这意味着必须设计和实施应用程序以最大限度地提高可用性。PatternSummaryDeployment Stamps部署应用程序组件的多个独立副本,包括数据存储Geodes将后端服务部署到一组地理节点中,每个节点...原创 2022-08-30 22:10:35 · 100 阅读 · 0 评论 -
【软件测试】稳定性和可靠性测试在软件开发中的重要性
软件测试的某些方面经常会在那些刚接触流程的人中造成混淆——例如在稳定性和可靠性测试之间划清界限。两者通常可以互换使用,并且有一个共同的目标,即确保系统可以在选定的时间范围内稳定运行。在这篇文章中,我们将仔细研究什么是稳定性测试、可靠性测试的定义、它们的目标以及它们的子集。您会发现为什么错过稳定性和可靠性测试会增加软件维护成本,以及为什么它是业务经理绝对必须的。目录:可靠性测试定义可靠性测试的目的可...原创 2022-09-14 18:31:44 · 1123 阅读 · 0 评论 -
【可靠性】建立可靠性文化
可靠性文化如何帮助团队构建更可靠的系统和流程。当我们考虑可靠性时,我们通常会从系统的角度来考虑可靠性。现实情况是,可靠性始于人。通过鼓励站点可靠性工程师 (SRE)、事件响应人员、应用程序开发人员和其他团队成员主动考虑可靠性,我们可以更好地准备识别和修复故障模式。在本节中,我们将解释什么是可靠性文化,如何培养和发展可靠性文化,以及它如何帮助提高我们的流程和系统的可靠性。什么是可靠性文化?可靠性文化...原创 2022-09-16 20:16:15 · 118 阅读 · 0 评论 -
【混沌工程】2022 混沌工程状态
在过去的十二年里,我有机会参与并见证了混沌工程的发展。出身卑微,最常遇到的问题是“你为什么要这样做?”到今天的位置,帮助确保世界顶级公司的可靠性,这是一段相当长的旅程。我第一次开始实践这门学科,早在它有名字之前几年,在亚马逊,我们的工作就是防止零售网站宕机。当我们取得成功时,Netflix 写了他们关于 Chaos Monkey 的规范博客文章(十年前的今年 7 月)。这个想法成为主流,许多工程师...原创 2022-09-17 19:35:24 · 258 阅读 · 0 评论 -
【混沌工程】什么是混沌工程?
什么是混沌工程?混沌工程让您可以将您认为会发生的事情与系统中实际发生的事情进行比较。 您实际上是“故意破坏”以学习如何构建更具弹性的系统。通过主动测试系统在压力下的响应方式,我们可以在故障出现之前识别并修复故障。 最终,混沌工程的目标是增强我们系统的稳定性和弹性。混沌与可靠性工程技术作为构建可靠应用程序的基本学科正迅速获得关注。 在过去的几年里,许多组织——无论大小——都接受了混沌工程。创建可靠的...原创 2022-09-18 22:27:12 · 606 阅读 · 0 评论