系统设计 - 大规模微服务稳定性保障实践

原创: 字节跳动 高威

 

微服务的挑战 & 引言

微服务相比单体应用, 整体复杂度更高, 成功的实施无法一蹴而就

过程中基于传统服务框架和Service Mesh技术构建的微服务可能并存

单一服务可能同时运行于不同数据中心的物理机, VM和容器之上

技术栈和运行时的异构增加了微服务的运维成本, 并可能对敏捷交付产生影响

为了应对以上挑战, 需要从研发流程基础设施维度审视微服务生命周期稳定性保障需要解决哪些关键问题, 以及如何建设相应的配套设施平台

 

 

实施落地的挑战

 

微服务实施要素

开发测试:     1. 边界 & 架构  2. 自动化测试

自动化:        1. 部署运维 2. 安全控制

服务集成:     1. 注册与发现 2. 同步or 异步

流量管理:     1. 熔断 2. 降级 3. 限流

服务观测:     1. Metric 2. Log 3. Tracing

 

1. 要站在全局视角对服务边界做明确的定义: "过大"的服务不利于敏捷迭代, "过小" 的服务引起服务数量爆炸, 治理维护困难

2. 养成"面向失败"的编程思维模式: 每行代码, 每个资源, 每个节点都可能会出故障/异常, 

3. 单个服务要做好限流

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
《腾讯大规模云原生平台稳定性实践.pdf》是一份关于腾讯公司在云原生平台建设过程中的实践经验总结报告。该报告共有300页,并深入探讨了腾讯公司在云原生平台建设中所面临的挑战、解决方案以及取得的成就。 腾讯作为中国领先的互联网巨头,对于云原生平台的稳定性具有极高的要求。该报告从多个方面讨论了如何提高平台的稳定性,为读者提供了丰富的技术方法和经验。 首先,报告从架构设计的角度入手,详细介绍了腾讯在云原生平台中采用的微服务架构、容器技术以及消息队列等关键技术,以保证平台的稳定运行。其次,报告探讨了自动化运维和监控体系的建设,通过引入DevOps理念和持续集成/持续交付工具,实现了平台的快速迭代和故障自愈。同时,腾讯还建立了全面的监控体系,从基础设施到应用层,实时监测和预警系统的异常情况,及时做出反应。 此外,报告还分享了腾讯在灾备和故障演练方面的经验。通过多地数据中心的部署和数据的多重备份,腾讯保证了平台和数据的高可用性。而定期的故障演练则帮助发现和解决潜在的问题,提高系统的容错能力。 总之,腾讯大规模云原生平台稳定性实践中详细介绍了腾讯在云原生平台建设中所采取的措施和实施效果。通过不断完善和优化平台的架构、运维和灾备机制,腾讯成功地实现了稳定高效的云原生平台,为公司业务的发展提供了有力的支持。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值