小红书SRE负责人陈鹏:云原生时代的跨云多活之路怎么走?

小红书SRE负责人陈鹏分享了云原生时代下,小红书如何进行跨云多活建设。多活筹备涉及服务梳理、可行性验证和技术招标;建设阶段包括东西向流量调度、南北向流量调度和业务改造;治理阶段涵盖预案建设、容量管理和加强巡检能力。目标是实现高容灾能力,保证业务连续性。
摘要由CSDN通过智能技术生成

嘉宾 | 陈鹏    整理 | 张雨生

出品 | CSDN云原生

小红书近年来发展迅猛,已经到了一个比较大的体量,这对其技术架构提出了较高的挑战。因此,为了解决业务增长、技术架构迭代和容灾要求等方面的问题,小红书开启了跨云多活的建设。而随着云原生时代的到来,跨云多活之路怎么走已经不再只是“布道”了。

2022年4月12日,在CSDN云原生系列在线峰会第1期“SRE与智能运维峰会”上,小红书SRE业务运维组负责人陈鹏分享了在云原生时代,小红书跨云多活能力建设的三个主要阶段。

要点简述

  • 多活筹备阶段,包括服务梳理、可行性验证和技术招标三个步骤。服务梳理即需要进行业务梳理和数据梳理;可行性验证就是确定能不能做,以及贵不贵的问题;技术招标则依据不同的场景进行性价比比较,以选择合适的厂商或者机房。

  • 多活建设阶段,包括东西向流量调度改造、南北向流量调度改造和业务改造三个方面。东西向流量调度改造需要设置服务层级上限,以及进行机房启用控制;南北向流量调度改造的目标即是要支持多云、多地域,并且提供不同层级的流量调度;业务改造主要就是升级中间件以支持新的跨云多活服务和进行可观测性支持。

  • 多活治理阶段,包括预案建设、容量管理和加强巡检能力三项工作。预案建设即对客户端切流、RGW切流、东西向流量切流和服务算力降级进行选择与优化;容量管理包括区域级别容量管理和服务级别容量管理,并且需要进行区域单元化治理;加强巡检能力的原则就是保证环境、资源、流量和监控的对齐。

背景和目标

 小红书业务的容器化程度较高,达到80%,包括Redis-KV服务和Flink实时流等都实现了容器化。

在业务增长速度快、大体量的要求下,技术架构也在不断迭代。而在这样一个迭代的技术业务架构中,小红书对于容灾要求非常高,因为一旦出现故障或者问题,会很容易上热搜。

基于这样的背景,小红书想要做的就是避免服务是单云的。目前小红书的业务主要是基于单一公共云的,由于其容器化程度高的特点,想要做到避免单云还是比较简单的。因此,小红书提出了一个比较大的跨云多活能力建设的目标,即不仅要实现跨云,还要支持异地,以及将服务或者业务的场景组成单元化。

其实无论是小红书还是其他移动应用,技术架构都差不多。基本上都是由客户端请求发送到LB,然后再到网关,网关下面会有业务网关,最后由API网关将其分配到不同的业务上。对于小红书来讲,其核心业务还是比较清晰的,有搜索推荐和社区。其跨云多活

  • 4
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值