蚂蚁金服天街:蚂蚁双11大促OceanBase核心技术全解析

演讲嘉宾简介:田启杰(花名:天街)

现任蚂蚁金服高级技术专家,2012年加入OceanBase 团队,曾五次作为OceanBase负责人承担双11大促保障工作,致力于OceanBase 提供高可用/高性能/低成本的数据库服务,在数据库相关技术及业务大促保障上有多年的沉淀和积累。

本次视频精彩回顾,戳这里!以下内容根据演讲嘉宾视频分享以及PPT整理而成。

本次的分享主要围绕以下五个方面:

  1. 2018 OceanBase大促概述
  2. 百万支付&OceanBase2.0
  3. 容器化
  4. 平台智能化
  5. 未来发展规划

一、2018 OceanBase大促概述

对于OceanBase数据库而言,在大促面前需要面对来自容量、稳定、成本、效率、压测和弹性这6个方面的挑战:

容量。如何支撑全国人民一起去买东西是一个难题。容量方面主要可以分为两个点,数据库单机性能和某一个集群的容量,而这两点无论在哪一个层面上都要考虑大促的需求。单机性能指的是在大促压力下,数据库单机能否满足某个业务的需求;而集群容量则需要综合考虑应用、网络、机房的组合,争取使成本降到最低。

稳定。稳定大于一切!高峰期的任何抖动都可能对用户产生很大影响。

成本。在平时状态下,每秒大约有8000人正在完成支付,但双11需要支撑40多万人并发进行支付,因此服务能力可能需要增长五六十倍,那么,机器是否需要增加五六十倍呢?因此,需要思考能否使用尽量少的机器来节省成本。除了大促商品优惠的成本,技术人员所需要考虑的最大成本就是机器成本。

效率。前几年可能在每年的六月份就要开始准备双11,那时所投入的人力成本很大。而如果在一个月的时间内完成大促准备,就需要高效率。

压测。如果大促的流量要翻五六十倍,那么为了保证增加新机器时不出问题,并且成本可控,就需要尽可能模拟真实业务的工作压力,把真实情况下的热点对数据库的冲击在压测环境下模拟出来。

弹性。弹性指的是将所有服务,包括从前端入口、应用服务器、数据库以及网络,通通从原本的服务站点很快地迁移到一个全新的站点上面去的能力。此外,还需要在迁移的过程中将原本一秒八千多的支付能力拓展到四十多万的支付能力。

如果能够合理应对以上6点挑战,那么就能够在技术角度完美地支持和应对双11大促。

OceanBase弹性化体系
基础设施。基础设施中包括网络、存储、内核以及机房。网络指的是在云环境下的XGW虚拟的网络和VPC的网络。存储投在物理机或者ECS上面,高性能的ECS怎么和DB的容器进行结合。操作系统的能力上从内核来看OceanBase是AIO,DIO,CPU的隔离以及CPU的share。机房的Mancore互联,可以认为它是一个网络的创新,实际上是让三个机房两两互联,两个机房之间任意一条网络断掉,都能保证至少有两个机房是能够工作的。

基础架构。基础架构统一的基座是容器和资源,比如阿里云公共的服务器。再往上是OceanBase本身在大促体系下的一些关键的属性,比如租户的拆百和分区,独立异构的FO。FO是指拉起新的独立的没有任何运行关联的库让业务恢复起来。第四个是三地五中心。然后是多副本架构,其中有提供具有读写能力的副本,提供只读的副本以及只投票的副本,这种不同的副本类型结合OceanBase的弹性,再搭配进行工作。

能力沉淀。OceanBase做的一些服务站,比方说OCP,以及其他一些模块。可以认为将大促中提到的6个点的通用能力给抽象出来,然后和日常服务相结合,沉淀出通用的能力。

大促服务。无损压测指的是做一些模拟压测时保证对线上业务没有任何影响,统一的思想就是隔离。隔离时要及时把压测的流量熔断掉,比如说把DB的水位,应用服务器的访问的ID做一些预测。如果任务出来会挂掉的话,就要进行压测,或者把资源在真实的在线库和压测库之间做一个快速的迁移。极致弹性

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值