唯品会架构是如何实现重构的

最新推荐文章于 2022-10-19 16:40:40 发布

architect???

最新推荐文章于 2022-10-19 16:40:40 发布

阅读量1k

点赞数 1

分类专栏：成长历程文章标签：并发

本文链接：https://blog.csdn.net/qq_39721761/article/details/79004363

版权

成长历程专栏收录该内容

2 篇文章 0 订阅

订阅专栏

随着唯品会业务的快速发展，订单量的不断增长，原有的订单存储架构已经不能满足公司的发展了，特别是在大促高峰期，原订单库已经成为抢购瓶颈，已经严重制约公司的发展。

唯品会旧订单库包含几十张订单相关表，旧订单库是典型的一主多从架构；主库容量已接近服务器物理空间上限，同时也已经达到 MySQL 的处理上限，很快将无法再处理新增订单。

旧订单库面临的问题有：

1、超大容量问题

订单相关表都已经是超大表，最大表的数据量已经是几十亿，数据库处理能力已经到了极限；
单库包含多个超大表，占用的硬盘空间已经接近了服务器的硬盘极限，很快将无空间可用；

2、性能问题

单一服务器处理能力是有限的，单一订单库的 TPS 也有上限，不管如何优化，总会有达到上限，这限制了单位时间的订单处理能力，这个问题在大促时更加明显，如果不重构，订单达到一定量以后，就无法再继续增长，严重影响到用户体验。

3、升级扩展问题

单一主库无法灵活的进行升级和扩展，无法满足公司快速发展要求；
所有的订单数据都放在同一库里面，存在单点故障的风险；

综上所述，容量、性能问题是急需解决的问题，扩展是为了将来 3~5 年内能够很好的满足唯品会快速发展的需要，而不需要每隔几个月花费人力物力去考虑扩容等问题。

解决方法思考

1、解决容量问题

我们可以考虑到最直接的方式是增加大容量硬盘，或者对 IO 有更高要求，还可以考虑增加 SSD 硬盘来解决容量的问题。此方法无法解决单表数据量问题。

可以对数据表历史数据进行归档，但也需要频繁进行归档操作，而且不能解决性能问题。

2、解决性能问题

提高数据库服务器的配置，这个可以提升一定数量的 QPS 和 TPS，但仍然不能解决单服务器连接数、IO 读写存在上限的问题，此方法仍然存在单点故障的问题。

拆分方法探讨

常见的数据库拆分方式有三种：垂直拆分、水平拆分、垂直水平拆分。

1、垂直拆分

垂直拆库是根据数据库里面的数据表的相关性进行拆分，比如：一个数据库里面既存在用户数据，又存在订单数据，那么垂直拆分可以把用户数据放到用户库、把订单数据放到订单库。如下图：

垂直拆表是对数据表进行垂直拆分的一种方式，常见的是把一个多字段的大表按常用字段和非常用字段进行拆分，每个表里面的数据记录数一般情况下是相同的，只是字段不一样，使用主键关联，如下图：

2、水平拆分

水平拆分是把单表按某个规则把数据分散到多个表的拆分方式，比如：把单表 1 亿数据按某个规则拆分，分别存储到 10 个相同结果的表，每个表的数据是 1 千万，拆分出来的表，可以分别放至到不同数据库中，即同时进行水平拆库操作，如下图：

水平拆分可以降低单表数据量，让每个单表的数据量保持在一定范围内，从而提升单表读写性能。但水平拆分后，同一业务数据分布在不同的表或库中，可能需要把单表事务改成跨表事务，需要转变数据统计方式等。

3、垂直水平拆分

垂直水平拆分，是综合了垂直和水平拆分方式的一种混合方式，垂直拆分把不同类型的数据存储到不同库中，再结合水平拆分，使单表数据量保持在合理范围内，提升总 TPS，提升性能，如下图：

垂直拆分策略

原订单库把所有订单相关的数据（订单销售、订单售后、订单任务处理等数据）都放在同一数据库中，不符合电商系统分层设计，对于订单销售数据，性能第一，需要能够在大促高峰承受每分钟几万到几十万订单的压力；而售后数据，是在订单生成以后，用于订单物流、订单客服等，性能压力不明显，只要保证数据的及时性即可；所以根据这种情况，把原订单库进行垂直拆分，拆分成订单售后数据、订单销售数据、其他数据等，如下图：

水平拆分策略

垂直拆分从业务上把订单下单数据与下单后处理数据分开，但对于订单销售数据，由于数据量仍然巨大，最大的订单销售相关表达到几十亿的数据量，如果遇到大型促销（如：店庆 128、419、618、双十一等等），数据库 TPS 达到上限，单销售库单订单表仍然无法满足需求，还需要进一步进行拆分，在这里使用水平拆分策略。

订单分表是首先考虑的，分表的目标是保证每个数据表的数量保持在 1000~5000 万左右，在这个量级下，数据表的大小与性能是最理想的。

如果几十个分表都放到一个订单库里面，运行于单组服务器上，则受限于单组服务器的处理能力，数据库的 TPS 有限，所以需要考虑分库，把分表放到分库里面，减轻单库的压力，增加总的订单 TPS。

1、用户编号 HASH 切分

使用用户编号哈希取模，根据数据量评估，把单库拆分成 n 个库，n 个库分别存放到 m 组服务器中，如下图：