从单一WAR到多活, 记述一个创业公司的架构演变-CSDN博客

本文链接：https://blog.csdn.net/hopeztm/article/details/75201823

本文讲述了一个初创企业从单一垂直架构逐步发展到分布式服务架构的过程，包括负载均衡、分库分表、读写分离等技术的应用，以及最终实现多活数据中心的挑战与解决方案。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

本故事纯属虚构，如有雷同，实属巧合

程是一个爱折腾，喜欢交朋友的程序员。

某一天，程一个朋友介绍了另外一个朋友创给他，创说他有个点子，可以改变世界，现在就差一个程序员。程看了创的PPT，觉得还不错，反正也没妹子，平时下班回家或者周末也没事干，就答应创，做他的合伙人，给他开发网站。

单一垂直架构

程把他自己在大学的时候做的基于Java的考试管理系统，拿来改了改，又自学了一些前端，三个月后，第一个版本的网站上线了。这个东西的后台大概这个样子，所有的东西都部署在一台服务器上。

负载+垂直架构

上线后的半年，为了适应业务的变更，网站做了多次升级和新功能的研发。伴随着代码越来越庞大，注册用户越来越多，有时候要卡半天，才能刷出页面。创又多花几倍的预算在技术上，买了几台新服务器。然后这套系统变成了下面的样子，Mysql终于可以单独放在一台服务器上了，使用负载均衡后，可以把服务器实例(war)拷贝后部署到几台机器上了。

升级后，瞬间快了很多。

分布式服务架构

后来，这个公司拿到了天使投资，程也全职加入了，身份是CTO，而理所当然的，创做了CEO。陆续也有运营和市场的合伙人加入，日活有几万了。程也不用自己写前端了，因为招了2个专门的前端工程师，还有另外2个做服务器的小伙子。市场变化很多，每天都有新需求，每天都可能上线新功能。

但是，当前这样的服务器代码体系，让他越来越力不从心。

1. 这么一坨庞大的代码融在一起，维护成本和新人学习成本都是特别高的。 2. 想招一个实习生，但是如果开放给他权限就是所有代码，真担心这个实习生把代码拿去卖了。 3. 代码构建的时间越来越长，程序员最不喜欢的就是等了。 4. 发布成本也很高，因为每次发布都是全量发布。有些核心功能，需要全天服务用户，所以白天几乎不可能发布。即时发布一个无关紧要的功能，也要等到晚上，出了Bug还要赶紧修复，长期熬夜，真是觉得这个世界充满恶意。

不能再这样下去了......

其实程很早就听过分布式架构（SOA），也知道主流的公司都在用这些。但是现在业务代码已经十分庞大了，至少十几万，并且有大量重复和“不敢动的”代码，重构成SOA，至少要两个月，公司新需求不断，怎么可能。

经过一个月的挣扎，真心觉得不能忍了，决定升级架构成SOA，调研后发现阿里的开源框架Dubbo (http://dubbo.io) 好像使用的蛮多，文档也挺全的，所以决定用它。

重构前，首先梳理了一下业务，按照业务相关性，拆分成若干的底层SOA服务和API层服务。这个重构大概进行了2个月，CEO没技术背景，完全不知道他们提的SOA是个啥，新需求不能被满足，已经处于崩溃边缘。

终于，新架构上线了，它大概长成这个样子。

这里，每个服务包括API服务和基础的SOA服务都可以部署在不同的机器上，他们之间的发现是通过Zookeeper集群协调的。启动一个服务后，它就会注册自己到Zookeeper上，服务调用方被通知，新的服务实例上线。服务调用方持有一个服务的多个调用实例，采用某种策略进行负载。

可以按照业务需求，有选择的扩容指定服务，举个栗子，例如商城做双十一活动，有很多秒杀商品，那么只需要多部署几个和商城相关的服务即可。如果按照之前的架构设计，所有功能都在一个war中，只能对所有功能扩容，浪费计算资源。

当然，还有一些任务被改造成定时任务，就是图中的Scheduled模块，例如结算等，这样运营或者程序员就不用大半夜起来做事了。

分库分表，读写分离

半年后，公司又融了几千万的A轮，用户数进一步扩大。高峰时段越来越卡，各种Log分析系统时间和分析Mysql慢日志发现，因为数据量越来越多，并发数越来越大，主存储已经有点Hold不住了。并且程越来越担心万一哪天，那台Mysql机器硬盘出故障，废了，公司的所有的数据就都没了。

后来无意见，程发现了Mycat（http://mycat.io) 这个数据库中间件，原来还以利用它做分库分表，读写分离这些自己实践起来十分困难的高级Feature。

经过了差不多一个月的调研，实践，测试，升级后的Mysql集群变成了如下的样子。

做了分库分表后，再也不用担心太多数据把单一Mysql服务器硬盘撑满的问题了，并且也更方便了权限管理。启用Slave从节点后，也不用担心单一主节点硬盘故障后，数据的丢失问题了。读写分离后，前端访问速度也快了很多，增删改查被分散到不同的机器，单节点的效率瓶颈有了很明显的缓解。

DRC（Data Replication Center）

伴随着业务种类越来越多，数据越来越多，依赖Mysql的索引的搜索早就显得力不从心。为了性能，只能支持某个字段的StartWith搜索。包含和模糊搜索都不能做，所以就用了Elastic Search做通用搜索引擎。为了进一步提升读效率，也把很多登录信息和用户好友关系这些经常读的数据，放入Redis中做缓存。

同一份数据，既要放入ES，还要放入Redis，早期这个功能实现大概如下：