2024年详解大型互联网项目服务端架构演进历程_it项目大规模服务器，微信小程序趋势及前景

夹谷景曜

于 2024-05-09 20:51:08 发布

阅读量254

点赞数 3

分类专栏：程序员文章标签：架构服务器微信小程序

本文链接：https://blog.csdn.net/2301_77118221/article/details/138631238

版权

程序员专栏收录该内容

131 篇文章 1 订阅

订阅专栏

网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。

需要这份系统化的资料的朋友，可以点击这里获取！

一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！

随着用户越来越多，访问量越来越大，硬盘、CPU、内存等开始吃紧，一台服务器已经满足不了了

这时我们讲数据服务和应用服务进行一个分离，给应用服务器配置更好的CPU，内存等等，而给数据服务器配置更好、更快、更大的硬盘。

利润我们这张图利用了三台服务器，分离之后可以提高一定的性能和可用性，假如文件服务器挂了，我们还是可以操作应用和数据库的。

随着访问的并发越来越高，为了降低接口访问时间提高服务性能，

我们发现有些业务数据不需要每次都从数据库中获取，于是我们使用了缓存，因为80%的业务访问都集中在20%的业务数据上，也就是俗称的二八原则。如果我们能将这部分数据缓存起来，性能一下子就上来了。

而缓存又分为本地缓存和远程缓存两种，远程缓存又分为远程的单机缓存和远程的分布式缓存；

例如我们途中画的就是一个分布式缓存的集群；

这时我们要思考一下，具有哪种业务特点的数据要用缓存？

具有哪种业务特点的数据使用本地缓存？

具有哪种业务特点的数据使用远程缓存？

分布式缓存在扩容时会碰到什么问题？如何解决？

分布式缓存的算法都有哪几种？各有什么优缺点？

这些问题都是我们在利用这个架构时需要思考和解决的问题。

这个时候随着访问的QPS不断提高，服务器的处理能力，

假设我们使用的Application Server是tomcat，那么tomcat就会成为一个瓶颈，虽然我们可以通过购买更强大的硬件，但是总会有上线，并且这个成本到后期是一个指数级的增长。

这个时候我们就需要做一个服务器的集群，我们要加一个新东西，【负载均衡调度服务器】

服务器集群之后，我们可以横向扩展我们的服务器了；

解决了服务器处理能力的一个瓶颈；

这个时候我们要要思考几个问题

负载均衡的调度策略都有哪些？各有什么优缺点？各适合什么场景？

打个比方，我们有轮询、权重、地址散列

地址散列又分为源ip地址散列和目标ip地址散列，最少连接和加权最少连接，还有根据这些策略升级而来的很多策略。

例如轮询优点就是实现简单，缺点就是不考虑每台服务器处理能力；

权重我们考虑了服务器处理能力的问题；

地址散列可以使用同一个用户访问同一个服务器；

最少连接可以使集群中各个服务器负载更加均匀；

加权最少连接就是指在最少连接的基础上，为每台服务器加上权值；算法就是(活动连接数*256+非活动连接数)/权重；计算出来的值小的服务器优先被选择；

这里我们如图所示增加了一个负载均衡调度器，应用呢增加了一个Cluster；也就是说一个集群；

在使用了这种架构之后呢，我们有这么一个场景，我们登录的时候，登录了A服务器；Session信息存储到A服务器上；假设我们使用的负载均衡策略是根据ip进行一个哈希散列，那么登录信息还可以从A服务器上访问到；但是IP哈希不够分散也不够均匀；

这就有可能造成某些服务器压力过大，某些服务器又没有什么压力；

这个时候我们机器网卡的带宽就有肯能成为一个瓶颈；

这个时候我们使用轮询或者最少连接的负载均衡则略，

这就导致了我们地址访问A服务器，把Session信息存储到A服务器上，第二次是有可能访问到B服务器，这个时候存储在A服务器上的Session信息在B服务器上是读取不到的。那么我们就要解决session管理的问题？

我们使用session sticky粘滞会话这种方式来解决这个问题；

打个比方如果我们每次吃饭都有使用自己的碗筷，而只要在一家饭店里存着我们的碗筷，我们每次去这家饭店吃饭就好了，因为那里存着我们的碗筷；

它的处理规则是对于同一连接中的数据包负载均衡会将其进行一个NAT转化后转发至后端固定的服务器进行处理，也就是如图所示

例如我们图中所示的Browser1走到负载均衡服务器然后走1的路径到底Application当中；也就是说我们的Browser1每次都会访问到1的Application。这种方案解决了Session共享的问题。但是它也有一些缺点，第一个缺点，1这个服务器重启了上面的Session将全部消失，第二个缺点就是我们的负载均衡服务器成了一个有状态的机器，要实现容灾会有麻烦。

我们接着看第二个解决方案，Session复制

也就是说Browser1通过负载均衡服务器访问到1这个Application当中的时候，会把这个用户的Session复制到第二个用户的服务器上；也就是说这两个服务器都保留着Browser1的Session信息；

打个比方就好比所在的饭店里都存着自己的碗筷，我们去哪个饭店都OK，都有自己的碗筷；

我们又解决了Session共享的问题；但是它也有缺点，应用服务器带宽之间的问题；Application1和Aplication2之间要不断的同步Session信息；另外一个就是当我们大量用户在线的时候，我们这个服务器占用的内存会过多，不适合做大规模集群，适合做机器不多的情况；

我们在看第三种解决方案

这种就是基于Cookie，打个比方类似我们去吃饭，每次都把自己的碗筷带上，这样去哪家饭店都OK，都可以吃饭；

我们带着Session信息的Cookie去访问我们的应用服务器；这种方式也解决了我们Session共享的问题；

但是它也是有缺点的，首先我们Cookie的长度是有限制的；其次Cookie保存在浏览器上安全性也是一个问题；

那么我们再看第四种解决方案，我们把Session做成一个Session服务器

这样的请求路径就是Browser1通过负载均衡服务器请求到Application1当中，然后它把Browser1的Session信息存到Session Server当中；当想获取Session的时候，应用就从Session服务器当中获取Session；我们所以用户的Session信息都统一保存到Session Server当中；

这个就好比我们去饭店，我们也不自己带着碗筷，饭店共有一个很大的橱柜，我们的碗筷都存在那里；我们去A饭店，A饭店就去橱柜里面去找你的碗筷，如果我们去B饭店，B饭店也会从橱柜中拿好你的碗筷；

这里我们要考虑以下几个缺点；

在目前这个架构中Session Server是一个单点的，我们要如何解决这个单点，保证它的可用性，我们可以把Session Server也做成一个集群；这种方式适用于Session数量及Web服务器数量大的情况；

同时我们改成这种架构之后，我们在写应用的时候也要调整Session存储的业务逻辑；

在招聘面试时经常会遇到类似的问题；

在解决了横向扩展应用服务器之后，