详解大型互联网项目服务端架构演进历程_it项目 大规模服务器

本文讨论了数据处理中关于本地和远程缓存的选择,分布式缓存的扩容问题及算法优劣,服务器集群和负载均衡策略,以及如何解决Session共享和数据库读写分离的问题。重点分析了不同技术和解决方案的适用场景及优缺点。
摘要由CSDN通过智能技术生成

具有哪种业务特点的数据使用本地缓存?

具有哪种业务特点的数据使用远程缓存?

分布式缓存在扩容时会碰到什么问题?如何解决?

分布式缓存的算法都有哪几种?各有什么优缺点?

这些问题都是我们在利用这个架构时需要思考和解决的问题。

这个时候随着访问的QPS不断提高,服务器的处理能力,

假设我们使用的Application Server是tomcat,那么tomcat就会成为一个瓶颈,虽然我们可以通过购买更强大的硬件,但是总会有上线,并且这个成本到后期是一个指数级的增长。

这个时候我们就需要做一个服务器的集群,我们要加一个新东西,【负载均衡调度服务器】

服务器集群之后,我们可以横向扩展我们的服务器了;

解决了服务器处理能力的一个瓶颈;

这个时候我们要要思考几个问题

负载均衡的调度策略都有哪些?各有什么优缺点?各适合什么场景?

打个比方,我们有轮询、权重、地址散列

地址散列又分为源ip地址散列和目标ip地址散列,最少连接和加权最少连接,还有根据这些策略升级而来的很多策略。

例如轮询优点就是实现简单,缺点就是不考虑每台服务器处理能力;

权重我们考虑了服务器处理能力的问题;

地址散列可以使用同一个用户访问同一个服务器;

最少连接可以使集群中各个服务器负载更加均匀;

加权最少连接就是指在最少连接的基础上,为每台服务器加上权值;算法就是(活动连接数*256+非活动连接数)/权重;计算出来的值小的服务器优先被选择;

这里我们如图所示增加了一个负载均衡调度器,应用呢增加了一个Cluster;也就是说一个集群;

在使用了这种架构之后呢,我们有这么一个场景,我们登录的时候,登录了A服务器;Session信息存储到A服务器上;假设我们使用的负载均衡策略是根据ip进行一个哈希散列,那么登录信息还可以从A服务器上访问到;但是IP哈希不够分散也不够均匀;

这就有可能造成某些服务器压力过大,某些服务器又没有什么压力;

这个时候我们机器网卡的带宽就有肯能成为一个瓶颈;

这个时候我们使用轮询或者最少连接的负载均衡则略,

这就导致了我们地址访问A服务器,把Session信息存储到A服务器上,第二次是有可能访问到B服务器,这个时候存储在A服务器上的Session信息在B服务器上是读取不到的。那么我们就要解决session管理的问题?

我们使用session sticky粘滞会话这种方式来解决这个问题;

打个比方如果我们每次吃饭都有使用自己的碗筷,而只要在一家饭店里存着我们的碗筷,我们每次去这家饭店吃饭就好了,因为那里存着我们的碗筷;

它的处理规则是对于同一连接中的数据包负载均衡会将其进行一个NAT转化后转发至后端固定的服务器进行处理,也就是如图所示

例如我们图中所示的Browser1走到负载均衡服务器然后走1的路径到底Application当中;也就是说我们的Browser1每次都会访问到1的Application。这种方案解决了Session共享的问题。但是它也有一些缺点,第一个缺点,1这个服务器重启了上面的Session将全部消失,第二个缺点就是我们的负载均衡服务器成了一个有状态的机器,要实现容灾会有麻烦。

我们接着看第二个解决方案,Session复制

也就是说Browser1通过负载均衡服务器访问到1这个Application当中的时候,会把这个用户的Session复制到第二个用户的服务器上;也就是说这两个服务器都保留着Browser1的Session信息;

打个比方就好比所在的饭店里都存着自己的碗筷,我们去哪个饭店都OK,都有自己的碗筷;

我们又解决了Session共享的问题;但是它也有缺点,应用服务器带宽之间的问题;Application1和Aplication2之间要不断的同步Session信息;另外一个就是当我们大量用户在线的时候,我们这个服务器占用的内存会过多,不适合做大规模集群,适合做机器不多的情况;

我们在看第三种解决方案

这种就是基于Cookie,打个比方类似我们去吃饭,每次都把自己的碗筷带上,这样去哪家饭店都OK,都可以吃饭;

我们带着Session信息的Cookie去访问我们的应用服务器;这种方式也解决了我们Session共享的问题;

但是它也是有缺点的,首先我们Cookie的长度是有限制的;其次Cookie保存在浏览器上安全性也是一个问题;

那么我们再看第四种解决方案,我们把Session做成一个Session服务器

这样的请求路径就是Browser1通过负载均衡服务器请求到Application1当中,然后它把Browser1的Session信息存到Session Server当中;当想获取Session的时候,应用就从Session服务器当中获取Session;我们所以用户的Session信息都统一保存到Session Server当中;

这个就好比我们去饭店,我们也不自己带着碗筷,饭店共有一个很大的橱柜,我们的碗筷都存在那里;我们去A饭店,A饭店就去橱柜里面去找你的碗筷,如果我们去B饭店,B饭店也会从橱柜中拿好你的碗筷;

这里我们要考虑以下几个缺点;

在目前这个架构中Session Server是一个单点的,我们要如何解决这个单点,保证它的可用性,我们可以把Session Server也做成一个集群;这种方式适用于Session数量及Web服务器数量大的情况;

同时我们改成这种架构之后,我们在写应用的时候也要调整Session存储的业务逻辑;

在招聘面试时经常会遇到类似的问题;

在解决了横向扩展应用服务器之后,

我们数据库的读与写操作都需要经过数据库,当用户量达到一定量时,数据库又成为了一个瓶颈;

那么如何解决呢?我们使用了数据库的读写分离;

Msster是主库,Slave是从库;同时我们应用要接入多数据源,并且经过统一的数据访问模型data access module进行访问;

数据库读写分离将所有的读操作引入到Slave这个服务器,将所有的写操作全部引入Master服务器,引入到我们的主库当中;

因为我们数据库读写分离了,所以我们应用程序也要做出相应的变化;我们在Local Cache实现了一个数据访问模块,使上层写代码的人不知道读写分离的存在;这样我们读数据源的读写对业务代码就没有了侵入,这里就引入了代码层次的一个演变;

如何支持多数据源?

如何封装对业务没有侵入?

如何使用目前业务使用的ORM框架完成主从的读写分离?

是否需要更换ORM?又各有什么优缺点?如何取舍?

当我们的访问量过大的时候,也就是说数据库的IO非常大,我们数据库的读写分离又会遇到以下问题。

例如我们的主库和从库在复制的时候有没有延时?

如果我们将主库和从库在分机房部署的话,跨机房传输同步数据 ,这个更是一个问题;

另外一个问题是应用对应数据源的路由问题?

这些都是我们要思考和解决的点?

我们接着演进,我为服务器添加CDN和反向代理服务器;

最全的Linux教程,Linux从入门到精通

======================

  1. linux从入门到精通(第2版)

  2. Linux系统移植

  3. Linux驱动开发入门与实战

  4. LINUX 系统移植 第2版

  5. Linux开源网络全栈详解 从DPDK到OpenFlow

华为18级工程师呕心沥血撰写3000页Linux学习笔记教程

第一份《Linux从入门到精通》466页

====================

内容简介

====

本书是获得了很多读者好评的Linux经典畅销书**《Linux从入门到精通》的第2版**。本书第1版出版后曾经多次印刷,并被51CTO读书频道评为“最受读者喜爱的原创IT技术图书奖”。本书第﹖版以最新的Ubuntu 12.04为版本,循序渐进地向读者介绍了Linux 的基础应用、系统管理、网络应用、娱乐和办公、程序开发、服务器配置、系统安全等。本书附带1张光盘,内容为本书配套多媒体教学视频。另外,本书还为读者提供了大量的Linux学习资料和Ubuntu安装镜像文件,供读者免费下载。

华为18级工程师呕心沥血撰写3000页Linux学习笔记教程

本书适合广大Linux初中级用户、开源软件爱好者和大专院校的学生阅读,同时也非常适合准备从事Linux平台开发的各类人员。

需要《Linux入门到精通》、《linux系统移植》、《Linux驱动开发入门实战》、《Linux开源网络全栈》电子书籍及教程的工程师朋友们劳烦您转发+评论

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化的资料的朋友,可以点击这里获取!

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值