4 网站架构模式

1 分层

分层是企业应用系统中最常见的一种架构模式,将系统在横向维度上切分成几个部 分,每个部分负责一部分相对比较单一的职责,然后通过上层对下层的依赖和调用组成 一个完整的系统。

分层结构在计算机世界中无处不在,网络的7层通信协议是一种分层结构;计算机 硬件、操作系统、应用软件也可以看作是一种分层结构。在大型网站架构中也采用分层 结构,将网站软件系统分为应用层、服务层、数据层,如表2.1所示。

在这里插入图片描述

应用层 负责具体业务和视图展示,如网站首页及搜索输入和结果展示

服务层 为应用层提供服务支持,如用户管理服务,购物车服务等

数据层 提供数据存储访问服务,如数据库、缓存、文件、搜索引擎等

通过分层,可以更好地将一个庞大的软件系统切分成不同的部分,便于分工合作开 发和维护;各层之间具有一定的独立性•,只要维持调用接口不变,各层可以根据具体问 题独立演化发展而不需要其他层必须做岀相应调整。

但是分层架构也有一些挑战,就是必须合理规划层次边界和接口,在开发过程中, 严格遵循分层架构的约束,禁止跨层次的调用(应用层直接调用数据层)及逆向调用(数 据层调用服务层,或者服务层调用应用层)。

在实践中,大的分层结构内部还可以继续分层,如应用层可以再细分为视图层(美 工负责)和业务逻辑层(工程师负责);服务层也可以细分为数据接口层(适配各种输入 和输出的数据格式)和逻辑处理层。

分层架构是逻辑上的,在物理部署上,三层结构可以部署在同一个物理机器上,但 是随着网站业务的发展,必然需要对已经分层的模块分离部署,即三层结构分别部署在 不同的服务器上,使网站拥有更多的计算资源以应对越来越多的用户访问。

所以虽然分层架构模式最初的目的是规划软件清晰的逻辑结构便于开发维护,但在

网站的发展过程中,分层结构对网站支持高并发向分布式方向发展至关重要。因此在网 站规模还很小的时候就应该采用分层的架构,这样将来网站做大时才能有更好地应对。


2 分割

如果说分层是将软件在横向方面进行切分,那么分割就是在纵向方面对软件进行切分。

网站越大,功能越复杂,服务和数据处理的种类也越多,将这些不同的功能和服务

分割开来,包装成高内聚低耦合的模块单元,一方面有助于软件的开发和维护;另一方 面,便于不同模块的分布式部署,提高网站的并发处理能力和功能扩展能力。

大型网站分割的粒度可能会很小。比如在应用层,将不同业务进行分割,例如将购 物、论坛、搜索、广告分割成不同的应用,由独立的团队负责,部署在不同的服务器上; 在同一个应用内部,如果规模庞大业务复杂,会继续进行分割,比如购物业务,可以进 一步分割成机票酒店业务、3C业务,小商品业务等更细小的粒度。而即使在这个粒度上, 还是可以继续分割成首页、搜索列表、商品详情等模块,这些模块不管在逻辑上还是物 理部署上,都可以是独立的。同样在服务层也可以根据需要将服务分割成合适的模块。


3 分布式

对于大型网站,分层和分割的一个主要目的是为了切分后的模块便于分布式部署, 即将不同模块部署在不同的服务器上,通过远程调用协同工作。分布式意味着可以使用 更多的计算机完成同样的功能,计算机越多,CPU、内存、存储资源也就越多,能够处理

的并发访问和数据量就越大,进而能够为更多的用户提供服务。

但分布式在解决网站高并发问题的同时也带来了其他问题。首先,分布式意味着服 务调用必须通过网络,这可能会对性能造成比较严重的影响;其次,服务器越多,服务 器宕机的概率也就越大,一台服务器宕机造成的服务不可用可能会导致很多应用不可访 问,使网站可用性降低;另外,数据在分布式的环境中保持数据一致性也非常困难,分 布式事务也难以保证,这对网站业务正确性和业务流程有可能造成很大影响;分布式还 导致网站依赖错综复杂,开发管理维护困难。因此分布式设计要根据具体情况量力而行, 切莫为了分布式而分布式。

  • 分布式应用和服务:将分层和分割后的应用和服务模块分布式部署,除了可以改善 网站性能和并发性、加快开发和发布速度、减少数据库连接资源消耗外;还可以使不同 应用复用共同的服务,便于业务功能扩展。

  • 分布式静态资源:网站的静态资源如JS, CSS, Logo图片等资源独立分布式部署, 并采用独立的域名,即人们常说的动静分离。静态资源分布式部署可以减轻应用服务器 的负载压力;通过使用独立域名加快浏览器并发加载的速度;由负责用户体验的团队进 行开发维护有利于网站分工合作,使不同技术工种术业有专攻。

  • 分布式数据和存储:大型网站需要处理以P为单位的海量数据,单台计算机无法提 供如此大的存储空间,这些数据需要分布式存储。除了对传统的关系数据库进行分布式 部署外,为网站应用而生的各种NoSQL产品几乎都是分布式的。

  • 分布式计算:严格说来,应用、服务、实时数据处理都是计算,网站除了要处理这 些在线业务,还有很大一部分用户没有直观感受的后台业务要处理,包括搜索引擎的索 引构建、数据仓库的数据分析统计等。这些业务的计算规模非常庞大,目前网站普遍使 用Hadoop及其MapReduce分布式计算框架进行此类批处理计算,其特点是移动计算而 不是移动数据,将计算程序分发到数据所在的位置以加速计算和分布式计算。

此外,还有可以支持网站线上服务器配置实时更新的分布式配置;分布式环境下实 现并发和协同的分布式锁;支持云存储的分布式文件系统等。


4 集群

使用分布式虽然已经将分层和分割后的模块独立部署,但是对于用户访问集中的模 块(比如网站的首页),还需要将独立部署的服务器集群化,即多台服务器部署相同应用 构成一个集群,通过负载均衡设备共同对外提供服务。

更多用户访问的时候,只需要向集群中加入新的机器即可。同时因为一个应用由多台服 务器提供,当某台服务器发生故障时,负载均衡设备或者系统的失效转移机制会将请求 转发到集群中其他服务器上,使服务器故障不影响用户使用。所以在网站应用中,即使 是访问量很小的分布式应用和服务,也至少要部署两台服务器构成一个小的集群,目的 就是提高系统的可用性。


5 缓存

缓存就是将数据存放在距离计算最近的位置以加快处理速度。缓存是改善软件性能 的第一手段,现代CPU越来越快的一个重要因素就是使用了更多的缓存,在复杂的软件 设计中,缓存几乎无处不在。大型网站架构设计在很多方面都使用了缓存设计。

  • CDN:即内容分发网络,部署在距离终端用户最近的网络服务商,用户的网络请求 总是先到达他的网络服务商那里,在这里缓存网站的一些静态资源(较少变化的数据), 可以就近以最快速度返回给用户,如视频网站和门户网站会将用户访问量大的热点内容 缓存在CDNo

  • 反向代理:反向代理属于网站前端架构的一部分,部署在网站的前端,当用户请求 到达网站的数据中心时,最先访问到的就是反向代理服务器,这里缓存网站的静态资源, 无需将请求继续转发给应用服务器就能返回给用户。

  • 本地缓存:在应用服务器本地缓存着热点数据,应用程序可以在本机内存中直接访 问数据,而无需访问数据库。

  • 分布式缓存:大型网站的数据量非常庞大,即使只缓存一小部分,需要的内存空间

也不是单机能承受的,所以除了本地缓存,还需要分布式缓存,将数据缓存在一个专门的分布式缓存集群中,应用程序通过网络通信访问缓存数据。

使用缓存有2个前提条件,医师数据访问热点不均衡,某些数据会被更频繁的访问,

这些数据应该放在缓存中;二是数据在某个时间段内有效,不会很快过期,否则缓存的 数据就会因已经失效而产生脏读,影响结果的正确性。网站应用中,缓存除了可以加快 数据访问速度,还可以减轻后端应用和数据存储的负载压力,这一点对网站数据库架构 至关重要,网站数据库几乎都是按照有缓存的前提进行负载能力设计的。


6 异步

笔者福利

以下是小编自己针对马上即将到来的金九银十准备的一套“面试宝典”,不管是技术还是HR的问题都有针对性的回答。

有了这个,面试踩雷?不存在的!

回馈粉丝,诚意满满!!!




iqjNEv-1714252795134)]
[外链图片转存中…(img-xjFwpd13-1714252795135)]
[外链图片转存中…(img-lbY9nJUP-1714252795135)]
[外链图片转存中…(img-sC0EmRVQ-1714252795136)]

本文已被CODING开源项目:【一线大厂Java面试题解析+核心总结学习笔记+最新讲解视频+实战项目源码】收录

  • 18
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值