大型网站架构模式

2.1 分层
分层是企业应用系统中最常见得一种架构模式,将系统在横向维度上切分成几个不同部分,每个部分负责一部分相对比较单一的职责,然后通过上层对下层的依赖和调用组成一个完整的系统。
将网站系统分为应用层、服务层、数据层。应用层负责具体的业务和视图展示,如网站首页及搜索输入和结果展示;服务层为应用层提供服务支持,如用户管理服务,购物车服务等;数据层提供数据存储访问服务,如数据库、缓存、文件、搜索引擎等。
通过分层,可以更好地将一个庞大的软件系统切分成不同的部分,便于分工合作开发和维护;各层之间具有一定的独立性,只要维持调用接口不变,各层可以根据具体问题独立演化发展而不需要其他层做出相应的调整。
但分层架构也有一些挑战,就是必须合理规划层次边界和接口,在开发过程中,严格遵循分层架构的约束,禁止跨层次的调用及逆向调用。
在实践中,大部分分层结构还可以继续分层,如应用层可以再细分为视图层(美工负责)和业务逻辑层(工程师负责);服务层也还可以再细分为数据接口层(适配各种输入和输出的数据格式)和逻辑处理层。
分层架构是逻辑上的,在物理部署上,三层结构可以部署在同一个物理机器上,但随着网站业务的发展,必然需要对已分层的模块分离部署,即三层结构部署在不同的服务器上,使网站拥有更多的计算资源以应对越来越多的用户访问。
所以虽然分层架构模式最初的目的是规划软件清晰的逻辑结构便于开发维护,但在网站的发展过程中,分层结构对网站支持高并发向分布式方向发展至关重要。因此在网站规模还是很小的时候就应该采用分层结构。

2.2 分割
如果说分层是将软件在横向方面进行切分,那么分割就是在纵向方面对软件进行切分。
网站越大,功能越复杂,服务和数据处理的种类也越多,将这些不同的功能和服务分割开来,包装成高内聚低耦合的模块单元,一方面有助于软件的开发和维护;另一方面,便于不同模块的分布式部署,提高网站的高并发处理能力和功能扩展能力。
比如在应用层,将不同的业务进行分割,例如将购物、论坛、搜索、广告分割成不同的应用,由独立的团队负责,部署在不同的服务器上;在同一个应用中,比如购物业务,可以进一步分割成机票酒店业务、3C业务、小商品业务等更小的粒度。而即使在这个粒度上,还是可以继续分割成首页、搜索列表、商品详情等模块。这些模块不管是逻辑上还是物理部署上,都可以是独立的。同样在服务层也可以根据需要将服务层分割成合适的模块。

2.3 分布式
对于大型网站,分层和分割的一个主要目的就是为了切分后的模块便于分布式部署,即将不同的模块部署在不同的服务器上,通过远程调用系统工作。
支持高并发访问和海量数据存储和处理。
分布式方案:
分布式应用和服务
将分层和分割后的应用和服务模块分布式部署,除了可以改善网站性能和高并发、加快开发和发布速度,减少数据库连接资源消耗外;还可以使不同的应用复用共同的服务,便于业务功能扩展。
分布式静态资源
网站的静态资源如JS,CSS,Logo图片等资源独立分布部署,并采用独立的域名,即动静分离。静态资源分布式部署可以减轻应用服务器的负载压力,通过使用独立的域名加快浏览器并发加载速度;
分布式数据和存储
除了对传统的关系型数据库进行分布式部署外,为网站应用而生的各种NoSQL产品几乎都是分布式的。
分布式计算
严格说来,应用、服务、实时数据处理都是计算,网站除了处理这些在线业务,还有很大一部分用户没有直观感受的后台业务要处理,比如搜索引擎的索引构建,数据仓库的数据分析统计等,计算规模可能非常庞大,目前网站普遍使用Hadoop及其MapReduce分布式计算框架进行此类批处理计算,其特点是移动计算而不是移动数据,将计算程序分发到数据所在的位置以加速计算和分布式计算。
分布式文件 支持云存储;
分布式配置 支持网站线上服务器配置实时更新;
分布式锁 分布式环境下实现并发和协同的分布式锁;
分布式缺点:
服务调用必须通过网络,使网站性能降低。
服务器越多,服务器宕机的概率也越大,一台服务器宕机造成的服务不可用,可能导致很多应用不可访问,使网站可用性降低。
数据在分布式的环境中保持数据一致性也非常困难,分布式事务也难以保证,这对业务正确性和业务流程有可能造成很大影响。
分布式还导致网站的依赖错综复杂,开发管理维护困难。

2.4 集群
对于用户访问集中的模块,比如网站的首页,还需要将独立部署的服务器集中化,即多台服务器部署相同的应用构成一个集群,通过负载均衡设备共同对外提供服务。
可以提供更好的并发特性,当有更多的用户访问的时候,只需要向集群中加入更多的机器即可。当一台服务器发生故障,负载均衡设备或者系统的实效转移机制会将请求转发到集群中的其他服务器上,使服务器故障不影响用户使用。
提高高可用性。
2.5 缓存
缓存除了可以加快数据访问速度,还可以减轻后端应用和数据存储的负载压力。
缓存分类:
CDN:即内容分发网络,部署在距离终端用户最近的网络服务商,用户的网络请求总是先到达他的网络服务商那里,在这里缓存网站的一些静态资源,可以就近以最快的速度返回给用户。
反向代理:反向代理属于网站前段架构的一部分,部署在网站的前端,当用户的请求到达网站的数据中心时,最先访问的就是反向代理服务器,这里缓存网站的静态资源,无需将请求继续转发给应用服务器就返回给用户。
本地缓存:在应用服务器本地缓存着热点数据,应用程序可以在本机内存中直接访问数据,无需访问数据库。
分布式缓存:将数据缓存在一个专门的分布式缓存集群中,应用程序通过网络通信访问缓存数据。
使用缓存的两个前提条件:
数据热点不均衡,某些数据会被更频繁的方法,这些数据应该放在缓存中。
数据在某个时间段有效,不会很快过期,否则缓存的数据就会因为已失效而产生脏读。

2.6 异步
计算机软件发展的一个重要目标和驱动力是降低软件耦合性。在大型网站架构中,系统解耦的手段除了前面提到的分层、分割、分布式等,还有一个重要的手段是异步,业务之间的消息传递不是同步调用,而是将一个业务操作分成多个阶段,每个阶段之间通过共享数据的方式异步执行进行协作。
​在单一服务器内部可以通过多线程共享内存队列的方式实现异步,处在业务操作前面的线程将输出写入到队列,后面的线程从队列中读取数据进行处理;
​在分布式系统中,多个服务器集群通过分布式消息对列实现异步,分布式消息对列可以看作内存队列的分布式部署。
​异步特性:
异步架构是典型的生产者消费者模式,两者不存在直接调用,只要保持数据结构不变,彼此功能实现可以随着变化而不互相影响,提供网站扩展性。
系统高可用:消费者服务器发生故障,数据会在消息队列服务器中存储堆积,生产者服务器可以继续处理业务请求。系统整理表现无故障。消费者服务器回复正常后,继续处理消息队列中的数据。
加快网站响应速度:处在业务处理前端的生产者服务器在处理完业务请求后,将数据写入消息队列,不需要等待消费者服务器处理就可以返回,响应延迟减少。
消除并发访问高峰:使用消息队列将突然增加的访问请求数据放入消息队列,等待消费者服务器依次处理,就不会对这个网站负载带来太大压力。

2.7 冗余
​保证在服务器宕机的情况下网站依然可以继续服务,不丢失数据。需要服务器冗余运行,数据冗余备份。
​数据除了定期备份、存档保存,实现冷备份外,为了保证在线业务高可用,还需要对数据库进行主从分离,实时同步实现热备份。
​某些大型网站会对整个暑假中心备份,全球部署灾备数据中心,网站程序和数据实时同步到这个灾备数据中心。

2.8 自动化
发布过程自动化
自动化代码管理
自动化测试
自动化安全检测
自动化部署
自动化监控
自动化报警
自动化失效转移
自动化失效恢复
自动化降级
自动化分配资源

2.9 ​安全
通过密码和手机验证码进行身份认证
登录、交易等操作等网络加密
数据库敏感数据加密存储
验证码防止恶意攻击
对用用于攻击网站的XSS攻击,SQL注入等,进行编码转换等相应处理
对垃圾信息。敏感信息进行过滤
​对交易转账等重要操作根据交易模式和交易信息进行风险控制

本文章总结自《大型网站技术架构核心原理与案例分析》

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值