2. 大型网站架构模式
模式建筑学定义:每一个模式描述了一个在我们周围不断重复发生的问题及该问题解决方案的核心。这样,就可以一次又一次的使用该方案而不必做重复的工作。模式的关键在于模式的可重复性。
2.1 网站架构模式
为了解决大型网站的高并发访问、海量数据处理、高可靠运行等一系列问题与挑战,以实现高性能、高可靠、易伸缩、可扩展、安全等各种技术架构目标。
2.1.1 分层
分层是常见的一种架构模式,将系统在横向维度上切成几个部分,每个部分都负责相对单一的职责,然后通过上层对下层的依赖和调用组成一个完整的系统。
在大型网站架构中也采用分层结构,将软件分成应用层、服务层、数据层。
应用层:负责具体业务和视图展示
服务层:为应用层提供服务支持,如用户管理服务,购物车服务等
数据层:提供数据存储数据访问,如数据库,缓存,文件,搜索引擎
分层架构是逻辑上的,在物理部署上,三层结构可以部署在同一物理机器上,但随着网站业务的发展,必然需要对已经分层的模块分离部署。
2.1.2 分割
纵向方面对软件进行切分,将不同的功能和服务分割开来,包装成高内聚低耦合的模块单元。
优势:一方面有助于软件的开发和维护,另一方面,有助于不同模块的分布式部署,提高网站的并发处理能力和功能扩展能力。
2.1.3 分布式
对于大型网站,分层和分割的主要目的是为了切割后的模块便于分布式部署,即将不同模块部署在不同的服务器上,通过远程调用协同工作。
优点:解决高并发
缺点:1.分布式意味着必须通过网络,会对性能造成比较严重的影响 2.服务器越多,服务器宕机的概率也越大 3.数据在分布式环境中保持数据的一致性非常困难。
常用的分布式方案:
- 分布式应用和服务:将分层和分割后的应用和服务模块分布式部署,可以改善网站性能和并发性、加快开发和发布速度、使不同的应用复用共同的服务
- 分布式静态资源:网站的静态资源独立分布式部署,采用独立的域名,即人们常说的动静分离。静态资源分布式部署可以减轻应用服务器的负载压力,通过使用独立域名加快浏览器并发加载的速度
- 分布式数据和存储:大型网站需要处理以P为单位的海量数据,需要提供分布式部署,为网站应用而生的各种NoSQL产品几乎都是分布式
- 分布式计算:目前网站使用Hadoop及其MapReduce分布式计算框架进行类批处理计算,其特点是移动计算,将计算程序分发到数据所在的位置以加速计算和分布式计算。
- 分布式配置、分布式锁、分布式文件系统等
2.1.4 集群
对于用户访问集中的模块,还需要将独立部署的服务器集群化,即多台服务器部署相同的应用构成一个群,通过负载均衡设备共同对外提供服务。
优点:更好的并发性,更好的可用性(失效转移机制)
2.1.5 缓存
缓存就是将数据存放在距离计算最近的位置以加处理速度。
- CDN:内容分发网络,部署在距离终端用户最近的网络服务商
- 反向代理:属于网站前端架构的一部分,部署在网站的前端,当用户请求到达网站的数据中心时,最先访问的就是反向代理服务器,这里缓存网站的静态资源
- 本地缓存:在应用服务器本地缓存这热点数据,应用程序可以在北极内存中直接访问数据
- 分布式缓存:将数据缓存在一个专门的分布式缓存集群中,应用程序通过网络通信访问缓存数据
2.1.6 异步
在单一服务器可通过多线程共享内存队列的方式实现异步,在分布式系统中,多个服务器集群通过分布式消息队列实现异步
优点:1.提供系统可用性 2.加快网站响应速度 3.消除并发访问高峰
2.1.7 冗余
除了数据库的冷备份外,还有数据库主从分离实现热备份
2.1.8 自动化
主要在发布运维方面:自动化代码管理、自动化测试、自动化安全检测、自动化部署、自动化监控(心跳检测)、自动化报警(企业微信)、自动化失效转移、自动化失效恢复、自动化分配资源