第一篇 概述
1 大型网站架构演化
动机:如何打造一个高可用、高性能、易扩展、可伸缩且安全的网站?如何让网站随应用所需灵活变动?
1.1 大型网站软件系统的特点
a. 高并发,大流量
b. 高可用
c. 海量数据
d. 用户分布广泛,网络情况复杂
e. 安全环境恶劣
f. 需求快速变更,发布频繁
g. 渐进式发展(由小做大。好的互联网产品都是慢慢运营出来的,而不是一开始就开发好的)
1.2 大型网站架构演化发展历程
1.2.1 初始阶段的网站架构
所有资源都在一台服务器上——LAPM
1.2.2 应用服务和数据服务分离
整个网站使用三台服务器:应用服务器、文件服务器和数据库服务器
1.2.3 使用缓存改善网站性能
驱动力:大部分的业务访问集中在一小部分数据上。
网站使用的缓存可以分为两种:缓存在服务器上的本地缓存和缓存在专门的分布式缓存服务器上的远程缓存。
1.2.4 使用应用服务器集群改善网站的并发处理能力
应用服务器集群——通过负载均衡调度服务器可将来自用户浏览器的访问请求分发到应用服务器集群中的任何一台服务器上。
1.2.5 数据库读写分离
目前大部分的主流数据库都提供主从热备份功能,通过配置两台数据库主从关系,可以将一台数据库服务器的数据更新同步到另一台服务器上。
1.2.6 使用反向代理和CDN加速网站响应
为了解决网站访问的延迟,提升用户体验。
CDN和反向代理的基本原理都是缓存,区别在于CDN部署在网络提供商的机房,使用户在请求网站服务时,可以从距离自己最近的网络提供商机房获取数据;而反向代理则部署在网络中心的机房,当用户骑牛到达中心机房后,首先访问的服务器是反向代理的服务器,如果反向代理的服务器中缓存着用户请求的资源,就将其直接返回给用户。
1.2.7 使用分布式文件系统和分布式数据库系统
不到不得已时,网站更常用的数据库拆分手段是业务分库,将不同业务的数据库部署在不同的物理服务器上。
1.2.8 使用NoSQL和搜索引擎
1.2.9 业务拆分
应用之间通过超链接建立关系,也可以通过消息队列进行数据分发。
1.2.10 分布式服务
通过可复用的业务连接数据库,提供共用业务服务,而应用系统只需要管理用户界面,通过分布式服务调用共用业务服务完成具体业务操作。
1.3 大型网站架构演化的价值观
1.3.1 大型网站架构技术的核心价值是随着网站所需灵活应对
1.3.2 驱动大型网站技术发展的主要力量是网站的业务发展
是业务成就了技术,是事业成就了人,而不是相反。
1.4 网站架构设计误区