网站架构演化 -- 我的笔记

本文链接：https://blog.csdn.net/cykic/article/details/50450055

读了《大型网站技术架构》一书，基本是科普的水平，没有太多的深入分析。但是读过后还是觉得对于平常在公司做的一些事情，有了一些高屋建瓴的理解。把我的一些笔记留在这里。

网站的演化过程：

LAMP或类似架构

瓶颈： traffic增长，无法接受每次对DB的访问

使用缓存

具体操作：local cache (如程序实现的cache)， remote cache server(一些专用的缓存服务器，读速度快，容量有限，例如memcached，voldemort)
瓶颈：高并发，服务器无法应对

多服务器 + 负载均衡调度服务器

具体操作： load-balancer将请求分发到多服务器中 
瓶颈：DB无法接受同时大量读写

DB主从结构，读写分离

具体操作：典型的主从服务器架构：主服务器进行写操作并对从服务器备份，从服务器负责cache无法解决的读操作
瓶颈：网站访问延迟过大

CDN及反向代理

具体操作：静态图形文件以及Javascript文件可以放在CDN中，CDN根据客户位置部署，可大大减少load时间；反向代理指服务器只告诉资源在哪里，类似DNS
瓶颈： 更大的traffic，已有架构仍不能满足要求

多种解决方案：

1. 分布式：包含分布式操作系统(如GFS,TFS)和分布式数据库(如Golden Gate)。分布式数据库将数据冗余的分布在多个数据中心，需要考虑同步问题 2. NoSQL： nosql通常对分布式有一些特殊的支持 3. 业务拆分：搜索，checkout，fulfillment使用不同的子系统，etc 4. 多使用离线数据，如Hadoop，Spark等
业务拆分后的瓶颈：多种业务互相调用过于复杂

面向服务： Rest化所有的服务，服务间只能使用接口互相访问，不能直接访问对方数据库。
基于消息的数据服务：使用消息队列进行异步调用。例如对一个服务发了请求后直接返回进行其他操作，使这个request变成non-blocking request。response生成后再处理。