分布式高并发问题_分布式高并发解决方案-CSDN博客

本文链接：https://blog.csdn.net/dd4595415519/article/details/141605231

分布式

一、大型网站系统的特点

高并发，大流量

高可用

海量数据

用户分布广泛，网络情况复杂

安全环境恶劣

需求快速变更，发布频繁

渐进式发展

二、大型网站架构演化发展历程

初始阶段的网站架构

应用服务和数据服务分离

使用缓存改善网站性能

使用应用服务器集群改善网站的并发处理能力

数据库读写分离

使用反向代理和 CDN 加速网站响应

使用分布式文件系统和分布式数据库系统

使用 NoSQL 和搜索引擎

业务拆分

分布式微服务

三、拆分 VS 集群

四、微服务 VS SOA

五、前后端完全分离与 Rest 规范

六、 CAP 三进二和 Base 定理

关系型数据库遵循 ACID 规则

CAP 三进二

BASE 定理

分布式一致性理论 paxos 、 raft 、 zab 算法

中间件

一、缓存

为什么要使用缓存

优秀的缓存系统 Redis

redis 为什么这么快

redis 的数据类型，以及每种数据类型的使用场景

redis 的过期策略以及内存淘汰机制

渐进式 ReHash

渐进式 rehash 的原因

渐进式 rehash 的步骤

缓存穿透

缓存雪崩

二、消息队列

消息队列应用场景

异步处理

应用解耦

流量削锋

日志处理

消息通讯

消息中间件示例

电商系统

日志收集系统

JMS 消息服务消息模型

消息消费

防止消息丢失

同步的事务 —— 停止等待

同步的事务 —— 连续 ARQ

异步的事务 —— 回调机制

消息的幂等处理

消息的按序处理

三、搜索引擎

概述

特点（优势）：

使用场景：

倒排索引

创建索引

一些要索引的原文档 (Document)

将原文档传给分次组件 (Tokenizer)

将得到的词元 (Token) 传给语言处理组件 (Linguistic Processor)

将得到的词 (Term) 传给索引组件 (Indexer)

搜索索引

用户输入查询语句

对查询语句进行词法分析，语法分析，及语言处理

搜索索引，得到符合语法树的文档

根据得到的文档和查询语句的相关性，对结果进行排序

Lucene 和 ElasticSearch

分词器

大数据与高并发

一、秒杀架构设计

业务介绍

业务特点

瞬时并发量大

库存量少

业务简单

技术难点

现有业务的冲击

直接下订单

页面流量突增

架构设计思想

限流

削峰

异步

缓存

整体架构

客户端优化

秒杀页面

防止提前下单

API 接入层优化

限制用户维度访问频率

限制商品维度访问频率

SOA 服务层优化

秒杀整体流程图

总结

二、数据库架构发展历程单机 MySQL 的美好年代

Memcached( 缓存 )+MySQL+ 垂直拆分

Mysql 主从复制读写分离

分表分库 + 水平拆分 +mysql 集群

三、 MySQL 的扩展性瓶颈

四、为什么要使用 NOSQL NOT ONLY SQL

五、传统 RDBMS VS NOSQL

六、 NOSQL 数据库的类型

七、阿里巴巴中文站商品信息如何存放

商品基本信息

商品描述、详情、评价信息 ( 多文字类 )

商品的图片

商品的关键字

商品的波段性的热点高频信息

商品的交易、价格计算、积分累计

大型互联网应用 ( 大数据、高并发、多样数据类型 ) 的难点和解决方案

八、数据的水平拆分和垂直拆分

垂直拆分

水平拆分

拆分原则

案例分析

九、分布式事务

假如没有分布式事务

什么是分布式事务？

XA 两阶段提交（ 2PC ）

XA 三阶段提交（ 3PC ）

MQ 事务

TCC 事务

十、 BitMap

Bit-map 的基本思想

Bit-map 应用之快速排序

Bit-map 应用之快速去重

Bit-map 应用之快速查询

Bit-map 扩展 ——Bloom Filter( 布隆过滤器 )

总结

应用

十一、 Bloom Filter

十二、常见的限流算法

计数器法

滑动窗口

漏桶算法

令牌桶算法

计数器 VS 滑动窗口

漏桶算法 VS 令牌桶算法

十三、负载均衡

dns 域名解析负载均衡

反向代理负载均衡

http 重定向协议实现负载均衡

分层的负载均衡算法

十四、一致性 Hash 算法

数据库

一、数据库范式

1NF( 第一范式 ) 2NF( 第二范式 )

3NF( 第三范式 )

二、数据库开发规范

基础规范

命名规范

字段设计规范

总结

三、数据库索引

唯一索引

非唯一索引

主键索引

聚集索引（聚簇索引）

扩展：聚集索引和非聚集索引的区别？分别在什么情况下使用？

索引实现机制

索引建立原则

四、 MyISAM vs InnoDB

五、并发事务带来的问题

丢失更新

脏读（未提交读）

不可重复读

幻读（ Phantom Read ）

六、事务隔离级别及锁的实现机制

一级封锁协议（对应 read uncommited ）

二级封锁协议（对应 read commited)

三级封锁协议（对应 reapetable read ）

最强封锁协议（对应 Serialization ）

七、 MVCC （多版本并发控制）

八、间隙锁与幻读

间隙锁（ Next-Key 锁）

RR 级别下防止幻读

设计模式与实践

一、 OOP 五大原则 SOLID

单一责任原则

开放封闭原则

里氏替换原则

依赖倒置原则

接口分离原则

二、设计模式

三、代理模式

定义与举例

静态代理

动态代理

JDK 动态代理

CGLIB 动态代理

四、面向切面编程（ AOP ）

基本思想

登录验证

基于 RBAC 的权限管理

角色访问控制（ RBAC ）

执行流程分析

日志记录

日志记录最佳实践

事务处理统一异常处理

五、工厂模式

简单工厂

工厂方法

抽象工厂

六、控制反转 IOC

七、观察者模式

八、 Zookeeper

ZK 简述

存储结构

znode

znode 中的存在类型

应用场景

统一命名服务

负载均衡

统一配置管理

集群管理

服务器动态上下线

写数据流程

Leader 选举

数据结构与算法

一、树

二、 BST 树

三、 BST 树

四、 AVL 树

五、红黑树

六、 B- 树

七、 B+ 树

八、字典树

九、跳表

十、 HashMap

简介

内部实现

存储结构 - 字段

功能实现 - 方法

1. 确定哈希桶数组索引位置

2. 分析 HashMap 的 put 方法

3. 扩容机制

线程安全性

十一、 ConcurrentHashMap

锁分段技术

CAS 无锁算法

实现方式

存在的缺点

十二、 ConcurrentLinkedQueue

延迟更新 tail 节点

延迟删除 head 节点

十三、 Topk 问题

简述

解决方案

实际运行

（ 1 ）单机 + 单核 + 足够大内存

（ 2 ）单机 + 多核 + 足够大内存（ 3 ）单机 + 单核 + 受限内存

（ 4 ）多机 + 受限内存

经常被提及的该类问题

重复问题

十四、资源池思想

作用

线程池

连接池

十五、 JVM 内存管理算法

判断对象是否存活

引用计数法

可达性分析算法

垃圾回收算法

标记 - 清除算法 (Mark-Sweep)

复制算法 (Copying)

标记 - 整理算法 (Mark-Compact)

分代收集算法 (Generational Collection)

十六、容器虚拟化技术， Doocker 思想

为什么会有 docker

docker 理念

实现方式

docker 的组成

镜像

容器

仓库

总结

十七、持续集成、持续发布， jenkins

持续集成

手动部署

自动部署

面试题举例

一、设计一个分布式环境下全局唯一的发号器

1 、 UUID

2 、数据库自增长序列或字段

3 、数据库 sequence 表以及乐观锁

4 、 Redis 生成 ID

5 、 Twitter 的 snowflake 算法

二、设计一个带有过期时间的 LRU 缓存

问题描述

问题分析

过期时间实现

维护一个线程

惰性删除

三、设计一个分布式锁

什么是分布式锁？

我们需要怎样的分布式锁？

基于数据库做分布式锁

1 、基于乐观锁

2 、基于悲观锁

基于 Redis 做分布式锁

1 、基于 redis 的 setnx() 、 expire() 方法做分布式锁

2 、基于 redis 的 setnx() 、 get() 、 getset() 方法做分布式锁

基于 ZooKeeper 做分布式锁使用分布式锁的注意事项

分布式可重入锁的设计

四、设计一个分布式环境下的统一配置中心

配置中心概述

演进中的配置

配置中心之简版

配置中心之性能改进

配置中心之可用性改进

五、如何准备 HR 面试

分布式

一、大型网站系统的特点

高并发，大流量

需要面对高并发用户，大流量访问。 Google 日均 PV 35 亿，日 IP 访问数 3 亿；腾讯 QQ 的最大在线用户数 1.4 亿

（ 2011 年数据）。

高可用

系统 7 x 24 小时不间断服务。

海量数据

需要存储、管理海量数据，需要使用大量服务器。 Facebook 每周上传的照片数量接近 10 亿，百度收录的网页数

目有数百亿， Google 有近百万台服务器为全球用户提供服务。

用户分布广泛，网络情况复杂

许多大型互联网站都是为全球用户提供服务的，用户分布范围广，各地网络情况千差万别。在国内，还有各个运营

商网络互通难的问题。

安全环境恶劣

由于互联网的开放性，使得互联网站更容易受到攻击，大型网站几乎每天都会被黑客攻击。

需求快速变更，发布频繁

和传统软件的版本发布频率不同，互联网产品为快速适应市场，满足用户需求，其产品发布频率极高。一般大型网

站的产品每周都有新版本发布上线，中小型网站的发布更频繁，有时候一天会发布几十次。

渐进式发展

几乎所有的大型互联网网站都是从一个小网站开始，渐进地发展起来的。 Facebook 是扎克伯格同学在哈佛大学的

宿舍里开发的； Google 的第一台服务器部署在斯坦福大学的实验室；阿里巴巴是在马云家的客厅诞生的。好的互

联网产品都是慢慢运营出来的，不是一开始就开发好的，这也正好与网站架构的发展演化过程对应。

二、大型网站架构演化发展历程 大型网站的技术挑战主要来自于庞大的用户，高并发的访问和海量的数据，任何简单的业务一旦需要处理数以 P 计

的数据和面对数以亿计的用户，问题就会变得很棘手。大型网站架构主要解决这类问题。

初始阶段的网站架构

大型网站都是从小型网站发展而来，网站架构也是一样，是从小型网站架构逐步演化而来。小型网站最开始没有太

多人访问，只需要一台服务器就绰绰有余，这时的网站架构如下图所示：

应用程序、数据库、文件等所有资源都在一台服务器上。

应用服务和数据服务分离

随着网站业务的发展，一台服务器逐渐不能满足需求：越来越多的用户访问导致性能越来越差，越来越多的数据导

致存储空间不足。这时就需要将应用和数据分离。应用和数据分离后整个网站使用 3 台服务器：应用服务器、文件

服务器和数据库服务器。这 3 台服务器对硬件资源的要求各不相同：

应用服务器需要处理大量的业务逻辑，因此需要更快更强大的 CPU ；

数据库服务器需要快速磁盘检索和数据缓存，因此需要更快的磁盘和更大的内存；

文件服务器需要存储大量用户上传的文件，因此需要更大的硬盘。

此时，网站系统的架构如下图所示：应用和数据分离后，不同特性的服务器承担不同的服务角色，网站的并发处理能力和数据存储空间得到了很大改

善，支持网站业务进一步发展。但是随着用户逐渐增多，网站又一次面临挑战：数据库压力太大导致访问延迟，进

而影响整个网站的性能，用户体验受到影响。这时需要对网站架构进一步优化。

使用缓存改善网站性能

网站访问的特点和现实世界的财富分配一样遵循二八定律： 80% 的业务访问集中在 20% 的数据上。既然大部分业

务访问集中在一小部分数据上，那么如果把这一小部分数据缓存在内存中，就可以减少数据库的访问压力，提高整

个网站的数据访问速度，改善数据库的写入性能了。网站使用的缓存可以分为两种：缓存在应用服务器上的本地缓

存和缓存在专门的分布式缓存服务器上的远程缓存。

本地缓存的访问速度更快一些，但是受应用服务器内存限制，其缓存数据量有限，而且会出现和应用程序争

用内存的情况。

远程分布式缓存可以使用集群的方式，部署大内存的服务器作为专门的缓存服务器，可以在理论上做到不受

内存容量限制的缓存服务。使用缓存后，数据访问压力得到有效缓解，但是单一应用服务器能够处理的请求连接有限，在网站访问高峰期，应

用服务器成为整个网站的瓶颈。

使用应用服务器集群改善网站的并发处理能力

使用集群是网站解决高并发、海量数据问题的常用手段。当一台服务器的处理能力、存储空间不足时，不要企图去

更换更强大的服务器，对大型网站而言，不管多么强大的服务器，都满足不了网站持续增长的业务需求。这种情况

下，更恰当的做法是增加一台服务器分担原有服务器的访问及存储压力。 对网站架构而言，只要能通过增加一台服

务器的方式改善负载压力，就可以以同样的方式持续增加服务器不断改善系统性能，从而实现系统的可伸缩性 。应

用服务器实现集群是网站可伸缩架构设计中较为简单成熟的一种，如下图所示：通过负载均衡调度服务器，可以将来自用户浏览器的访问请求分发到应用服务器集群中的任何一台服务器上，如果

有更多用户，就在集群中加入更多的应用服务器，使应用服务器的压力不再成为整个网站的瓶颈。

数据库读写分离

网站在使用缓存后，使对大部分数据读操作访问都可以不通过数据库就能完成，但是仍有一部分读操作（缓存访问

不命中、缓存过期）和全部的写操作都需要访问数据库，在网站的用户达到一定规模后，数据库因为负载压力过高

而成为网站的瓶颈。目前大部分的主流数据库都提供主从热备功能，通过配置两台数据库主从关系，可以将一台数

据库服务器的数据更新同步到另一台服务器上。网站利用数据库的这一功能，实现数据库读写分离，从而改善数据

库负载压力。如下图所示：应用服务器在写数据的时候，访问主数据库，主数据库通过主从复制机制将数据更新同步到从数据库，这样当应用

服务器读数据的时候，就可以通过从数据库获得数据。为了便于应用程序访问读写分离后的数据库，通常在应用服

务器端使用专门的数据访问模块，使数据库读写分离对应用透明。

使用反向代理和 CDN 加速网站响应

随着网站业务不断发展，用户规模越来越大，由于中国复杂的网络环境，不同地区的用户访问网站时，速度差别也

极大。有研究表明，网站访问延迟和用户流失率正相关，网站访问越慢，用户越容易失去耐心而离开。为了提供更

好的用户体验，留住用户，网站需要加速网站访问速度。主要手段有使用 CDN 和方向代理。如下图所示： CDN 和反向代理的基本原理都是缓存。

CDN 部署在网络提供商的机房，使用户在请求网站服务时，可以从距离自己最近的网络提供商机房获取数据

反向代理则部署在网站的中心机房，当用户请求到达中心机房后，首先访问的服务器是反向代理服务器，如

果反向代理服务器中缓存着用户请求的资源，就将其直接返回给用户

使用 CDN 和反向代理的目的都是尽早返回数据给用户，一方面加快用户访问速度，另一方面也减轻后端服务器的

负载压力。

使用分布式文件系统和分布式数据库系统

任何强大的单一服务器都满足不了大型网站持续增长的业务需求。数据库经过读写分离后，从一台服务器拆分成两

台服务器，但是随着网站业务的发展依然不能满足需求，这时需要使用分布式数据库。文件系统也一样，需要使用

分布式文件系统。如下图所示：分布式数据库是网站数据库拆分的最后手段，只有在单表数据规模非常庞大的时候才使用。不到不得已时，网站更

常用的数据库拆分手段是业务分库，将不同业务的数据部署在不同的物理服务器上。

使用 NoSQL 和搜索引擎

随着网站业务越来越复杂，对数据存储和检索的需求也越来越复杂，网站需要采用一些非关系数据库技术如

NoSQL 和非数据库查询技术如搜索引擎。如下图所示： NoSQL 和搜索引擎都是源自互联网的技术手段，对可伸缩的分布式特性具有更好的支持。应用服务器则通过一个

统一数据访问模块访问各种数据，减轻应用程序管理诸多数据源的麻烦。

业务拆分

大型网站为了应对日益复杂的业务场景，通过使用分而治之的手段将整个网站业务分成不同的产品线。如大型购物

交易网站都会将首页、商铺、订单、买家、卖家等拆分成不同的产品线，分归不同的业务团队负责。

具体到技术上，也会根据产品线划分，将一个网站拆分成许多不同的应用，每个应用独立部署。应用之间可以通过

一个超链接建立关系（在首页上的导航链接每个都指向不同的应用地址），也可以通过消息队列进行数据分发，当

然最多的还是通过访问同一个数据存储系统来构成一个关联的完整系统，如下图所示： 分布式微服务

随着业务拆分越来越小，存储系统越来越庞大，应用系统的整体复杂度呈指数级增加，部署维护越来越困难。由于

所有应用要和所有数据库系统连接，在数万台服务器规模的网站中，这些连接的数目是服务器规模的平方，导致数

据库连接资源不足，拒绝服务。

既然每一个应用系统都需要执行许多相同的业务操作，比如用户管理、商品管理等，那么可以将这些共用的业务提

取出来，独立部署。由这些可复用的业务连接数据库，提供共用业务服务，而应用系统只需要管理用户界面，通过

分布式服务调用共用业务服务完成具体业务操作。如下图所示： 三、拆分 VS 集群

1. 拆分：不同的 多台服务器上面部署不同的服务模块 ，模块之间通过 RPC 通信和调用，用于拆分业务功能，独立

部署，多个服务器共同组成一个整体对外提供服务。

2. 集群：不同的 多台服务器上面部署相同的服务模块 ，通过分布式调度软件进行统一的调度，用于分流容灾，

降低单个服务器的访问压力。

四、微服务 VS SOA

创始人： martin fowler https://martinfowler.com/articles/microservices.html

单体应用： ALL IN ONE

微服务是一种架构风格，一个大型复杂软件应用由一个或多个微服务组成。系统中的各个微服务可被独立部署，各

个微服务之间是松耦合的。每个微服务仅关注于完成一件任务并很好地完成该任务。在所有情况下，每个任务代表

着一个小的业务能力

微服务，从本质意义上看，还是 SOA 架构。但内涵有所不同，微服务并不绑定某种特殊的技术，在一个微服务的

系统中，可以有 Java 编写的服务，也可以有 Python 编写的服务，他们是靠 Restful 架构风格统一成一个系统的。所

以微服务本身与具体技术实现无关，扩展性强。

五、前后端完全分离与 Rest 规范

http 是目前在互联网上使用最多的协议，没有之一。可是 http 的创始人一直都觉得，在过去 10 几年来，所有的人都

在错误的使用 Http 。

这句话怎么说呢？如果说你要删除一个数据，以往的做法通常是 delete/{id} ，如果你要更新一个数据，可能是 Post

数据放 Body ，然后方法是 update/{id} ，或者是 artichle/{id}?method=update 。

这种做法让我很暴燥，我觉得这个世界不该这样的，所有的人都在误解而且在严重错误的误解 Http 的设计初衷，好

比是发明了火药却只用它来做烟花爆竹。

那么正确的使用方式是什么呢？如果你要看 Rest 各种特性，你恐怕真的很难理解 Rest ，但是如果你看错误的使用

http 的人倒底儿了哪些错，什么是 Rest 就特别容易理解了。

第一条，混乱。 一万个人心里有一万个 Url 的命名规则， Url 是统一资源定位符，重点是资源。而很多人却把它当成

了万金油，每一个独立的虚拟的网页都可以随意使用，各种操作都能够迭加。这是混乱的来源之一。

第二条，贪婪。 有状态和无状态全部混在一起。特别是在购物车或者是登录的应用中，经常刷新就丢失带来的用户

体验简直棒棒哒。每一个请求并不能单独的响应一些功能，很多的功能混杂在一起里。这是人性贪婪的本质，也是

各种 Hack 的起源，只要能够把问题解决掉，总会有人用他认为最方便的方式去解决问题，比如说汽车门把手坏掉

了直接系根绳子当把手， emmmm 这样确实很棒啊。

第三条，无序。 返回的结果往往是很随意，各种错误信息本来就是用 Http 的状态码构成的，可是很多人还是喜欢把

错误信息返回在返回值中。最常见的就是 Code 和 Message ，当然对于这一点，我个人是保留疑问的，我的观点

是， Http 本身的错误和服务器的内部错误还是需要在不断层面分开的，不能混在一起。可是在大神眼里并非如此，

这个再议。 好了我编不下去了。那么怎么解决这些问题呢？强迫症患者的福音就是先颁规则，第一个规则就是明确 Url 是什

么，该怎么用。就是所有的 Url 本质来讲，都应该是一种资源。一个独立的 Url 地址，就是对应一个独一无二的资

源。怎么样？这种感觉是不是棒棒哒？一个冰淇淋，一个老师，一间房子，在 Url 上对应的都是一个资源，不会有

多余的 Url 跟他对应，也不会表示有多个 Url 地址 ~~ 注意，这里点的是 Url 地址，并不是单独的参数，他就是一

个 /room/{room_id} 这样的东西，举个栗子 ,/room/3242 这就表示 3242 号房间。

这是一个清爽的世界啊，你想想，之前的 Url 是什么都要，我开房，可能是 /open/room/3242 我要退房可能

是 /exit/3242/room ，我要打理房间，可能是 room/3242?method=clean.

够了！这些乱七八糟的东西全够了，让世界回归清爽的本质，一间房，就是 /room/3242 没有别的 Url 地址了。那

我想要对这个资源有操作怎么办？这就是棒棒哒大神想出来的了， http 有几种 Method 来着？ get ,put

,post,delete ，还有其他隐藏的 4 种。在过去的混乱世界里，经常用的就是 Get 和 Post 。如果不是因为 Get 不支持大

数据传输，我想连 Post 都会有人使用。（想像一下 Roy Fielding 在愤怒的对着电脑屏幕喊， Http 的 Method 一共

有八个，你们为毛只逮着 Get 一只羊的毛薅薅薅薅薅）。

而对资源最常见的操作是什么？ CRUD ，对不对，就是创建，读，更新，删除。再看 Http 的 Method ？是不是非常

完美？其实也怪 Fielding 老爷子一开始命名不准确，如果刚开始就是把 Get 方法叫做 Read ， Put 方法叫做 Update ，

Post 叫做 Create 这该多好。。。

你用一个 Get ，大家又发现没什么限制没什么所谓，又很难理解 Put 和 Post 的差别，法无禁止即可为啊，呃，老爷子

不要瞪我，我瞎说的。

总之，这四种方法够不够你浪？你有本身找出来更多的对资源的操作来啊，我还有 4 个 Method 没用过呢。如果这 4

个真的不够了，有什么问题，大不了我再重新更改 http 协议啊。

其实简单说，对于 Rest 理解到这里就够了。后续的东西，都是在这一条基础上空想出来的，比强迫症更强迫症，当

然，无状态我是百分百支持的。以上的各种表述可能不太准确，也纯属是我的意淫和各种小道资料，并未考据，但

是凭良心讲，我是早就看不惯黑暗年代里的 Url 命名风格了，所以当时最早接触到 Rest 的时候，瞬间就找到了真

爱，我靠，这不就是我一直想要的答案吗？

但是我一直想的仅仅是命名规范，从来没有把自己的思考角度放在一个 url 就是一个资源，所有的操作都是对资源

的更改而言的角度上啊。所以你能理解到的程度，更多的就是在于你要弄清楚你要解决的什么问题，如果你的问题

只是理解 Rest ，恐怕你很理解，如果你的问题是怎么解决 Url 混乱的问题，你反而很快能弄懂了 ~

Rest 操作最佳实践： 现在在很多企业中，虽然都在支持 Rest 规范，但是真正严格遵守的几乎没有，因为按照

Rest 规范，删除需要发送 Delete 请求，插入需要发送 PUT 请求，过于繁琐，并且有些框架，例如 ajax ，

Springmvc 等，对 Delete 和 PUT 请求的支持不太友好，所以实际应用中很少使用这两种请求，一般还是只是

用 Get 和 Post 请求，使用接口名字来区分，所以，对于 Rest 规范，只需要记得传递数据只使用 JSON ，而不是

后端去渲染模板，从而实现前后端的完全分离。

六、 CAP 三进二和 Base 定理

关系型数据库遵循 ACID 规则

事务在英文中是 transaction ，和现实世界中的交易很类似，它有如下四个特性：

1 、 A (Atomicity) 原子性原子性很容易理解，也就是说事务里的所有操作要么全部做完，要么都不做，事务成功的

条件是事务里的所有操作都成功，只要有一个操作失败，整个事务就失败，需要回滚。比如银行转账，从 A 账户转

100 元至 B 账户，分为两个步骤： 1 ）从 A 账户取 100 元； 2 ）存入 100 元至 B 账户。这两步要么一起完成，要么一起不

完成，如果只完成第一步，第二步失败，钱会莫名其妙少了 100 元。 2 、 C (Consistency) 一致性一致性也比较容易理解，也就是说数据库要一直处于一致的状态，事务的运行不会改变

数据库原本的一致性约束。

3 、 I (Isolation) 独立性所谓的独立性是指并发的事务之间不会互相影响，如果一个事务要访问的数据正在被另外一

个事务修改，只要另外一个事务未提交，它所访问的数据就不受未提交事务的影响。比如现有有个交易是从 A 账户

转 100 元至 B 账户，在这个交易还未完成的情况下，如果此时 B 查询自己的账户，是看不到新增加的 100 元的

4 、 D (Durability) 持久性持久性是指一旦事务提交后，它所做的修改将会永久的保存在数据库上，即使出现宕机也

不会丢失。

CAP 三进二

在分布式系统中，讲究 C:Consistency （强一致性）、 A:Availability （可用性）、 P:Partition tolerance （分区容错

性）

CAP 的证明基于异步网络，异步网络也是反映了真实网络中情况的模型。真实的网络系统中，节点之间不可能保持

同步，即便是时钟也不可能保持同步，所有的节点依靠获得的消息来进行本地计算和通讯。这个概念其实是相当强

的，意味着任何超时判断也是不可能的，因为没有共同的时间标准。之后我们会扩展 CAP 的证明到弱一点的异步网

络中，这个网络中时钟不完全一致，但是时钟运行的步调是一致的，这种系统是允许节点做超时判断的。

CAP 的证明很简单，假设两个节点集 {G1, G2} ，由于网络分片导致 G1 和 G2 之间所有的通讯都断开了，如果不满足

P ，则整个网络不可用，如果在 G1 中写，在 G2 中读刚写的数据， G2 中返回的值不可能 G1 中的写值。由于 A 的要

求， G2 一定要返回这次读请求，由于 P 的存在，导致 C 一定是不可满足的。

CAP 理论就是说在分布式存储系统中，最多只能实现上面的两点。而由于当前的网络硬件肯定会出现延迟丢包等问

题，所以

分区容忍性是我们必须需要实现的。

所以我们只能在一致性和可用性之间进行权衡，没有任何分布式系统能同时保证这三点。

C: 强一致性 A ：高可用性 P ：分布式容忍性 CA 传统 Oracle 数据库

AP 大多数网站架构的选择

CP Redis 、 Mongodb

注意：分布式架构的时候必须做出取舍。一致性和可用性之间取一个平衡。多余大多数 web 应用，其实并不需要

强一致性。

因此牺牲 C 换取 P ，这是目前分布式数据库产品的方向

一致性与可用性的决择

对于 web2.0 网站来说，关系数据库的很多主要特性却往往无用武之地

数据库事务一致性需求很多 web 实时系统并不要求严格的数据库事务，对读一致性的要求很低，有些场合对写一

致性要求并不高。允许实现最终一致性。

数据库的写实时性和读实时性需求对关系数据库来说，插入一条数据之后立刻查询，是肯定可以读出来这条数据

的，但是对于很多 web 应用来说，并不要求这么高的实时性，比方说发一条消息之后，过几秒乃至十几秒之后，我

的订阅者才看到这条动态是完全可以接受的。对复杂的 SQL 查询，特别是多表关联查询的需求任何大数据量的 web 系统，都非常忌讳多个大表的关联查询，以

及复杂的数据分析类型的报表查询，特别是 SNS 类型的网站，从需求以及产品设计角度，就避免了这种情况的产

生。往往更多的只是单表的主键查询，以及单表的简单条件分页查询， SQL 的功能被极大的弱化了。

CAP 理论的核心是：一个分布式系统不可能同时很好的满足一致性，可用性和分区容错性这三个需求，最多只能同

时较好的满足两个。因此，根据 CAP 原理将 NoSQL 数据库分成了满足 CA 原则、满足 CP 原则和满足 AP 原则三

大类：

CA - 单点集群，满足一致性，可用性的系统，通常在可扩展性上不太强大。

CP - 满足一致性，分区容忍必的系统，通常性能不是特别高。

AP - 满足可用性，分区容忍性的系统，通常可能对一致性要求低一些。

BASE 定理

BASE 就是为了解决关系数据库强一致性引起的问题而引起的可用性降低而提出的解决方案。

BASE 其实是下面三个术语的缩写：

基本可用（ Basically Available ）

软状态（ Soft state ）最终一致（ Eventually consistent ）

它的思想是通过让系统放松对某一时刻数据一致性的要求来换取系统整体伸缩性和性能上改观。为什么这么说呢，

缘由就在于大型系统往往由于地域分布和极高性能的要求，不可能采用分布式事务来完成这些指标，要想获得这些

指标，我们必须采用另外一种方式来完成，这里 BASE 就是解决这个问题的办法

分布式一致性理论 paxos 、 raft 、 zab 算法

演示 Raft http://thesecretlivesofdata.com/raft /

中间件

一、缓存

为什么要使用缓存

（一）性能 如下图所示，我们在碰到需要执行耗时特别久，且结果不频繁变动的 SQL ，就特别适合将运行结果放入

缓存。这样，后面的请求就去缓存中读取，使得请求能够 迅速响应 。

题外话： 忽然想聊一下这个 迅速响应 的标准。其实根据交互效果的不同，这个响应时间没有固定标准。不过曾经有

人这么告诉我 :" 在理想状态下，我们的页面跳转需要在瞬间解决，对于页内操作则需要在刹那间解决。另外，超过

一弹指 的耗时操作要有进度提示，并且可以随时中止或取消，这样才能给用户最好的体验。 "

那么 瞬间、刹那、一弹指 具体是多少时间呢？

根据《摩诃僧祗律》记载

那么，经过周密的计算，一瞬间为 0.36 秒 , 一刹那有 0.018 秒 . 一弹指长达 7.2 秒。

一刹那者为一念，二十念为一瞬，二十瞬为一弹指，二十弹指为一罗预，二十罗预为一须臾，一日一夜有三十须臾。 （二）并发 如下图所示，在大并发的情况下，所有的请求直接访问数据库，数据库会出现连接异常。这个时候，就

需要使用 redis 做一个缓冲操作，让请求先访问到 redis ，而不是直接访问数据库。

优秀的缓存系统 Redis

Redis 是完全开源免费的，用 C 语言编写的，遵守 BSD 协议，是一个高性能的 (key/value) 分布式内存数据库，基于内

存运行并支持持久化的 NoSQL 数据库，是当前最热门的 NoSql 数据库之一 , 也被人们称为数据结构服务器

Redis 相比同类的其他产品，具有如下优点：

Redis 支持数据的持久化，可以将内存中的数据保持在磁盘中，重启的时候可以再次加载进行使用

Redis 不仅仅支持简单的 key-value 类型的数据，同时还提供 list ， set ， zset ， hash 等数据结构的存储

Redis 支持数据的备份，即 master-slave 模式的数据备份

redis 为什么这么快

主要是以下三点

纯内存操作

单线程操作，避免了频繁的上下文切换

采用了非阻塞 I/O 多路复用机制

题外话： 我们现在要仔细的说一说 I/O 多路复用机制，因为这个说法实在是太通俗了，通俗到一般人都不懂是什么

意思。博主打一个比方：小曲在 S 城开了一家快递店，负责同城快送服务。小曲因为资金限制，雇佣了一批快递

员，然后小曲发现资金不够了，只够买一辆车送快递。

经营方式一 客户每送来一份快递，小曲就让一个快递员盯着，然后快递员开车去送快递。慢慢的小曲就发现了这种

经营方式存在下述问题

几十个快递员基本上时间都花在了抢车上了，大部分快递员都处在闲置状态，谁抢到了车，谁就能去送快递

随着快递的增多，快递员也越来越多，小曲发现快递店里越来越挤，没办法雇佣新的快递员了

快递员之间的协调很花时间综合上述缺点，小曲痛定思痛，提出了下面的经营方式

经营方式二 小曲只雇佣一个快递员。然后呢，客户送来的快递，小曲按 送达地点 标注好，然后依次放在一个地方。

最后，那个快递员依次的去取快递，一次拿一个，然后开着车去送快递，送好了就回来拿下一个快递。

对比上述两种经营方式对比，是不是明显觉得第二种，效率更高，更好呢。在上述比喻中 :

每个快递员 ------------------> 每个线程

每个快递 --------------------> 每个 socket(I/O 流 )

快递的送达地点 -------------->socket 的不同状态

客户送快递请求 --------------> 来自客户端的请求

小曲的经营方式 --------------> 服务端运行的代码

一辆车 ---------------------->CPU 的核数

于是我们有如下结论 1 、经营方式一就是传统的并发模型，每个 I/O 流 ( 快递 ) 都有一个新的线程 ( 快递员 ) 管理。 2 、

经营方式二就是 I/O 多路复用。只有单个线程 ( 一个快递员 ) ，通过跟踪每个 I/O 流的状态 ( 每个快递的送达地点 ) ，来管

理多个 I/O 流。

下面类比到真实的 redis 线程模型，如图所示

参照上图，简单来说，就是。我们的 redis-client 在操作的时候，会产生具有不同事件类型的 socket 。在服务端，有

一段 I/0 多路复用程序，将其置入队列之中。然后，文件事件分派器，依次去队列中取，转发到不同的事件处理器

中。需要说明的是，这个 I/O 多路复用机制， redis 还提供了 select 、 epoll 、 evport 、 kqueue 等多路复用函数库，

大家可以自行去了解。

redis 的数据类型，以及每种数据类型的使用场景

( 一 )String 这个其实没啥好说的，最常规的 set/get 操作， value 可以是 String 也可以是数字。一般做 一些复杂的计数

功能的缓存。

( 二 )hash 这里 value 存放的是结构化的对象，比较方便的就是操作其中的某个字段。博主在做 单点登录 的时候，就

是用这种数据结构存储用户信息，以 cookieId 作为 key ，设置 30 分钟为缓存过期时间，能很好的模拟出类似 session

的效果。

( 三 )list 使用 List 的数据结构，可以 做简单的消息队列的功能 。另外还有一个就是，可以利用 lrange 命令， 做基于

redis 的分页功能 ，性能极佳，用户体验好。 ( 四 )set 因为 set 堆放的是一堆不重复值的集合。所以可以做 全局去重的功能 。为什么不用 JVM 自带的 Set 进行去重？

因为我们的系统一般都是集群部署，使用 JVM 自带的 Set ，比较麻烦，难道为了一个做一个全局去重，再起一个公共

服务，太麻烦了。另外，就是利用交集、并集、差集等操作，可以 计算共同喜好，全部的喜好，自己独有的 * * 喜

好等功能 ** 。

( 五 )sorted set

sorted set 多了一个权重参数 score, 集合中的元素能够按 score 进行排列。可以做 排行榜应用，取 TOP N 操作。另

外，参照另一篇《分布式之延时任务方案解析》，该文指出了 sorted set 可以用来做 延时任务 。最后一个应用就是

可以做 范围查找 。

redis 的过期策略以及内存淘汰机制

分析 : 这个问题其实相当重要，到底 redis 有没用到家，这个问题就可以看出来。比如你 redis 只能存 5G 数据，可是你

写了 10G ，那会删 5G 的数据。怎么删的，这个问题思考过么？还有，你的数据已经设置了过期时间，但是时间到

了，内存占用率还是比较高，有思考过原因么 ? 回答 : redis 采用的是定期删除 + 惰性删除策略。 为什么不用定时删

除策略 ? 定时删除 , 用一个定时器来负责监视 key, 过期则自动删除。虽然内存及时释放，但是十分消耗 CPU 资源。在

大并发请求下， CPU 要将时间应用在处理请求，而不是删除 key, 因此没有采用这一策略 . 定期删除 + 惰性删除是如何

工作的呢 ? 定期删除， redis 默认每个 100ms 检查，是否有过期的 key, 有过期 key 则删除。需要说明的是， redis 不是

每个 100ms 将所有的 key 检查一次，而是随机抽取进行检查 ( 如果每隔 100ms, 全部 key 进行检查， redis 岂不是卡

死 ) 。因此，如果只采用定期删除策略，会导致很多 key 到时间没有删除。于是，惰性删除派上用场。也就是说在你

获取某个 key 的时候， redis 会检查一下，这个 key 如果设置了过期时间那么是否过期了？如果过期了此时就会删

除。 采用定期删除 + 惰性删除就没其他问题了么 ? 不是的，如果定期删除没删除 key 。然后你也没即时去请求 key ，

也就是说惰性删除也没生效。这样， redis 的内存会越来越高。那么就应该采用 内存淘汰机制 。在 redis.conf 中有一

行配置

该配置就是配内存淘汰策略的 ( 什么，你没配过？好好反省一下自己 ) 1 ） noeviction ：当内存不足以容纳新写入数据

时，新写入操作会报错。 应该没人用吧。 2 ） allkeys-lru ：当内存不足以容纳新写入数据时，在键空间中，移除最

近最少使用的 key 。 推荐使用，目前项目在用这种。 3 ） allkeys-random ：当内存不足以容纳新写入数据时，在键

空间中，随机移除某个 key 。 应该也没人用吧，你不删最少使用 Key, 去随机删。 4 ） volatile-lru ：当内存不足以容

纳新写入数据时，在设置了过期时间的键空间中，移除最近最少使用的 key 。 这种情况一般是把 redis 既当缓存，又

做持久化存储的时候才用。不推荐 5 ） volatile-random ：当内存不足以容纳新写入数据时，在设置了过期时间的键

空间中，随机移除某个 key 。 依然不推荐 6 ） volatile-ttl ：当内存不足以容纳新写入数据时，在设置了过期时间的键

空间中，有更早过期时间的 key 优先移除。 不推荐 ps ：如果没有设置 expire 的 key, 不满足先决条件

(prerequisites); 那么 volatile-lru, volatile-random 和 volatile-ttl 策略的行为 , 和 noeviction( 不删除 ) 基本上一致。

渐进式 ReHash

渐进式 rehash 的原因

整个 rehash 过程并不是一步完成的，而是分多次、渐进式的完成。如果哈希表中保存着数量巨大的键值对时，若一

次进行 rehash ，很有可能会导致服务器宕机。

渐进式 rehash 的步骤

为 ht[1] 分配空间，让字典同时持有 ht[0] 和 ht[1] 两个哈希表

维持索引计数器变量 rehashidx ，并将它的值设置为 0 ，表示 rehash 开始

每次对字典执行增删改查时，将 ht[0] 的 rehashidx 索引上的所有键值对 rehash 到 ht[1] ，将 rehashidx 值 +1 。

# maxmemory-policy volatile-lru 当 ht[0] 的所有键值对都被 rehash 到 ht[1] 中，程序将 rehashidx 的值设置为 -1 ，表示 rehash 操作完成

注：渐进式 rehash 的好处在于它采取分为而治的方式，将 rehash 键值对的计算均摊到每个字典增删改查操作，避

免了集中式 rehash 的庞大计算量。

缓存穿透

概念访问一个不存在的 key ，缓存不起作用，请求会穿透到 DB ，流量大时 DB 会挂掉。

解决方案 ：

采用布隆过滤器，使用一个足够大的 bitmap ，用于存储可能访问的 key ，不存在的 key 直接被过滤；

访问 key 未在 DB 查询到值，也将空值写进缓存，但可以设置较短过期时间。

缓存雪崩

大量的 key 设置了相同的过期时间，导致在缓存在同一时刻全部失效，造成瞬时 DB 请求量大、压力骤增，引起雪

崩。

解决方案

可以给缓存设置过期时间时加上一个随机值时间，使得每个 key 的过期时间分布开来，不会集中在同一时刻失

效；

采用限流算法，限制流量；

采用分布式锁，加锁访问。

二、消息队列

消息队列中间件是分布式系统中重要的组件，主要解决应用耦合，异步消息，流量削锋等问题

实现高性能，高可用，可伸缩和最终一致性架构

使用较多的消息队列有 ActiveMQ ， RabbitMQ ， ZeroMQ ， Kafka ， MetaMQ ， RocketMQ

消息队列应用场景

以下介绍消息队列在实际应用中常用的使用场景。异步处理，应用解耦，流量削锋和消息通讯四个场景

异步处理

场景说明：用户注册后，需要发注册邮件和注册短信。传统的做法有两种 1. 串行的方式； 2. 并行方式

（ 1 ）串行方式：将注册信息写入数据库成功后，发送注册邮件，再发送注册短信。以上三个任务全部完成后，返

回给客户端

（ 2 ）并行方式：将注册信息写入数据库成功后，发送注假设三个业务节点每个使用 50 毫秒钟，不考虑网络等其他开销，则串行方式的时间是 150 毫秒，并行的时间可能是

100 毫秒。

因为 CPU 在单位时间内处理的请求数是一定的，假设 CPU1 秒内吞吐量是 100 次。则串行方式 1 秒内 CPU 可处理的请

求量是 7 次（ 1000/150 ）。并行方式处理的请求量是 10 次（ 1000/100 ）

小结：如以上案例描述，传统的方式系统的性能（并发量，吞吐量，响应时间）会有瓶颈。如何解决这个问

题呢？

引入消息队列，将不是必须的业务逻辑，异步处理。改造后的架构如下：

按照以上约定，用户的响应时间相当于是注册信息写入数据库的时间，也就是 50 毫秒。注册邮件，发送短信写入消

息队列后，直接返回，因此写入消息队列的速度很快，基本可以忽略，因此用户的响应时间可能是 50 毫秒。因此架

构改变后，系统的吞吐量提高到每秒 20 QPS 。比串行提高了 3 倍，比并行提高了两倍

应用解耦

场景说明：用户下单后，订单系统需要通知库存系统。传统的做法是，订单系统调用库存系统的接口。如下图

传统模式的缺点：

假如库存系统无法访问，则订单减库存将失败，从而导致订单失败

订单系统与库存系统耦合

如何解决以上问题呢？引入应用消息队列后的方案，如下图：订单系统：用户下单后，订单系统完成持久化处理，将消息写入消息队列，返回用户订单下单成功

库存系统：订阅下单的消息，采用拉 / 推的方式，获取下单信息，库存系统根据下单信息，进行库存操作

假如：在下单时库存系统不能正常使用。也不影响正常下单，因为下单后，订单系统写入消息队列就不再关

心其他的后续操作了。实现订单系统与库存系统的应用解耦

流量削锋

流量削锋也是消息队列中的常用场景，一般在秒杀或团抢活动中使用广泛

应用场景：秒杀活动，一般会因为流量过大，导致流量暴增，应用挂掉。为解决这个问题，一般需要在应用前端加

入消息队列。

可以控制活动的人数

可以缓解短时间内高流量压垮应用

用户的请求，服务器接收后，首先写入消息队列。假如消息队列长度超过最大数量，则直接抛弃用户请求或

跳转到错误页面

秒杀业务根据消息队列中的请求信息，再做后续处理

日志处理

日志处理是指将消息队列用在日志处理中，比如 Kafka 的应用，解决大量日志传输的问题。架构简化如下

日志采集客户端，负责日志数据采集，定时写受写入 Kafka 队列

Kafka 消息队列，负责日志数据的接收，存储和转发

日志处理应用：订阅并消费 kafka 队列中的日志数据

以下是新浪 kafka 日志处理应用案例：转自（ http://cloud.51cto.com/art/201507/484338.htm ） (1)Kafka ：接收用户日志的消息队列

(2)Logstash ：做日志解析，统一成 JSON 输出给 Elasticsearch

(3)Elasticsearch ：实时日志分析服务的核心技术，一个 schemaless ，实时的数据存储服务，通过 index 组织数据，

兼具强大的搜索和统计功能

(4)Kibana ：基于 Elasticsearch 的数据可视化组件，超强的数据可视化能力是众多公司选择 ELK stack 的重要原因

消息通讯

消息通讯是指，消息队列一般都内置了高效的通信机制，因此也可以用在纯的消息通讯。比如实现点对点消息队

列，或者聊天室等

点对点通讯：

客户端 A 和客户端 B 使用同一队列，进行消息通讯。

聊天室通讯：

客户端 A ，客户端 B ，客户端 N 订阅同一主题，进行消息发布和接收。实现类似聊天室效果。

以上实际是消息队列的两种消息模式，点对点或发布订阅模式。模型为示意图，供参考。

消息中间件示例

电商系统 消息队列采用高可用，可持久化的消息中间件。比如 Active MQ ， Rabbit MQ ， Rocket Mq 。

（ 1 ）应用将主干逻辑处理完成后，写入消息队列。消息发送是否成功可以开启消息的确认模式。（消息队列返回

消息接收成功状态后，应用再返回，这样保障消息的完整性）

（ 2 ）扩展流程（发短信，配送处理）订阅队列消息。采用推或拉的方式获取消息并处理。

（ 3 ）消息将应用解耦的同时，带来了数据一致性问题，可以采用最终一致性方式解决。比如主数据写入数据库，

扩展应用根据消息队列，并结合数据库方式实现基于消息队列的后续处理。

日志收集系统

分为 Zookeeper 注册中心，日志收集客户端， Kafka 集群和 Storm 集群（ OtherApp ）四部分组成。

Zookeeper 注册中心，提出负载均衡和地址查找服务

日志收集客户端，用于采集应用系统的日志，并将数据推送到 kafka 队列

Kafka 集群：接收，路由，存储，转发等消息处理

Storm 集群：与 OtherApp 处于同一级别，采用拉的方式消费队列中的数据

JMS 消息服务

讲消息队列就不得不提 JMS 。 JMS （ JAVA Message Service,java 消息服务） API 是一个消息服务的标准 / 规范，允许

应用程序组件基于 JavaEE 平台创建、发送、接收和读取消息。它使分布式通信耦合度更低，消息服务更加可靠以及

异步性。

在 EJB 架构中，有消息 bean 可以无缝的与 JM 消息服务集成。在 J2EE 架构模式中，有消息服务者模式，用于实现消息

与应用直接的解耦。

消息模型

在 JMS 标准中，有两种消息模型 P2P （ Point to Point ） ,Publish/Subscribe(Pub/Sub) 。 P2P 模式包含三个角色：消息队列（ Queue ），发送者 (Sender) ，接收者 (Receiver) 。每个消息都被发送到一个特

定的队列，接收者从队列中获取消息。队列保留着消息，直到他们被消费或超时。

P2P 的特点

每个消息只有一个消费者（ Consumer ） ( 即一旦被消费，消息就不再在消息队列中 )

发送者和接收者之间在时间上没有依赖性，也就是说当发送者发送了消息之后，不管接收者有没有正在运

行，它不会影响到消息被发送到队列

接收者在成功接收消息之后需向队列应答成功

如果希望发送的每个消息都会被成功处理的话，那么需要 P2P 模式。

Pub/sub 模式包含三个角色主题（ Topic ），发布者（ Publisher ），订阅者（ Subscriber ）多个发布者将消息发送

到 Topic, 系统将这些消息传递给多个订阅者。

Pub/Sub 的特点

每个消息可以有多个消费者

发布者和订阅者之间有时间上的依赖性。针对某个主题（ Topic ）的订阅者，它必须创建一个订阅者之后，才

能消费发布者的消息

为了消费消息，订阅者必须保持运行的状态

为了缓和这样严格的时间相关性， JMS 允许订阅者创建一个可持久化的订阅。这样，即使订阅者没有被激活（运

行），它也能接收到发布者的消息。

如果希望发送的消息可以不被做任何处理、或者只被一个消息者处理、或者可以被多个消费者处理的话，那么可以

采用 Pub/Sub 模型。

消息消费

在 JMS 中，消息的产生和消费都是异步的。对于消费来说， JMS 的消息者可以通过两种方式来消费消息。

（ 1 ）同步订阅者或接收者通过 receive 方法来接收消息， receive 方法在接收到消息之前（或超时之前）将一直阻塞；

（ 2 ）异步

订阅者或接收者可以注册为一个消息监听器。当消息到达之后，系统自动调用监听器的 onMessage 方法。

防止消息丢失

由于网络问题，我们很难保证生产者发送的消息能 100% 到达消息队列服务器，也就是说有消息丢失的可能性，因

此，生产者就必须具有消息丢失检测和重发机制，也就是我们常说的消息队列的事物机制

不能把可靠性的保证全部交给 TCP ， TCP 只保证了传输层的可靠传输，但是无法保证与应用层的交互是否出错

TCP 无法给应用层任何反馈，因此必须在应用层处理差错

同步的事务 —— 停止等待

所谓停止等待协议就是没发送完一组数据后，等待对方确认并且收到确认后，再发送下一组数据。

同步的事务 —— 连续 ARQ

类似于 TCP 的滑动窗口模型 异步的事务 —— 回调机制

生产者在发送消息的时候，注册一个回调函数，这样生产者便不用停下来等待确认了，而是可以一直持续发送消

息，当消息到达消息队列服务器的时候，服务器便会调用生产者注册的回调函数，告知生产者消息发送成功了还是

失败了，进而做进一步的处理，从而提高了并发量。

消息的幂等处理

由于网络原因，生产者可能会重复发送消息，因此消费者方必须做消息的幂等处理，常用的解决方案有：

1. 查询操作：查询一次和查询多次，在数据不变的情况下，查询结果是一样的。 select 是天然的幂等操作；

2. 删除操作：删除操作也是幂等的，删除一次和多次删除都是把数据删除。 ( 注意可能返回结果不一样，删除的

数据不存在，返回 0 ，删除的数据多条，返回结果多个 ) ；

3. 唯一索引 ，防止新增脏数据。比如：支付宝的资金账户，支付宝也有用户账户，每个用户只能有一个资金账

户，怎么防止给用户创建资金账户多个，那么给资金账户表中的用户 ID 加唯一索引，所以一个用户新增成功

一个资金账户记录。要点：唯一索引或唯一组合索引来防止新增数据存在脏数据（当表存在唯一索引，并发

时新增报错时，再查询一次就可以了，数据应该已经存在了，返回结果即可）；

4. token 机制，防止页面重复提交。业务要求：页面的数据只能被点击提交一次；发生原因：由于重复点击或

者网络重发，或者 nginx 重发等情况会导致数据被重复提交；解决办法：集群环境采用 token 加 redis(redis 单

线程的，处理需要排队 ) ；单 JVM 环境：采用 token 加 redis 或 token 加 jvm 内存。处理流程： 1. 数据提交前要向

服务的申请 token ， token 放到 redis 或 jvm 内存， token 有效时间； 2. 提交后后台校验 token ，同时删除

token ，生成新的 token 返回。 token 特点：要申请，一次有效性，可以限流。注意： redis 要用删除操作来判

断 token ，删除成功代表 token 校验通过，如果用 select+delete 来校验 token ，存在并发问题，不建议使用；

5. 悲观锁 —— 获取数据的时候加锁获取。 select * from table_xxx where id='xxx' for update; 注意： id 字段一

定是主键或者唯一索引，不然是锁表，会死人的悲观锁使用时一般伴随事务一起使用，数据锁定时间可能会

很长，根据实际情况选用；

6. 乐观锁 —— 乐观锁只是在更新数据那一刻锁表，其他时间不锁表，所以相对于悲观锁，效率更高。乐观锁的

实现方式多种多样可以通过 version 或者其他状态条件： 1. 通过版本号实现 update table_xxx set

name=#name#,version=version+1 where version=#version# 如下图 ( 来自网上 ) ； 2. 通过条件限制 update

table_xxx set avai_amount=avai_amount-#subAmount# where avai_amount-#subAmount# >= 0 要求：

quality-#subQuality# >= ，这个情景适合不用版本号，只更新是做数据安全校验，适合库存模型，扣份额和

回滚份额，性能更高； 7. 分布式锁 —— 还是拿插入数据的例子，如果是分布是系统，构建全局唯一索引比较困难，例如唯一性的字段没法

确定，这时候可以引入分布式锁，通过第三方的系统 (redis 或 zookeeper) ，在业务系统插入数据或者更新数据，获

取分布式锁，然后做操作，之后释放锁，这样其实是把多线程并发的锁的思路，引入多多个系统，也就是分布式系

统中得解决思路。要点：某个长流程处理过程要求不能并发执行，可以在流程执行之前根据某个标志 ( 用户 ID+ 后缀

等 ) 获取分布式锁，其他流程执行时获取锁就会失败，也就是同一时间该流程只能有一个能执行成功，执行完成

后，释放分布式锁 ( 分布式锁要第三方系统提供 ) ；

8.select + insert—— 并发不高的后台系统，或者一些任务 JOB ，为了支持幂等，支持重复执行，简单的处理方法

是，先查询下一些关键数据，判断是否已经执行过，在进行业务处理，就可以了。注意：核心高并发流程不要用这

种方法；

消息的按序处理

同上，消息的按序也不能完全依靠于 TCP

在说到消息中间件的时候，我们通常都会谈到一个特性：消息的顺序消费问题。这个问题看起来很简单： Producer

发送消息 1, 2, 3 。。。 Consumer 按 1, 2, 3 。。。顺序消费。

但实际情况却是：无论 RocketMQ ，还是 Kafka ，缺省都不保证消息的严格有序消费！

这个特性看起来很简单，但为什么缺省他们都不保证呢？

“ 严格的顺序消费 ” 有多么困难

下面就从 3 个方面来分析一下，对于一个消息中间件来说， ” 严格的顺序消费 ” 有多么困难，或者说不可能。

发送端

发送端不能异步发送，异步发送在发送失败的情况下，就没办法保证消息顺序。

比如你连续发了 1 ， 2 ， 3 。过了一会，返回结果 1 失败， 2, 3 成功。你把 1 再重新发送 1 遍，这个时候顺序就乱掉

了。

存储端

对于存储端，要保证消息顺序，会有以下几个问题：（ 1 ）消息不能分区。也就是 1 个 topic ，只能有 1 个队列。在

Kafka 中，它叫做 partition ；在 RocketMQ 中，它叫做 queue 。如果你有多个队列，那同 1 个 topic 的消息，会分散

到多个分区里面，自然不能保证顺序。

（ 2 ）即使只有 1 个队列的情况下，会有第 2 个问题。该机器挂了之后，能否切换到其他机器？也就是高可用问题。

比如你当前的机器挂了，上面还有消息没有消费完。此时切换到其他机器，可用性保证了。但消息顺序就乱掉了。

要想保证，一方面要同步复制，不能异步复制；另 1 方面得保证，切机器之前，挂掉的机器上面，所有消息必须消

费完了，不能有残留。很明显，这个很难！！！

接收端

对于接收端，不能并行消费，也即不能开多线程或者多个客户端消费同 1 个队列。

总结

update table_xxx set name=#name#,version=version+1 where id=#id# and version=#version# ；

update table_xxx set avai_amount=avai_amount-#subAmount# where id=#id# and avai_amount-

#subAmount# >= 0 ；从上面的分析可以看出，要保证消息的严格有序，有多么困难！

发送端和接收端的问题，还好解决一点，限制异步发送，限制并行消费。但对于存储端，机器挂了之后，切换的问

题，就很难解决了。

你切换了，可能消息就会乱；你不切换，那就暂时不可用。这 2 者之间，就需要权衡了。

业务需要全局有序吗？

通过上面分析可以看出，要保证一个 topic 内部，消息严格的有序，是很困难的，或者说条件是很苛刻的。

那怎么办呢？我们一定要使出所有力气、用尽所有办法，来保证消息的严格有序吗？

这里就需要从另外一个角度去考虑这个问题：业务角度。正如在下面这篇博客中所说的：

http://www.jianshu.com/p/453c6e7ff81c

实际情况中：（ 1 ）不关注顺序的业务大量存在；（ 2 ）队列无序不代表消息无序。

三、搜索引擎

概述

全文搜索就是对文本数据的一种搜索方式，文本数据的都多，可以分为顺序搜索法和索引搜索法，，全文检索使用

的是索引搜索法

特点（优势）：

做了相关度排序

对文本中的关键字做了高亮显示

摘要截取

只关注文本，不考虑语义

搜索效果更加精确 —— 基于单词搜索，比如搜索 Java 的时候找不到 JavaScript ，因为它们是不同的两个单词

使用场景：

替换数据库的模糊查询，提高查询速度，降低数据库压力，增强了查询效率

数据库模糊查询缺点：查询速度慢，左模糊和全模糊会使索引失效，没有相关度排序，没有对文本中关键字

做高亮显示，搜索效果不好

全文检索是搜索引擎的基础

只对 “ 指定领域 ” 的网站进行索引和搜索，即垂直搜索

可以在 word 、 pdf 等各种各样的数据格式中检索内容

其他场合，比如输入法等

倒排索引

正向索引 的结构如下：

“ 文档 1” 的 ID > 单词 1 ：出现次数，出现位置列表；单词 2 ：出现次数，出现位置列表； ………… 。

“ 文档 2” 的 ID > 此文档出现的关键词列表。 当用户在主页上搜索关键词 “ 华为手机 ” 时，假设只存在正向索引（ forward index ），那么就需要扫描索引库中的

所有文档，找出所有包含关键词 “ 华为手机 ” 的文档，再根据打分模型进行打分，排出名次后呈现给用户。 因为互联

网上收录在搜索引擎中的文档的数目是个天文数字， 这样的索引结构根本无法满足实时返回排名结果的要求。

所以，搜索引擎会将正向索引重新构建为倒排索引 ，即把文件 ID 对应到关键词的映射转换为 关键词到文件 ID 的映

射，每个关键词都对应着一系列的文件，这些文件中都出现这个关键词。

得到 倒排索引 的结构如下：

“ 关键词 1” ： “ 文档 1” 的 ID ， “ 文档 2” 的 ID ， ………… 。

“ 关键词 2” ：带有此关键词的文档 ID 列表。

创建索引 全文检索的索引创建过程一般有以下几步：

一些要索引的原文档 (Document)

为了方便说明索引创建过程，这里特意用两个文件为例：

文件一： Students should be allowed to Go out with their friends, but not allowed to drink beer.

文件二： My friend Jerry went to school to see his students but found them drunk which is not allowed.

将原文档传给分次组件 (Tokenizer)

分词组件 (Tokenizer) 会做以下几件事情 ( 此过程称为 Tokenize) ：

1. 将文档分成一个一个单独的单词。

2. 去除标点符号。

3. 去除停词 (Stop word) 。

所谓停词 (Stop word) 就是一种语言中最普通的一些单词，由于没有特别的意义，因而大多数情况下不能成为搜索

的关键词，因而创建索引时，这种词会被去掉而减少索引的大小。

英语中挺词 (Stop word) 如： “the”,“a” ， “this” 等。

对于每一种语言的分词组件 (Tokenizer) ，都有一个停词 (stop word) 集合。

经过分词 (Tokenizer) 后得到的结果称为词元 (Token) 。

在我们的例子中，便得到以下词元 (Token) ：

“Students” ， “allowed” ， “go” ， “their” ， “friends” ， “allowed” ， “drink” ， “beer” ， “My” ， “friend” ， “Jerry” ， “went

” ， “school” ， “see” ， “his” ， “students” ， “found” ， “them” ， “drunk” ， “allowed” 。

将得到的词元 (Token) 传给语言处理组件 (Linguistic Processor)

语言处理组件 (linguistic processor) 主要是对得到的词元 (Token) 做一些同语言相关的处理。

对于英语，语言处理组件 (Linguistic Processor) 一般做以下几点：

1. 变为小写 (Lowercase) 。

2. 将单词缩减为词根形式，如 “cars ” 到 “car ” 等。这种操作称为： stemming 。

3. 将单词转变为词根形式，如 “drove ” 到 “drive ” 等。这种操作称为： lemmatization 。

Stemming 和 lemmatization 的异同：

相同之处： Stemming 和 lemmatization 都要使词汇成为词根形式。

两者的方式不同：

Stemming 采用的是 “ 缩减 ” 的方式： “cars” 到 “car” ， “driving” 到 “drive” 。

Lemmatization 采用的是 “ 转变 ” 的方式： “drove” 到 “drove” ， “driving” 到 “drive” 。

两者的算法不同：

Stemming 主要是采取某种固定的算法来做这种缩减，如去除 “s” ，去除 “ing” 加 “e” ，将 “ational” 变

为 “ate” ，将 “tional” 变为 “tion” 。 Lemmatization 主要是采用保存某种字典的方式做这种转变。比如字典中

有 “driving” 到 “drive” ， “drove” 到 “drive” ， “am, is, are” 到 “be” 的映射，做转变时，只要查字典就可以了。

Stemming 和 lemmatization 不是互斥关系，是有交集的，有的词利用这两种方式都能达到相同的转换。

语言处理组件 (linguistic processor) 的结果称为词 (Term) 。

在我们的例子中，经过语言处理，得到的词 (Term) 如下：

“student” ， “allow” ， “go” ， “their” ， “friend” ， “allow” ， “drink” ， “beer” ， “my” ， “friend” ， “jerry” ， “go” ， “schoo

l” ， “see” ， “his” ， “student” ， “find” ， “them” ， “drink” ， “allow” 。

也正是因为有语言处理的步骤，才能使搜索 drove ，而 drive 也能被搜索出来。

将得到的词 (Term) 传给索引组件 (Indexer)

索引组件 (Indexer) 主要做以下几件事情：

1. 利用得到的词 (Term) 创建一个字典。

在我们的例子中字典如下： Term

Document ID

student

allow

their

friend

allow

drink

beer

friend

jerry

school

see

his

student

find

them

drink

allow

2. 对字典按字母顺序进行排序。 Term

Document ID

allow

beer

drink

find

friend

his

jerry

school

see

student

their

them

3. 合并相同的词 (Term) 成为文档倒排 (Posting List) 链表。 在此表中，有几个定义：

Document Frequency 即文档频次，表示总共有多少文件包含此词 (Term) 。

Frequency 即词频率，表示此文件中包含了几个此词 (Term) 。

所以对词 (Term) “allow” 来讲，总共有两篇文档包含此词 (Term) ，从而词 (Term) 后面的文档链表总共有两项，第一

项表示包含 “allow” 的第一篇文档，即 1 号文档，此文档中， “allow” 出现了 2 次，第二项表示包含 “allow” 的第二个文

档，是 2 号文档，此文档中， “allow” 出现了 1 次。

到此为止，索引已经创建好了，我们可以通过它很快的找到我们想要的文档。

而且在此过程中，我们惊喜地发现，搜索 “drive” ， “driving” ， “drove” ， “driven” 也能够被搜到。因为在我们的索引

中， “driving” ， “drove” ， “driven” 都会经过语言处理而变成 “drive” ，在搜索时，如果您输入 “driving” ，输入的查询

语句同样经过我们这里的一到三步，从而变为查询 “drive” ，从而可以搜索到想要的文档。

搜索索引

到这里似乎我们可以宣布 “ 我们找到想要的文档了 ” 。

然而事情并没有结束，找到了仅仅是全文检索的一个方面。不是吗？如果仅仅只有一个或十个文档包含我们查询的

字符串，我们的确找到了。然而如果结果有一千个，甚至成千上万个呢？那个又是您最想要的文件呢？

打开 Google 吧，比如说您想在微软找份工作，于是您输入 “Microsoft job” ，您却发现总共有 22600000 个结果返

回。好大的数字呀，突然发现找不到是一个问题，找到的太多也是一个问题。在如此多的结果中，如何将最相关的

放在最前面呢？当然 Google 做的很不错，您一下就找到了 jobs at Microsoft 。想象一下，如果前几个全部是 “Microsoft does a

good job at software industry…” 将是多么可怕的事情呀。

如何像 Google 一样，在成千上万的搜索结果中，找到和查询语句最相关的呢？

如何判断搜索出的文档和查询语句的相关性呢？

这要回到我们第三个问题：如何对索引进行搜索？

搜索主要分为以下几步：

用户输入查询语句

查询语句同我们普通的语言一样，也是有一定语法的。

不同的查询语句有不同的语法，如 SQL 语句就有一定的语法。

查询语句的语法根据全文检索系统的实现而不同。最基本的有比如： AND, OR, NOT 等。

举个例子，用户输入语句： lucene AND learned NOT Hadoop 。

说明用户想找一个包含 lucene 和 learned 然而不包括 hadoop 的文档。

对查询语句进行词法分析，语法分析，及语言处理

由于查询语句有语法，因而也要进行语法分析，语法分析及语言处理。

1. 词法分析主要用来识别单词和关键字。

如上述例子中，经过词法分析，得到单词有 lucene ， learned ， hadoop, 关键字有 AND, NOT 。

如果在词法分析中发现不合法的关键字，则会出现错误。如 lucene AMD learned ，其中由于 AND 拼错，导致 AMD

作为一个普通的单词参与查询。

2. 语法分析主要是根据查询语句的语法规则来形成一棵语法树。

如果发现查询语句不满足语法规则，则会报错。如 lucene NOT AND learned ，则会出错。

如上述例子， lucene AND learned NOT hadoop 形成的语法树如下： 3. 语言处理同索引过程中的语言处理几乎相同。

如 learned 变成 learn 等。

经过第二步，我们得到一棵经过语言处理的语法树。

搜索索引，得到符合语法树的文档

此步骤有分几小步：

1. 首先，在反向索引表中，分别找出包含 lucene ， learn ， hadoop 的文档链表。

2. 其次，对包含 lucene ， learn 的链表进行合并操作，得到既包含 lucene 又包含 learn 的文档链表。

3. 然后，将此链表与 hadoop 的文档链表进行差操作，去除包含 hadoop 的文档，从而得到既包含 lucene 又包含

learn 而且不包含 hadoop 的文档链表。

4. 此文档链表就是我们要找的文档。

根据得到的文档和查询语句的相关性，对结果进行排序

虽然在上一步，我们得到了想要的文档，然而对于查询结果应该按照与查询语句的相关性进行排序，越相关者越靠

前。

如何计算文档和查询语句的相关性呢？

不如我们把查询语句看作一片短小的文档，对文档与文档之间的相关性 (relevance) 进行打分 (scoring) ，分数高的相

关性好，就应该排在前面。那么又怎么对文档之间的关系进行打分呢？

这可不是一件容易的事情，首先我们看一看判断人之间的关系吧。

首先看一个人，往往有很多要素，如性格，信仰，爱好，衣着，高矮，胖瘦等等。

其次对于人与人之间的关系， 不同的要素重要性不同 ，性格，信仰，爱好可能重要些，衣着，高矮，胖瘦可能就

不那么重要了，所以具有相同或相似性格，信仰，爱好的人比较容易成为好的朋友，然而衣着，高矮，胖瘦不同的

人，也可以成为好的朋友。

因而判断人与人之间的关系， 首先要找出哪些要素对人与人之间的关系最重要 ，比如性格，信仰，爱好。 其次要判

断两个人的这些要素之间的关系 ，比如一个人性格开朗，另一个人性格外向，一个人信仰佛教，另一个信仰上帝，

一个人爱好打篮球，另一个爱好踢足球。我们发现，两个人在性格方面都很积极，信仰方面都很善良，爱好方面都

爱运动，因而两个人关系应该会很好。

我们再来看看公司之间的关系吧。

首先看一个公司，有很多人组成，如总经理，经理，首席技术官，普通员工，保安，门卫等。

其次对于公司与公司之间的关系，不同的人重要性不同 ，总经理，经理，首席技术官可能更重要一些，普通员工，

保安，门卫可能较不重要一点。所以如果两个公司总经理，经理，首席技术官之间关系比较好，两个公司容易有比

较好的关系。然而一位普通员工就算与另一家公司的一位普通员工有血海深仇，怕也难影响两个公司之间的关系。

因而判断公司与公司之间的关系， 首先要找出哪些人对公司与公司之间的关系最重要 ，比如总经理，经理，首席技

术官。 其次要判断这些人之间的关系 ，不如两家公司的总经理曾经是同学，经理是老乡，首席技术官曾是创业伙

伴。我们发现，两家公司无论总经理，经理，首席技术官，关系都很好，因而两家公司关系应该会很好。

分析了两种关系，下面看一下 如何判断文档之间的关系 了。

首先，一个文档有很多词 (Term) 组成，如 search, lucene, full-text, this, a, what 等。

其次对于文档之间的关系，不同的 Term 重要性不同 ，比如对于本篇文档， search, Lucene, full-text 就相对重要一

些， this, a , what 可能相对不重要一些。所以如果两篇文档都包含 search, Lucene ， fulltext ，这两篇文档的相关性

好一些，然而就算一篇文档包含 this, a, what ，另一篇文档不包含 this, a, what ，也不能影响两篇文档的相关性。

因而判断文档之间的关系，首先找出哪些词 (Term) 对文档之间的关系最重要，如 search, Lucene, fulltext 。然后判

断这些词 (Term) 之间的关系。

找出词 (Term) 对文档的重要性的过程称为计算词的权重 (Term weight) 的过程。

计算词的权重 (term weight) 有两个参数，第一个是词 (Term) ，第二个是文档 (Document) 。

词的权重 (Term weight) 表示此词 (Term) 在此文档中的重要程度，越重要的词 (Term) 有越大的权重 (Term weight) ，

因而在计算文档之间的相关性中将发挥更大的作用。

判断词 (Term) 之间的关系从而得到文档相关性的过程应用一种叫做向量空间模型的算法 (Vector Space Model) 。

下面仔细分析一下这两个过程：

1. 计算权重 (Term weight) 的过程。

影响一个词 (Term) 在一篇文档中的重要性主要有两个因素：

Term Frequency (tf) ：即此 Term 在此文档中出现了多少次。 tf 越大说明越重要。

Document Frequency (df) ：即有多少文档包含次 Term 。 df 越大说明越不重要。容易理解吗？词 (Term) 在文档中出现的次数越多，说明此词 (Term) 对该文档越重要，如 “ 搜索 ” 这个词，在本文档中

出现的次数很多，说明本文档主要就是讲这方面的事的。然而在一篇英语文档中， this 出现的次数更多，就说明越

重要吗？不是的，这是由第二个因素进行调整，第二个因素说明，有越多的文档包含此词 (Term), 说明此词 (Term)

太普通，不足以区分这些文档，因而重要性越低。

这也如我们程序员所学的技术，对于程序员本身来说，这项技术掌握越深越好（掌握越深说明花时间看的越多， tf

越大），找工作时越有竞争力。然而对于所有程序员来说，这项技术懂得的人越少越好（懂得的人少 df 小），找工

作越有竞争力。人的价值在于不可替代性就是这个道理。

道理明白了，我们来看看公式：

这仅仅只 term weight 计算公式的简单典型实现。实现全文检索系统的人会有自己的实现， Lucene 就与此稍有不

同。

2. 判断 Term 之间的关系从而得到文档相关性的过程，也即向量空间模型的算法 (VSM) 。

我们把文档看作一系列词 (Term) ，每一个词 (Term) 都有一个权重 (Term weight) ，不同的词 (Term) 根据自己在文档中

的权重来影响文档相关性的打分计算。

于是我们把所有此文档中词 (term) 的权重 (term weight) 看作一个向量。

Document = {term1, term2, …… ,term N}

Document Vector = {weight1, weight2, …… ,weight N}

同样我们把查询语句看作一个简单的文档，也用向量来表示。

Query = {term1, term 2, …… , term N}

Query Vector = {weight1, weight2, …… , weight N}

我们把所有搜索出的文档向量及查询向量放到一个 N 维空间中，每个词 (term) 是一维。

如图： t1

t10

t11

.477

.176

.477

.954

.176

.477

.176

我们认为两个向量之间的夹角越小，相关性越大。

所以我们计算夹角的余弦值作为相关性的打分，夹角越小，余弦值越大，打分越高，相关性越大。

有人可能会问，查询语句一般是很短的，包含的词 (Term) 是很少的，因而查询向量的维数很小，而文档很长，包含

词 (Term) 很多，文档向量维数很大。你的图中两者维数怎么都是 N 呢？

在这里，既然要放到相同的向量空间，自然维数是相同的，不同时，取二者的并集，如果不含某个词 (Term) 时，则

权重 (Term Weight) 为 0 。