今天从宽泛的角度谈谈AWS的分布式概念。首先,AWS是一个基于分布式架构构建的云服务,我想这一点是最清楚最明白,人人皆知不过的了。但是,当我们开始使用AWS以后就会发现分布式远不像我们想象中那么清晰,而是经常会忘记,并且需要时时提醒自己我正在使用的是一个分布式系统。当我们后面讨论一些AWS当中最流行的服务,比如DynamoDB,比如S3,我们会涉及到一个很有趣的概念,叫做consistency。我们会需要深入理解eventually consistency的概念,和使用这样的服务时需要克服的一些陷阱。而这些问题的出现,都是因为AWS是一个分布式的系统。
什么叫分布式系统?按照维基百科的定义:
分布式系统是一种系统,其组件位于不同的联网计算机上,这些计算机通过相互传递消息来通信和协调其动作。[1]这些组件相互交互以实现一个共同的目标。分布式系统的三个重要特征是:组件并发,缺少全局时钟和组件独立故障。
AWS可以带给我们很多好的使用特性,可以说都是借助于分布式系统完成的。比如,AWS可以动态调整我们要使用的资源。只有在我们使用的资源不够时才会分配给我们更多的资源,以达到节省费用的目的。那么正是因为AWS的基础架构是基于多个小的组件完成的,使得AWS提供动态分配资源的功能。还有很多很多特性都是基于分布式系统带来的好处,在这里先不细说。
我们先来从最高层理解一下AWS是怎么体现出分布式的。首先,我们应该注意到AWS里的region的概念。如果我们打开AWS console界面右上角在“support”左边的region下拉菜单,我们可以看到所有的AWS已经部署了的region。每一个region的信息包括“大地区 (小地区