最近被问到分布式系统的共享方式,结合之前学过的黄铠老师的书稍微说几句。
各种分布式系统,不管是Hadoop,SMP,MPP还是其他巴拉巴拉的东西,共享资源的方式不外乎以下三种,见下图。该图最早来自黄铠老师的论文(K.Hwang,Z.Xu, Support of clustering and availability),我重新画了下,各部分含义如下:P/C处理器和缓存,M内存,D磁盘,NIC网卡,MIO内存-IO桥。当然图只是一个示意,实际构建系统的时候可能有变化。
a)不共享结构。大多数集群采用这种结构,节点间通过以太网等局域网方式简单连接。最常见的例子就是Hadoop。这种结构最大的优势就是扩容的成本非常低,只需要简单增加机器并做网络连接即可,集群的可用性也非常高。缺点也非常明显,所谓的不共

本文探讨了分布式系统中资源共享的三种方式:不共享结构(如Hadoop)、共享磁盘结构(如Oracle RAC)和共享内存结构。不共享结构成本低但存在数据交换开销;共享磁盘结构保持数据一致性但受限于I/O瓶颈;共享内存结构提供快速访问速度,但面临内存管理和缓存一致性挑战。
最低0.47元/天 解锁文章
166

被折叠的 条评论
为什么被折叠?



