集群存储(承载)数据的方式?
镜像全量
每个服务器上的数据是一模一样的(4G)
缺点:不具备横向扩展的能力
优点;高可用
沙丁切点:
三个节点,每个节点是4G,一共是12G,
缺点是数据丢失。
最理想状态:结合两者
Cherry:草莓
Replication:复制,重复
单机/单点
单点故障/瓶颈
制造的问题:阻塞严重,一个节点出现问题,,等待确认,一旦有一个节点出现问题,整个流程就出现了阻塞。这个叫强一致性,关系型数据库在这一块做的比较好。
不见得所有都要确认,去掉强一致性,数量过半确认就行。
最关键的问题是:
彼此之间各自为证。
过半机制,可以从任何一个里边的数据,但是前提是必须得同步。这就是大数据的弱一致性
大数据集群的布置:2n+1,n代表服务器,2n+2,允许一台不布置。,也就是按照3,5,7,9的方式来部署。
脑裂:splitbrain
分区:partition
一致性:consistency
可用性:availibity
容忍性:tolerance
相互之间互斥
无主模型:
所有的集群模式采用有主模型
分区
Sentinel:高可用
Cluster:集群
Twemproxy:分布式切片