嘉宾 | 崔京
采编 | 木环
在投入运作的一定数量的服务器中,每月都会有硬件故障的发生;此外,还有如断电、人为误操作、攻击等情况。除了在源头上尽可能避免事故,还需要做好事故的应对方案。为了保证事故灾难发生后数据的可靠性,阿里云研发了MySQL三节点方案,每个节点同步地都存放全量的数据。
该项目是在AliSQL基础上,引入Raft协议来解决MySQL多节点复制上的一致性选主的难题。其中,前者AliSQL是基于MySQL官方版本的一个分支,由阿里云数据库团队维护;于2016年8月开源,InfoQ曾经报道了《专访丁奇:阿里云即将开源AliSQL,超大并发、针对秒杀优化》。这一次,InfoQ也采访了该方案的技术负责人。
分布式数据可的一致性问题
纵观整个分布式数据库领域,大家要解决的问题都是相似的,只是实现方法会各有不同。问题有哪些呢?
第一是容错性,我们现在普遍使用的PC Server服务器,硬件本身的可靠性并不高,如何应对硬件的不可靠,是软件(包括数据库)需要去解决的问题。
第二是扩展性,又回到这种服务器,自身存储和计算都有上限,一个普通的业务放进来就有可能触达天花板,如何突破?
在实现上,随着软硬件的发展,