主从同步与备份
一套主从库通常会有一个可写的主库(也有双主互备结构的),可写的主库发生数据修改之后,可能会以推的方式发送到从库,或者从库轮询从主库上拉修改的数据。
① 逻辑模式
基于主库执行的SQL,到从库上去执行相同的SQL,也可能基于主库上执行的SQL时所影响的数据行,进一步根据这些行的主键生成一些列SQL语句到从库上执行。这种粒度最细,最容易识别,但是生成的SQL会比较多。
如果以SQL去执行,从库肯定会有一定的压力,但是这种从库的写通常是单线程的。不论主库有再高的并发压力,从库只有一个线程在发生写操作,不断循环写操作,该过程可以减少大量的系统资源征用问题。
比如一个单独的系统在抗高并发访问时负载会很高,但是用一个单线程不断循环去做事情时负载却不高,而且效率还很不错。比如用单线程循环写磁盘数据,一会儿就可以把磁盘写满,而且程序本身压力不会太大。
不过如果主库写的太快,从库有可能会跟不上主库写入的速度,此时就要考虑用其他的方式来解决。例如并行复制之类的操作。但是这样从库上的并行也会打开,从库压力开始上升,此时如果从库再提供其他的读访问,效果就会下降。单线程串行负载低但速度慢,并行速度快但负载高。
将延迟/并行概念结合起来,在这类数据库上读写分离,或者说从库上提供读服务,很多时候都是在读多写少的场景下。
②物理模式
基于修改的数据块来做赋值,可以提取比从库版本号高的数据库赋值到从库。因为以数据块为单位,所以通常它不需要执行SQL,不用经历复杂的SQL解析,锁,调度等逻辑,效率自然会高很多。但是这样从库对外提供访问相对就比较麻烦。
主从库还有其他的,比如延迟解决方案,写入数据与从库拿到的数据的时间点,跨机房,异地容灾解决方案,以及区域化数据访问解决方案等等。