分库分表
阿里提供的开发手册当中,建议: -个表的数据量超过500W或者数据文件超过2G,就要考虑分库分表了。
分库:
第一种:
把两个大数据量的表分到不同的两个服务器上,每个数据库服务器上有不同数量的表,以此来提升访问的压力
但是这样做写代码比较麻烦,因为访问不同的服务器的域名和IP不同,我们访问不同服务器上的表还需要单独写一段代码来区分
而且当把不同的表分到不同的服务器上时,我们不能使用连表查询
第二种
经典的数据库拆分方案,读写分离,主库负责写,从库负责读;
主库和从库的之间的数据同步是通过binlog东西实现的
分成几台数据库服务器,每台都一样,每个数据库的存的数据都一样,同时存几份,通过配置的形式,要么都存失败,要么都存成功。
原来的数据库也就是主库负责写
然后读取数据的时候从这几台数据库服务器中任意选择一台来读取。读取数据的速度会变快,相当于数据冗余,几台服务器的数据都一样,读取查询数据的时候后端会通过负载均衡向任意一台服务器搜索数据。
读写分离的原理
依赖于binlog日志 ,是个二进制的文件,插入、修改操作的时候,会写入到binlog文件,然后启动一个log dump异步线程,这个异步线程会把binlog复制到从库上去,然后从库去写一个relay log的日志(中继日志),然后从库会启动一个sql线程去执行这个中继日志里面的inset和update,然后从库就同步了,
缺点:因为是异步的,所以可能当主库的binlog还没复制呢,主库就down机了
但是这样写入数据的速度会慢一些,因为要保障几台数据库服务器中的数据同步,但一般数据库都是读多写少,所以写入慢没什么影响
分表:
如果分了库之后每个表的数据量仍然很大,就需要再分表
根据某些特征拆成结构一模一样的表,然后再分到不同的服务器上
拆表:
比如程序可以给每个表带上标记,AAA、BBB、CCC
或者根据id%2=0还是1 奇数偶数的去分
分库分表最常用的组件Mycat 阿里的 \ ShardingSphere京东的
垂直分表:
按照列字段进行拆分
水平分表:
按照行数据进行拆分

被折叠的 条评论
为什么被折叠?



