前言:了解分布式数据库的结构
如发现内容错误,评论区轰炸
13.1
1. 分布式数据库的核心目标:本地自治、非集中式管理、高可用性
2. 数据分片分为水平分片、垂直分片和导出分片(导出分片是用其他表的属性分片,比如说表一有学生的姓名和学号属性,表二有学生的成绩属性,根据表二的成绩属性对表一进行分片),还有一种特殊的分片是混合分片(简而言之就是以上三种分片的混合方式)
3. 数据分配
集中式:所有数据片段被安排在一个场地上
分割式:把一份全局数据分割成多份放在不同的场地
全复制式:每个场地都有完整的数据副本
混合式:全局数据被分成若干子集保存在不同场地
4. 分布式数据库的模式和普通数据库类似,最上层多个全局外模式,中间是全局概念模式,底层是多个局部概念模式
5. 分片透明性:最高级别的透明性,位于全局概念模式和分片模式之间
位置透明性:数据分片的分配位置对用户是透明的
局部数据模型透明性:处于两个透明性之间
13.2
1. 共享内存结构:所有处理机通过互联网共享一个公共的主存储器
2. 共享磁盘结构:处理机都拥有独立的内存,但是磁盘还是共享的
3. 无共享模式就是我们平时用的电脑的形式,只通过互联网传输数据
4. 层次结构:顶层是无共享结构,底层是共享内存或共享磁盘结构
5. 数据划分
轮状法:适合于扫描整个关系的应用
散列划分:比轮转更适合点查询,对于顺序扫描也十分高效
范围划分:同样利于范围查询和点查询
13.3
1. BigTable表的索引是行关键字、列关键字和时间戳,每个单元由行关键字、列关键字和时间戳共同决定
在BigTable中,不仅可以随意地增减行的数量,同在一定的约束条件下,还可以对列的数量进行扩展
2. BigTable数据模型的特点有表中的关键字可以是任意的字符串、列族是由列关键字组成的集合,是访问控制的基本单位、时间戳记录了BigTable中每一个数据项所包含的不同版本的数据的时间标记