分布式是一种思想,学习具体的分布式机制时,考虑分布式背后的东西;
一、概念
分布式数据库分布在多个站点,各个站点缺少共享部件;同构分布式数据库、异构分布式数据库;数据的分布方式给事务处理及查询带来较大困难;
分布式数据存储包括如下两种形成方式:
1、复制:不同站点维护相同r的副本,带来数据可用性、增加并发度、但是增加了更新开销;
2、分片:对关系r记性水平切片或者垂直切片,切片后可继续形成副本;
水平切片:散列、范围、等;垂直切片:最后每个垂直切片都包括关系r的主键;
如大学数据库,包括关系r employee_info(employee_id, name, designation, salary),处于保密缘故,可能划分为employee_private_info(employee_id, salary),employee_public_info(employee_id, name, designation),部署在多个站点;
二、透明性
分布式数据库必须保障数据透明性,包括分片透明性(user不知道如何分片的)、
复制透明性(user不关注什么对象被复制,数据对象逻辑上是统一的)、
位置透明性(user物质摘掉数据的物理位置,只要用户事务提供收标识符,无需关系副本存在何处)
三、分布式事务
分布式事务仍需要保持ACID性质,包括全