海量数据分布式存储技术-作业五

最新推荐文章于 2022-06-02 18:21:08 发布

醉一心

最新推荐文章于 2022-06-02 18:21:08 发布

阅读量1.2k

点赞数 2

CC 4.0 BY-SA版权

文章标签：数据库分布式

本文链接：https://blog.csdn.net/qq_37402392/article/details/118386620

本文探讨了关系数据库在Web2.0时代的局限性，分析了NoSQL数据库的四大类型及其应用场景，并讨论了CAP理论及ACID特性的含义。

1.试述关系数据库在哪些方面无法满足Web2.0应用的需求；
2.为什么说关系数据库的一些关键特性在Web2.0时代成为“鸡肋”；
3.试述NoSQL数据库的四大类型；
4.试述NoSQL数据库四大类型的典型应用和优缺点；
5.试述CAP理论的具体含义；
6.试述数据库的ACID四性的含义。
1.解：
关系数据库已经无法满足Web2.0的需求。主要表现在以下几点：
a、无法满足海量数据的管理需求；
b、无法满足数据高并发的需求；
c、无法满足高可拓展性和高可用性的需求。
2.解：
关系数据库的关键特性包括了完善的事务机制和高效的查询机制。但是，关系数据库引以为傲的两个关键特性，到了Web2.0时代却成了鸡肋，主要表现在以下几个方面：
a、Web2.0网站系统通常不要求严格的数据库事务。
b、Web2.0并不要求严格的读写实时性。
c、Web2.0通常不包含大量复杂的SQL查询（去结构化，存储空间换取更好的查询性能）。
3.解：
NoSQL数据库主要包括键值数据库、列族数据库、文档数据库和图形数据库这四大类型。
4.
解：
a、键值数据库。
典型应用：
涉及频繁读写、拥有简单数据模型的应用。
内容缓存，比如会话、配置文件、参数、购物车等。
存储配置和用户数据信息的移动应用。
优点：拓展性好，灵活性好，大量写操作时性能高。
缺点：无法存储结构化信息，条件查询效率较低。
b、列族数据库
典型应用：
分布式数据存储与管理
数据在地里上分布与多个数据中心的应用程序
可以容忍副本中存在短期不一致情况的应用程序
拥有动态字段的应用程序
拥有潜在大量数据的应用程序，大到几百TB的数据
优点：查找速度快，可拓展性强，容易进行分布式拓展，复杂性低。
缺点：功能较少，大都不支持强事务一致性。
c、文档数据库
典型应用：存储、索引并管理面向文档的数据或者类似的半结构化数据。比如，用于后台具有大量读写操作的网站。使用JSON数据结构的应用、使用嵌套结构等非规范化数据的应用程序。
优点：性能好（高并发），灵活性高，复杂性低，数据结构灵活。提供嵌入式文档功能，将经常查询的数据存储在同一个文档中，既可以根据键来构建索引，也可以根据内容构建索引。
缺点：缺乏统一的查询语法。
d、图形数据库
典型应用：专门用于处理具有高度相互关联关系的数据，比较适合于社交网络、模式识别、依赖分析、推荐系统以及路径寻找等问题。
优点：灵活性高，支持复杂的图形算法，可用于构建复杂的关系图谱。
缺点：复杂性高，只能支持一定的数据规模。
5.解：
所谓的CAP指的是：
C（Consistency）：一致性，是指任何一个读操作总是能够读到之前完成的写操作的结果，也就是在分布式环境中，多点的数据是一致的，或者说，所有结点在同一时间具有相同的数据。
A（Availability）：可用性，是指快速获取数据，可以在确定的时间内返回操作结果，保证每个请求不管成功或者失败都有响应。
P（Tolerance of Network Partition）：分区容忍性，是指当出现网络分区的情况时（即系统中的一部分节点无法和其他节点进行通信），分离的系统也能够正常运行，也就是说，系统中任意信息的丢失或失败不会影响系统的继续运行。
6.解：
A（Atomicity），原子性，指事务必须是原子工作单元，对于其数据修改，要么全都执行，要么全都不执行。
C（Consistency），一致性，指事务在完成时，必须使所有的数据都保持一致状态。
I（Isolation），隔离性，指并发事务所做的修改必须与其他并发事务所做的修改隔离。
D（Durability），持久性，指事务完成之后，它对于系统的影响是永久性的，该修改及时出现致命的系统故障也将一直保持。