1.试述关系数据库在哪些方面无法满足Web2.0应用的需求;
2.为什么说关系数据库的一些关键特性在Web2.0时代成为“鸡肋”;
3.试述NoSQL数据库的四大类型;
4.试述NoSQL数据库四大类型的典型应用和优缺点;
5.试述CAP理论的具体含义;
6.试述数据库的ACID四性的含义。
1.解:
关系数据库已经无法满足Web2.0的需求。主要表现在以下几点:
a、无法满足海量数据的管理需求;
b、无法满足数据高并发的需求;
c、无法满足高可拓展性和高可用性的需求。
2.解:
关系数据库的关键特性包括了完善的事务机制和高效的查询机制。但是,关系数据库引以为傲的两个关键特性,到了Web2.0时代却成了鸡肋,主要表现在以下几个方面:
a、Web2.0网站系统通常不要求严格的数据库事务。
b、Web2.0并不要求严格的读写实时性。
c、Web2.0通常不包含大量复杂的SQL查询(去结构化,存储空间换取更好的查询性能)。
3.解:
NoSQL数据库主要包括键值数据库、列族数据库、文档数据库和图形数据库这四大类型。
4.
解:
a、键值数据库。
典型应用:
涉及频繁读写、拥有简单数据模型的应用。
内容缓存,比如会话、配置文件、参数、购物车等。
存储配置和用户数据信息的移动应用。
优点:拓展性好,灵活性好,大量写操作时性能高。
缺点:无法存储结构化信息,条件查询效率较低。
b、列族数据库
典型应用:
分布式数据存储与管理
数据在地里上分布与多个数据中心的应用程序
可以容忍副本中存在短期不一致情况的应用程序
拥有动态字段的应用程序
拥有潜在大量数据的应用程序,大到几百TB的数据
优点:查找速度快,可拓展性强,容易进行分布式拓展,复杂性低。
缺点:功能较少,大都不支持强事务一致性。
c、文档数据库
典型应用:存储、索引并管理面向文档的数据或者类似的半结构化数据。比如,用于后台具有大量读写操作的网站。使用JSON数据结构的应用、使用嵌套结构等非规范化数据的应用程序。
优点:性能好(高并发),灵活性高,复杂性低,数据结构灵活。提供嵌入式文档功能,将经常查询的数据存储在同一个文档中,既可以根据键来构建索引,也可以根据内容构建索引。
缺点:缺乏统一的查询语法。
d、图形数据库
典型应用:专门用于处理具有高度相互关联关系的数据,比较适合于社交网络、模式识别、依赖分析、推荐系统以及路径寻找等问题。
优点:灵活性高,支持复杂的图形算法,可用于构建复杂的关系图谱。
缺点:复杂性高,只能支持一定的数据规模。
5.解:
所谓的CAP指的是:
C(Consistency):一致性,是指任何一个读操作总是能够读到之前完成的写操作的结果,也就是在分布式环境中,多点的数据是一致的,或者说,所有结点在同一时间具有相同的数据。
A(Availability):可用性,是指快速获取数据,可以在确定的时间内返回操作结果,保证每个请求不管成功或者失败都有响应。
P(Tolerance of Network Partition):分区容忍性,是指当出现网络分区的情况时(即系统中的一部分节点无法和其他节点进行通信),分离的系统也能够正常运行,也就是说,系统中任意信息的丢失或失败不会影响系统的继续运行。
6.解:
A(Atomicity),原子性,指事务必须是原子工作单元,对于其数据修改,要么全都执行,要么全都不执行。
C(Consistency),一致性,指事务在完成时,必须使所有的数据都保持一致状态。
I(Isolation),隔离性,指并发事务所做的修改必须与其他并发事务所做的修改隔离。
D(Durability),持久性,指事务完成之后,它对于系统的影响是永久性的,该修改及时出现致命的系统故障也将一直保持。
海量数据分布式存储技术-作业五
最新推荐文章于 2022-11-09 15:57:31 发布