分布式存储
分布式存储系统是一种将数据分散在多个独立节点上,并通过网络进行数据传输和访问的存储系统
分布式存储的特点:可扩展性、高可用性、容错性、高性能等。分布式存储系统能够水平扩展存储容量和性能,提供持续可用的数据存储服务,并具备强大的容错能力,确保数据的可靠性和稳定性
认识列族、行关键字、时间戳
NoSQL
特点:
- 无需预定义模型
- 无共享架构
- 弹性可扩展
- 异步复制
- 分区存储
- base特性,及最终一致性
Hbase
BigTable
BigTable的设计目的是可靠地处理PB级别的数据,并且能够部署到上千台机器上。BigTable已经实现了如下几个目标:
- 适用性广泛
- 可扩展
- 高性能
- 高可用性
数据模型:BigTable是一个稀疏的、分布式的、持久化存储的多维度排序Map。Map的索引是行关键字、列关键字以及时间戳
作业
选择题
-
下列哪项不是分布式存储系统的特性
- 是的有
可扩展
、低成本
、易使用
,而大规模不是
- 是的有
-
下列哪项不是NoSQL普遍存在的特征
()
- 是的有
分区
、异步复制
、无共享架构
而需要预定义模式不是
- 是的有
-
HBase是哪一类NoSQL数据库系统
- 列存储数据库
-
下列BigTalbe系统的说法错误的是
- 正确的有
Map的索引是行关键字、列关键字及时间戳
、BigTalbe的行关键字可以是任意的字符串
、BigTalbe的列关键字组成的集合称为“列族”,列族是访问控制的基本单位
而错误的是BigTable是一个稠密的、分布式的、特持久化存储的多维度排序Map
- 正确的有
-
BigTalbe依赖的一个高可用的、序列化的分布式锁服务组件为
()
- Chubby
-
下列不是HBase中Master服务器功能的是
()
- 是的有
为Table服务器分配Tablets
、检测新加入的或过期失效的Tablet服务器
、对Tablet服务器进行负载均衡
、而获取Talbe服务器的位置信息不是
- 是的有
-
以下哪项不是HBase的访问接口
()
是的有Native Java API
、HBase Shell
、Thrift Gateway
、而Hadoop HDFS不是 -
HBase中分布式存储和负载均衡的最小单元是
HRegion
-
HBase中最核心的模块是
- HRegionServer
-
以下关于统计分析与决策进程的4个阶段描述错误的是
()
- 描述正确的是
对系统的描述分析阶段要求我们运用所掌握的信息对系统进行尽可能充分、全面的认识
对系统进行解析性分析时,可以通过建立数据模型,辨识和刻画系统的解析结构,确定系统中各因素或个元素的内在联系
决策阶段即对系统的状态进行充分观察和认识,对系统构造及其要素的内在联系进行辨识和深入分析
- 描述正确的是
判断题
- 一般来说,工程师如果能够深入理解分布式存储系统、那么理解其他互联网后台架构几乎不会有困难
(√)
- NoSQL数据库具有一个统一的架构
(×)
- 没有统一的架构
- 目前大多数NoSQL数据库已提供了内建的安全机制
(×)
- 没有,还在初步阶段
- BigTable支持完整的关系数据模型
(×)
- 支持的是NoSQL数据模型
- BigTable内部存储数据的文件是Google SSTalble格式的,SSTable是一个持久化的、排序的、不可更改的Map结构
(√)
- BigTable系统中客户端读取的数据都不经过Master服务器,客户程序直接和Table服务器进行读/写操作
(√)
- HBase是一个适合于半结构化数据存储、基于行模式的数据库
(×)
- 列模式
- HBase中任何字符串都可以作为行键
(√)
- HBase中列族必须在定义表时给出,而列成员不需要在定义表时给出
(√)
- HBase表一开始就有很多区域(Region)
(×)
- 一开始只有一个
填空题
-
分布式存储涉及的技术主要来自
()
及()
两个领域分布式系统
、数据库
-
相较于事物严格的ACID特性,NoSQL数据库保证的是
()
特征BASE
-
Google公司的很多项目如Web索引、Google Earth、Google Finance均采用Bigtable存储数据,这些应用对BigTable提出的要求差异很大,表示在
()
和()
上数据量
、响应速度
-
在BigTalbe中,表的每一个数据项都可以包含同一份数据的不同版本,不同版本的数据通过
()
索引时间戳
-
HBase
以()
的形式存储数据表
-
HBase中单元格(Cell)由行键、
()
、()
唯一决定列族限定符
、时间戳
-
HMaster在功能上主要负责
()
和()
的管理工作Talbe
、Region
-
HBase存储的核心是
()
存储HStore
-
HBase
中的所有数据文件都存储在Hadoop HDFS文件系统上,主要包括两种文件类型:()
和()
HFile
、HLog File
-
多元统计数据分析的主要内容包括对数据的描述性分析方法和解析性方法的主要代表是
()
和()
回归分析
、判别分析