阿里云ACA官方PPT考试重点

最新推荐文章于 2024-07-17 15:42:30 发布

m0_74487105

最新推荐文章于 2024-07-17 15:42:30 发布

阅读量101

点赞数

文章标签：阿里云云计算

本文链接：https://blog.csdn.net/m0_74487105/article/details/133158779

版权

NOSQL数据库

NOSQL泛指非关系型的数据库(Not nly SQL)，有灵活的数据模型，可以避免Jin联接，易于扩展，数据类型更丰富，支持高并发的访问，支持海量数据分布式存储。

类型

萍

键值(Key-Value)

存储数据库

简称KV数据库，是对键值对集合进行存储检索和管理的数据库。

列族数据库

以列相关存储架构进行数据存储的数据库，主要适合于批量数据处理和即时查询。

文档数据库用于存储和管理文档的数据库。

图数据库

是以点、边为基础存储单元，以高效存储查询图数据为设计原理的数据管理系统。

键值数据库简介

键值数据库(Key-Value数据库)，简称KV数据库，是对键值对集合进行存储、检索和管理的数据库。

主要特点

每个KV中K是唯一的，Value以String、List等形式保存

基于Key访问，查找速度快

数据之间没有关联关系，写入速度快

处理结构复杂的数据，Value结构灵活

便于数据分布式存储与划分

主流产品

Redis

Memcached

应用场景

对关系型数据库频繁读的数据做高速缓存分布式架构，完成Session数据存储

分布式架构，完成Session数据存储

列族数据库简介

列族数据库是以列族为相关存储架构进行数据存储的数据库一个列族可以存储多个列的数据。

特点

数据存储在列族中，将多个列与Key关联

列族将数据分成组，方便分布式存储与查询

查询速度快，一个列族中数据单独划片存储

节省存储空间，表的设计稀疏，NULL值不占存储空间压缩率高，根据数据类型、数据量大小选择压缩算法

主流产品

HBase0

Cassandra

......

应用场景

用户推荐

订单物流系统

用户浏览记录

时空数据

文档数据库简介

文档数据库主要是存储、检索和管理面向文档的信息，这个文档的结构是半结构化的。

特点：

文档模型

结构灵活0

分布式

查询方法

主流产品：

MongoDB

CouchDB

应用场景：

商品信息管理

内容管理

图数据库简介

图数据库是以点、边为基础存储单元，以高效存储、查询图数据为设计原理的数据管理系统,图数据库是一组点和边的集合，“点”表示实体，“边”表示实体间的关系，通过点、边和属性等方式来表示和存储数据

应用场景

比较适合处理社交网络、金融风控以及实时推荐系统等问题

特点

模型更直观

商品

关联查询性能高

主流产品

GraphDB

Neo4j.

分布式数据库系统概念

分布式数据库是指使用计算机网络将物理上分散的多个服务器连接起来组成一个逻辑上统一的数据库。分布式数据库的主要作用利用多个数据存储节点，以获取更大的存储容量和更高的并发访问量，同时提高整个数据库系统的可靠性与扩展性。

主要特点

独立透明性

·应用程序和数据结构之间相互独立

不必考虑数据的逻辑分区、数据物理位置分布、副本的一致性、局部数据库的数据类型

复制透明性

不必考虑数据库各个节点的复制情况，数据复制及更新都由系统自动完成

易于扩展性

可以通过增加多个服务器加强数据存储及处理能力

HBase及数据模型

HBase是一个分布式的、面向列的开源NOSQL数据库，存储海量数据，单表可以有百亿行、百万列，并完成对海量数据随机与实时读写操作。HBase是论文“Big Table”的开源实现，HBase不同于关系数据库，它是一个适合存储非结构化或半结构数据的数据库。

数据模型概述

HBase表中一行数据是由行键(Row Key)、时间(Timestamp)及列族来组成的。。一个列族可以存储多个字段的值，每个值在列族中有多个版本，每个版本由时间戳来区分列族中的每一个值称为单元格(Cell)。

Row Key:决定一行的唯一标识

Column Family:列族名在建表必须指定，列族中字段可动态

增加同一个列族数据存储在同一个目录下文件中

Timestamp:时间戳:区分Cell中数据不同版本

Cell:单元格: 由Row Key,Column (=<Family> +<Qualifier>)

Version}确定的值

HBase架构

HBase分布式数据库运行在Hadop之上，HBase的集群架构主要由HMaster、HRegionServer、HRegion以及Zookeeper等组件组成。

概述

Zookeeper

确保集群中只有一个HMaster。

存储HBase的元数据

HMaster

负责HRegionServer负载均衡

HRegionServer

负责管理Region

HRegion

存储表中列族的数据

HBase读写流程

读数据流程

首先Client先去访问Zookeeper找到HRegionServer再通过HRegionServer找到Region再通过Region找到Memstore和Storefile最后HRegionServer将数据响应给Client

写数据流程

Client也是先访问Zookeeper，并获取Meta表元数据----59a00确定将要写入的HRegionServer和HRegionClient向该HRegionServer发起写入数据请求，然后HRegionServer收到请求并响应

Client先把数据写入到HLog，以防止数据丢失。然后将数据写入到Memstore

HLog和Memstore均写入成功，则这条数据写入Region成功

MaxCompute简介

云原生大数据计算服务(MaxCompute)是一种快速、完全托管的TB/PB级数据仓库解决方案。MaxCompute向用户提供了完善的数据导入方案以及多种经典的分布式计算模型，能够更快速的解决用户海量数据计算问题，有效降低企业成本，并保障数据安全，

优势

简单易用

匹配业务发展的弹性扩展能力

支持多种分析场景

开放平台

MaxCompute产品架构

MaxCompute的产品架构如下

部分题库，需要完整题库可以留言，题库市面上最新最全。

m0_74487105

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
阿里云ACA官方PPT考试重点

HBase是一个分布式的、面向列的开源NOSQL数据库，存储海量数据，单表可以有百亿行、百万列，并完成对海量数据随机与实时读写操作。图数据库是以点、边为基础存储单元，以高效存储、查询图数据为设计原理的数据管理系统,图数据库是一组点和边的集合，“点”表示实体，“边”表示实体间的关系，通过点、边和属性等方式来表示和存储数据。NOSQL泛指非关系型的数据库(Not nly SQL)，有灵活的数据模型，可以避免Jin联接，易于扩展，数据类型更丰富，支持高并发的访问，支持海量数据分布式存储。
复制链接

扫一扫