HCIA-GaussDB
思维导图 https://download.csdn.net/download/lanlingxueyu/88797517
数据库介绍
数据库技术概述
数据库技术
数据 Data
记录 Record
数据库 Database DB
数据库是存放数据的仓库,是大量数据的集合。
存放在数据库中数据的特点
永久存储
有组织
可共享
数据库管理系统 DBMS
数据库管理系统是一个能够科学地组织和存储数据,高效地获取和维护数据的系统软件,是位于用户与操作系统之间的数据管理软件,其主要功能包括:
数据定义功能;
数据组织、存储和管理功能;
数据操纵功能;
数据库的事务管理和运行管理功能;
数据库的建立和维护功能;
与其他软件系统的通信功能等。
数据库系统 DBS
数据库系统是由数据库、数据库管理系统(及其应用开发工具)、应用程序和数据库管理员组成的存储、管理、处理和维护数据的系统。
视图
数据库技术发展史
数据库技术产生
数据库技术产生与发展
数据库技术应数据管理任务的需要而产生。
数据管理的发展
应用需求推动;
软硬件的飞速发展为基础;
三个阶段:人工管理、文件系统、数据库系统。
视图
数据管理三个阶段比较
视图
数据库系统优势
整体数据的结构化
数据面向整个系统而不是单个应用,被多个应用共享
数据的共享性高,冗余度低且易扩充
数据独立性高
####### 物理独立性:应用程序与数据库中数据的物理存储是相互独立的
####### 逻辑独立性:应用程序与数据库的逻辑结构是相互独立的
统一管理和控制
####### 数据的安全性保护
####### 数据的完整性检查
####### 并发控制
####### 数据库恢复
数据库系统发展特点
视图
层次,网状,关系模型
视图
层次模型
####### 有且只有一个节点没有双亲,该节点被称为根节点(root)
####### 根节点以外的其他节点有且只有一个双亲节点
网状模型
####### 允许一个以上的节点无双亲
####### 一个节点可以有多于一个的双亲
关系模型
####### 建立在严格的数据概念基础上
####### 关系必须是规范化的
####### 关系的分量必须是一个不可分的数据项
层次,网状,关系模型对比
视图
结构化查询语言-Structured Query Language (SQL语言)
高级的非过程化编程语言,允许用户在高层数据结构上工作
不要求用户指定数据存放方法
不需要用户了解具体数据存放方式
底层结构完全不同的各种关系型数据库系统可以使用相同的SQL语言作为数据操作和管理的接口
其他数据模型
面向对象数据模型(ObjectOrientedDataModel,OO模型)
将语义数据模型和面向对象程序设计方法结合起来,用一系列面向对象核心概念构成模型基础。
由于面向对象数据库操作语言过于复杂,没有得到开发人员认可。
XML数据模型
可扩展标记语言(extensible markup language, 简称XML),是W3C在1998年制定的一项标准,被作为互联网信息交换的标准。
XML模型是由若干带有标签的节点组成的有向树,是一种分层自描述模型,具有良好的语义和可扩展性,可以灵活地表示和组织数据,并提供高效的查询方法,例如XPath、XQuery、关键字查询、子树匹配等。
####### 可扩展标记语言(extensible markup language, 简称XML)
RDF数据模型
互联网的信息没有统一表达方式,W3C提出资源描述框架(Resource Description Framework,RDF) 来描述和注解互联网资源;
RDF是描述互联网资源的标记语言,结构为(主语,谓词,宾语);
主要用于语义网、知识库的基础数据模型,是当前知识图谱技术的基石。
####### 资源描述框架(Resource Description Framework,RDF)
数据管理技术的新挑战
视图
5V特性
Volume 数量
Variety 多样性
Veracity 速度
Velocity 真实
Value 价值
NoSQL技术特点和类型
NoSQL(NotOnlySQL)
非关系型的、分布式的、不保证满足ACID特性的一类数据管理系统
技术特点
对数据进行分区(partitioning),利用大量节点并行处理获得高性能,同时能够采用横向扩展方式(scale out)
降低ACID一致性约束,允许暂时不一致,接受最终一致性。遵循CAP理论和BASE原则
各数据分区提供备份(一般是三份),应对节点故障,提高系统可用性
主要NoSQL数据库简介
视图
NoSQL并不是为了取代RDBMS
优势显著,缺点也较为明显
与RDBMS一起构建完整的数据库生态系统
NewSQL浅谈
NewSQL
指追求NoSQL的可扩展性同时能够支持关系模型(包括ACID特性)的关系型数据库系统,主要面向OLTP场景
能够支持SQL作为主要的使用语言
NewSQL的分类
采用了新架构重新构建产品
####### Shared-Nothing,多节点并发控制,分布式处理,利用复制实现容错,流式控制等技术架构
####### Google Spanner,H-Store,VoltDB等
采用Transparent Sharding中间件技术
####### 数据分片(sharding)的过程对于用户来说是透明的(transparent),用户的应用程序不需要作出变化
####### OracleMySQL Proxy,MariaDBMaxSacle等
DAAS(Database-as-a-Service, 数据库即服务)
####### 云服务商提供的数据库产品,云服务商提供具备NewSQL特性的数据库产品
####### Amazon Aurora,阿里云的Oceanbase,腾讯云的CynosDB