目录
结构化查询语言——Structured Query Language
面向对象数据模型(ObjectOrientedData Model,OO模型)
联机事务处理(OnLineTransaction Processing)
联机分析处理(OnLineAnalytical Processing)
TPC(Transaction Processing Performance Council,事务处理性能委员会)
数据库(Datebase,DB)
特点:
1.永久储存
2.有组织
3.可共享
数据库管理系统(DBMS)
主要功能包括:
1. 数据定义功能;
2. 数据组织、存储和管理功能;
3. 数据操纵功能;
4.数据库的事务管理和运行管理功能;
5. 数据库的建立和维护功能;
6. 与其他软件系统的通信功能等
数据库系统(Database System, DBS)
简介:
数据库、数据库管理系统(及其应用开发工具)、应用程序和数据库管理员组成 的存储、管理、处理和维护数据的系统。
数据管理的三个阶段
数据库系统优势
整体数据的结构化
数据面向整个系统而不是单个应用,被多个应用共享。
数据的共享性高,冗余度低且易扩充。
数据独立性高
物理独立性:应用程序与数据库中数据的物理存储是相互独立的。
逻辑独立性:应用程序与数据库的逻辑结构是相互独立的。
统一管理和控制
数据的安全性保护; 数据的完整性检查; 并发控制; 数据库。
层次,网状,关系模型对比:
结构化查询语言——Structured Query Language
高级的非过程化编程语言,允许用户在高层数据结构上工作;
不要求用户指定数据存放方法;
不需要用户了解具体数据存放方式;
底层结构完全不同的各种关系型数据库系统可以使用相同的SQL语言作为数据操作和管理的接口。
其他数据模型
面向对象数据模型(ObjectOrientedData Model,OO模型)
将语义数据模型和面向对象程序设计方法结合起来,用一系列面向对象核心概念构成模型基础。 由于面向对象数据库操作语言过于复杂,没有得到开发人员认可
XML数据模型
可扩展标记语言(extensible markup language, 简称XML),是W3C在1998年制定的一项标准,被作为互联网信息交换的标准。 XML模型是由若干带有标签的节点组成的有向树,是一种分层自描述模型,具有良好的语义和可扩展性,可以灵活地表示和组 织数据,并提供高效的查询方法,例如XPath、XQuery、关键字查询、子树匹配等。
RDF数据模型(资源描述框架)
资源描述框架 互联网的信息没有统一表达方式,W3C提出资源描述框架(Resource Description Framework,RDF) 来描述和注解互联网资 源; RDF是描述互联网资源的标记语言,结构为(主语,谓词,宾语); 主要用于语义网、知识库的基础数据模型,是当前知识图谱技术的基石。
NoSQL数据库简介
传统数据库与云数据库比较
数据库架构发展
(架构不做暂时细致说明了)
架构特点对比
关系型数据库主流应用场景
联机事务处理(OnLineTransaction Processing)
OLTP是传统关系数据库的主要应用
面向基本的,日常的事务处理,例如银行储蓄业务的存取交易,转账交易等。
特点
大吞吐量:大量的短在线事务(插入、更新、删除),非常快速的查询处理。
高并发,(准)实时响应。
典型的OLTP场景
1. 零售系统 2.金融交易系统 3.火车票销售系统
联机分析处理(OnLineAnalytical Processing)
OLAP
联机分析处理的概念最早是E.F.Codd于1993年相对于OLTP系统而提出的。
是指对数据的查询和分析操作,通常对大量的历史数据查询和分析。涉及到的历史周期比较长,数据量大,在不同层 级上的汇总,聚合操作使得事务处理操作比较复杂。
特点
主要面向侧重于复杂查询,回答一些“战略性”的问题。
数据处理方面聚焦于数据的聚合,汇总,分组计算,窗口计算等“分析型”数据加工和操作。
从多维度去使用和分析数据。
典型的OLAP场景
1.报表系统,CRM系统。 2. 金融风险预测预警系统、反洗钱系统。 3. 数据集市,数据仓库。
OLTP和OLAP的对比分析
数据库性能衡量指标
TPC(Transaction Processing Performance Council,事务处理性能委员会)
职责是制定商务应用基准测试标准(Benchmark)的规范、性能和价格度量,并管理测试结果的发布。
制定的是标准规范而不是代码,任何厂家依据规范最优地构造自己系统进行评测。 推出了很多基准测试标准,其中针对OLTP和OLAP分别有两个规范。
TPC-C规范
面向OLTP系统,主要包括两个指标
流量指标:tpmC(tpm–transactions per minuete, 即每分钟测试系统处理的事务数量)。
性价比指标:Price(测试系统价格)/tmpC。
TPC-H规范
面向OLAP类系统
流量指标:qphH–Query per hour,即每小时处理的复杂查询数量。
需要考虑测试数据集合大小,分为不同的测试数据集,指定了22个查询语句,可以根据产品微调。
测试场景:数据加载,Power能力测试和Througput测试。