数据库的基本概念
文章目录
数据
什么是数据(data)?
数据就是用来描述现实世界的一种符号,类似于文字
数据的含义被称为数据的语义,数据与其语义是不可分的
数据库
什么是数据库(DB)?
- 顾名思义,就是存放数据的仓库
- 是长期存储在计算机内、有组织的、可共享的大量数据的集合
- 存储在数据库中的数据具有较小的冗余度、较高的数据独立性和易拓展性,并可为各种用户共享
数据库管理系统
什么是数据库管理系统(DBMS)?
- 是一个位于用户和操作系统之间的系统软件
数据库管理系统的功能有:
- 数据定义
- 数据组织、存储和管理
- 数据操纵功能
- 数据库的事务管理和运行管理
- 数据库的建立和维护功能
- 其他功能
数据库系统
什么是数据库系统(DBS)?
- 由数据库、数据库管理系统、应用软件和数据库管理员组成的存储、管理、处理和维护数据的系统
数据库系统的特点:
- 数据共享性高、冗余度低且易扩充
- 数据独立性高
- 数据结构化
- DBMS对数据统一控制和管理
独立性
数据有三种独立性:
- 数据独立性:
应用程序与数据的具体结构和存储方法之间可以是相互隔离的,数据的结构和存储方法的变动不影响应用,这种隔离就称为数据独立性。数据独立性是使用DBMS的最大的优势之一。 - 逻辑独立性:
在数据库系统之上开发的应用程序,不受数据逻辑结构变化的影响。 - 物理独立性:
当数据的物理存储结构发生改变的时候,基于这个数据库开发的应用程序不受影响。
什么是物理结构呢?
官方定义就是 – 数据结构在计算机中的表示(又称映像)称为数据的物理结构,或称存储结构。就是指数据存储在磁盘中的方式。
那逻辑结构又是什么?
所谓逻辑结构就是数据与数据之间的关联关系,准确的说是数据元素之间的关联关系。逻辑结构主要分为四种:集合结构、线性结构、树状结构和网络结构。也可以统一的分为线性结构和非线性结构
文件 VS 数据库
文件和数据库之间有什么关系、异同?
- 都能用来存储文件,数据库系统建立在操作系统的文件系统之上
- 文件是操作系统提供的一种最简单的存储数据的机制,文件是没有结构的,需要应用层进行数据管理。一旦遇到故障,文件管理系统没有处理机制,会导致数据文件被破坏。
- 使用数据库存储数据,可以由DBMS来进行数据管理。设有文件保护、故障恢复机制,可以保证数据安全以及实现访问控制。
数据库的重要性
为什么要学习数据库?
- 需要对大量数据进行管理
- 数据的种类多以及规模大,对数据管理的需求爆炸式增长
- DBMS的实现包含了计算机发展的大部分成果
数据库的发展阶段
数据管理技术经历了人工管理、文件系统、数据库系统三个阶段
数据模型
前面说数据库是是长期存储在计算机内、有组织的、可共享的大量数据的集合,这里的组织是指数据模型,是数据库系统的核心和基础。数据模型是现实世界数据特征的抽象,数据模型所描述的内容有三部分,分别是:
- 数据结构 – 描述实体的构成和联系。
- 数据操作 – 对数据库的查询与更新
- 数据约束 – 对数据施加规则和限制
数据模型应满足三方面要求:
- 便于在计算机中实现。
- 容易被人理解
- 能够较真的模拟真实世界
根据模型应用的不同目的,可以将模型分为两大类:
- 概念模型 – 主要用于数据库的设计
- 逻辑模型和物理模型 – 主要用于数据库的实现
关系型数据模型 relation model of data
主流数据模型 – 关系型数据库,是指采用了关系模型来组织数据的数据库,其以行和列的形式存储数据,以便于用户理解,关系型数据库这一系列的行和列被称为表,一组表组成了数据库。
常见的关系型数据库有:
- MySQL
- SQL Server
- Oracle
非关系型数据库
关系型数据库的最大优点就是事务的一致性,这个特性,使得关系型数据库中可以适用于一切要求一致性比较高的系统中。比如:银行系统。
但是在网页应用中,对这种一致性的要求不是那么的严格,允许有一定的时间间隔,所以关系型数据库这个特点不是那么的重要了。相反,关系型数据库为了维护一致性所付出的巨大代价就是读写性能比较差。而像微博、facebook这类应用,对于并发读写能力要求极高,关系型数据库已经无法应付。所以必须用一种新的数据结构存储来替代关系型数据库。所以非关系型数据库应用而生。
常见的非关系型数据库有:
- MongoDB
- Cassandra
- Redis
数据模式
跟数据模型很像的一个名词 – 数据模式。数据模式是以一定的数据模型对一个单位的类型、结构、及其相互间的关系所进行的描述。
数据的抽象级别:
- Physical Schema 物理模式 — 文件存储结构,描述了数据在磁盘上是怎么存的。数据库是建立在文件之上的。这些数据保存的特定格式和方式
- Conceptual Schema 概念模式 — 在关系数据库、关系数据模型里面,表的数量、类型、长度、结构和逻辑,表和表之间的关系。在该概念模型,表称为基表。
- View1,View2,View3 视图模型 — 用户所能看到的模式
三级模式之间都存在映射,CS与PS之间是存储方式的映射,CS与View之间是运算方式的映射。