目录
一、数据库简介
1.1数据的时代
-
涉及的数据量大
-
数据不随程序的结束而消失
-
数据被多个应用程序共享
-
大数据
数据的分类
-
结构化的数据:即有固定格式和有限长度的数据。例如填的表格就是结构化的数据,国籍:中华人
民共和国,民族:汉,性别:男,这都叫结构化数据
-
非结构化的数据:非结构化的数据越来越多,就是不定长、无固定格式的数据,例如网页,有时候
非常长,有时候几句话就没了;例如语音,视频都是非结构化
的数据
-
半结构化数据:比如:XML或者HTML的格式的数据
1.2数据库的发展史
1.2.1 文件管理系统的缺点
-
编写应用程序不方便
-
数据冗余不可避免
-
应用程序依赖性
-
不支持对文件的并发访问
-
数据间联系弱
-
难以按用户视图表示数据
-
无安全控制功能
1.2.2 数据库系统发展阶段
-
萌芽阶段:文件系统
-
使用磁盘文件来存储数据
-
-
初级阶段:第一代数据库
-
出现了网状模型、层次模型的数据库
-
-
中级阶段:第二代数据库
-
关系型数据库和结构化查询语言
-
-
高级阶段:新一代数据库
-
“关系-对象”型数据库
-
1.3 DBMS 数据库管理系统
-
Database:数据库是数据的汇集,它以一定的组织形式存于存储介质上
-
DBMS:是管理数据库的系统软件,它实现数据库系统的各种功能。是数据库系统的核心
-
DBA:负责数据库的规划、设计、协调、维护和管理等工作
-
应用程序:指以数据库为基础的应用程序
1.4数据库管理系统的优点
-
相互关联的数据的集合
-
较少的数据冗余
-
程序与数据相互独立
-
保证数据的安全、可靠
-
最大限度地保证数据的正确性
-
数据可以并发使用并能同时保证一致性
1.5数据库管理系统的基本功能
-
数据定义
-
数据处理
-
数据安全
-
数据备份
1.6数据库系统的架构
-
单机架构
-
大型主机/终端架构
-
主从式架构(C/S)
-
分布式架构
1.7各种数据库管理系统
1.7.1 层次数据库
1.7.2 网状数据库
1.7.3 RDBMS 关系型数据库
Relational Database Management System,关系模型最初由IBM公司的英国计算机科学家埃德加·科德
(Edgar F. Codd)于1969年描述,1974年,IBM开始开发系统R,这是一个开发RDBMS原型的研究项目。
然而,第一个商业上可用的RDBMS是甲骨文,于1979年由关系软件(现为甲骨文公司)发布.
1.7.3.1 关系统型数据库相关概念
-
关系Relational :关系就是二维表,其中:表中的行、列次序并不重要
-
行row:表中的每一行,又称为一条记录record
-
列column:表中的每一列,称为属性,字段,域field
-
主键Primary key:PK , 用于惟一确定一个记录的字段,一张表只有一个主键
-
域domain:属性的取值范围,如,性别只能是'男'和'女'两个值,人类的年龄只能0-150
1.7.3.2 常用关系数据库
MySQL: MySQL, MariaDB, Percona Server
PostgreSQL: 简称为pgsql,EnterpriseDB
Oracle
MSSQL
DB2
表1:
ID | name | age | gender |
---|---|---|---|
表2
ID | 公司 | 薪资 |
---|---|---|
1.7.3.3 数据库排名
DB-Engines Ranking - popularity ranking of database management systems
1.8 关系型数据库理论
1.8.1 实体联系模型E-R
实体Entity:客观存在并可以相互区分的客观事物或抽象事件称为实体,在E-R图中用矩形框表示实
体,把实体名写在框内
属性:实体所具有的特征或性质
联系:联系是数据之间的关联集合,是客观存在的应用语义链
• 实体内部的联系:指组成实体的各属性之间的联系。如职工实体中,职工号和部门经理号之间
有一种关联关系
• 实体之间的联系:指不同实体之间联系。例:学生选课实体和学生基本信息实体之间
• 实体之间的联系用菱形框表示
1.8.2 联系类型
-
一对一联系(1:1)
-
一对多联系(1:n):外键
-
多对多联系(m:n):增加第三张表
1.8.3 数据的操作
-
数据提取:在数据集合中提取感兴趣的内容。SELECT
-
数据更新:变更数据库中的数据。INSERT、DELETE、UPDATE
1.8.4 数据库规划流程
-
收集数据,得到字段
-
收集必要且完整的数据项
-
转换成数据表的字段
二、关系型数据库和非关系型数据库
1)描述主流的数据库系统 关系型数据库: Mysql(Oracle公司) 、 SQL server(微软) 、access(微软公司office产品) Oracle 、DB2(IBM公司),sybase(sybase) 等等
2)关系型数据库和非关系型数据库的区别 关系数据库: 关系数据库结构是二维数据库表,二维表当中每个字段(列)用来描述对象的一个属性, 每个记录(行)用来描述一个对象的信息(完整信息),关系数据库写到哪里也就是存储在硬盘当中 读写系统就会受到的IO限制或者瓶颈
其他 关系型数据库最典型的数据结构是表,由二维表及其之间的联系所组成的一个数据组织 优点: 1、易于维护:都是使用表结构,格式一致; 2、使用方便:SQL语言通用,可用于复杂查询; 3、复杂操作:支持SQL,可用于一个表以及多个表之间非常复杂的查询。 缺点: 1、读写性能比较差,尤其是海量数据的高效率读写; 2、固定的表结构,灵活度稍欠; 3、高并发读写需求,传统关系型数据库来说,硬盘I/O是一个很大的瓶颈。
缓存加速软件 非关系型数据库(NoSQL): MongoDB 、 Redis(内存数据库/缓存数据库)K-V键值对、与之类似的Memcache,K-V键值对 redis-me