一、数据库分类

说明:mysql 适合中小企业,开源、灵活、具有代表性;DB2、oracle适合大型企业;达梦数据库属于国内


二、文件系统管理数据存在的问题

1. 数据的冗余性和不一致性

如果没有数据库,那么所有的服务器都需要存一份数据;而且每一份数据需实时一致

2. 数据访问

数据会越来越大,如果没有数据库,搜索数据缓慢

3. 数据相对独立

不同类型的文件,保存格式不同,如果拷贝给第三方,需要对应的应用程序

4. 完整性和原子性问题

存储文件时突然中断,会导致损失

5. 并发访问异常问题

2个用户同时访问一个文件,删掉前十行,另一个客户访问时,给不给他看

6.  安全性问题

设置文件被哪些用户访问,访问某些行,文件中的一部分,读写执行做不到


数据库,指的是以一定方式存储在一起、能为多个用户共享、具有尽可能小的冗余度的特点、是与应用程序彼此独立的数据集合,实现:

  • 数据共享

  • 减少数据的冗余度

  • 数据实现集中控制

  • 数据的一致性

  • 故障恢复


三、模型

1. 层次模型:也是树状模型;缺点:随着数据量的增多,会出现大量的数量冗余


2. 网状模型:解决了树状模型的数据冗余,缺点:网络太多,不便于维护


3. 关系模型:使用行和列作为基础,建立关系表,被广泛采用

说明:由于关系模型的出现,原来的数据库管理系统DBMS,衍生成关系数据库管理系统RDBMS,行业也默认将两者划成等号(实际为子系统):DBMS=RDBMS


4. E-R模型:ERM概念,实体关系建模(创建数据库的思路和步骤)

联系:一个或多个实体之间的关系

属性:实体的某一特性


四、操作数据库

1. sql语句

数据操作语言(DML):用于操作数据库对象中包含的数据。例如insert,update,delete

数据定义语言(DDL):用户定义和管理数据对象,包括数据库,表等。例如create,drop,alter

数据查询语言(DQL):用于查询数据库对象中包含的数据。例如select

数据控制语言(DCL):用于管理数据库的语言,包括管理权限以及数据更改。例如grant,revoke


2. 逻辑关系

文件系统的逻辑关系:

上层   :文件系统中的数据,文件

底层   :硬盘中的数据块

中间层:文件系统,将数据块以文件形式呈现


数据库的逻辑关系:

上层   :数据表

底层   :文件,相当于文件系统的上层

中间层:能够将文件逻辑成表的组件,即存储引擎,如MyISAM,InnoDB, Memory......


3. 存储引擎

说明:  Mysql支持多种存储引擎,可以根据需要灵活的选择不同的存储引擎; 而ORACLE只支持一种存储引擎,这也是mysql流行的原因之一


MyISAM最早的存储引擎,Mysql默认引擎,查询速度较快,而5.5版本以上默认为InnoDB;


缺点:

a. 不支持事务:事务,即一段sql语句的批处理,且具有原子性(要么所有语句都执行成功,要么都失败)


b. 不支持行级锁:行级锁(冲突少,但是速度慢,锁多行则需要执行多条命令),只有InnoDB支持,即锁定表中的某一行,不允许修改,同一个表中的其他行可以修改;支持表级锁(锁表速度快,但时冲突也比较多),锁定时,所有用户可以写入或者只能进行读取,不能修改;页级锁(行级锁和表级别锁折中,即锁定相邻的几行,不能跳跃),DBD存储引擎才支持


c. 不支持外键约束:域约束,即在某个位置只允许某种类型的数据限制;但是如果新建的数据符合类型,只是在对应的关系表中,没有该值定义,也不允许新建该条数据,即外键约束。主键约束、唯一性约束、检查性约束.......


InnoDB 对MyISAM的补充的一种存储引擎

Memory基于内存的存储引擎,速度快,但是不能永久保存数据,需要和MyISAM或InnoDB结合起来使用,比较特殊


五、数据库结构

1. 存储管理器

  权限以及完整性管理器组件:授予哪个客户什么权限,去执行

  事务管理器组件:一个批处理文件中的所有命令,要么全部成功,要么全部失败

  文件管理器组件:将文件和表建立起对应关系

  缓冲区管理器组件:表表较大时,缓冲表中哪部分数据


2. 查询管理器

说明:接收、理解、提交请求,给存储管理器

查询执行引擎:将理解的请求提交给存储管理器


用户请求(应用程序、管理员手动执行sql命令、第三方API接口访问、第三方工具phpmyadmin图形化访问,监听在同一个套接字上)->查询管理器->存储管理器->本地磁盘


六、数据库工作模式

说明:采用单进程多线程模式;每一个线程负责一个用户的连接

守护线程:后台默认运行,不需要跟用户进行交互的进程,比如处理完请求,从缓存中拿出数据写进存储设备

应用线程:用户连接时分配给用户,用户断开时撤销的进程


七、数据库性能优化

1. 增加缓存机制,提高用户访问速度

2. 线程重用,当用户断开访问时,不断开线程,而是把线程给其他用户使用(因为在断开、建立线程时,会消耗系统资源)

3. 结合硬件和系统的兼容性,增加内存


八、数据库短板

      SMP 对称多处理结构,一个查询语句请求只能由一个cpu来处理(框架写死了),其他cpu只能围观;如果同时有16个查询语句请求,则可以由16个cpul来处理;一般用户小企业,但是诸如淘宝之类大公司也在使用,因为用到了解决短板对应的技术,如集群、读写分离、分区分表等