转载一个小时学会MySQL数据库(1)

最新推荐文章于 2022-09-05 16:16:26 发布

Museions

最新推荐文章于 2022-09-05 16:16:26 发布

阅读量267

点赞数

分类专栏：大前端开发文章标签： mysql 数据库

大前端开发专栏收录该内容

157 篇文章 7 订阅

订阅专栏

一个小时学会MySQL数据库

随着移动互联网的结束与人工智能的到来大数据变成越来越重要，下一个成功者应该是拥有海量数据的，数据与数据库你应该知道。

一、数据库概要

数据库（Database）是存储与管理数据的软件系统，就像一个存入数据的物流仓库。

在商业领域，信息就意味着商机，取得信息的一个非常重要的途径就是对数据进行分析处理，这就催生了各种专业的数据管理软件，数据库就是其中的一种。当然，数据库管理系统也不是一下子就建立起来，它也是经过了不断的丰富和发展，才有了今天的模样。

1.1、发展历史

1.1.1、人工处理阶段

在20世纪50年代中期以前的计算机诞生初期，其处理能力很有限，只能够完成一些简单的运算，数据处理能力也很有限，这使得当时的计算机只能够用于科学和工程计算。计算机上没有专用的管理数据的软件，数据由计算机或处理它的程序自行携带。当数据的存储格式、读写路径或方法发生变化的时候，其处理程序也必须要做出相应的改变以保持程序的正确性。

1.1.2、文件系统

20世纪50年代后期到60年代中期，随着硬件和软件技术的发展，计算机不仅用于科学计算，还大量用于商业管理中。在这一时期，数据和程序在存储位置上已经完全分开，数据被单独组织成文件保存到外部存储设备上，这样数据文件就可以为多个不同的程序在不同的时间所使用。
虽然程序和数据在存储位置上分开了，而且操作系统也可以帮助我们对完成了数据的存储位置和存取路径的管理，但是程序设计仍然受到数据存储格式和方法的影响，不能够完全独立于数据，而且数据的冗余较大。

1.1.3、数据库管理系统

从20世纪70年代以来，计算机软硬件技术取得了飞跃式的发展，这一时期最主要的发展就是产生了真正意义上的数据库管理系统，它使得应用程序和数据之间真正的实现的接口统一、数据共享等，这样应用程序都可以按照统一的方式直接操作数据，也就是应用程序和数据都具有了高度的独立性。

1.2、常见数据库技术品牌、服务与架构

发展了这么多年市场上出现了许多的数据库系统，最强的个人认为是Oracle，当然还有许多如：DB2、Microsoft SQL Server、MySQL、SyBase等，下图列出常见数据库技术品牌、服务与架构。

1.3、数据库分类

数据库通常分为层次式数据库、网络式数据库和关系式数据库三种。

而不同的数据库是按不同的数据结构来联系和组织的。

而在当今的互联网中，最常见的数据库模型主要是两种，即关系型数据库和非关系型数据库。

1.3.1、关系型数据库

当前在成熟应用且服务与各种系统的主力数据库还是关系型数据库。

代表：Oracle、SQL Server、MySQL

1.3.2、非关系型数据库

随着时代的进步与发展的需要，非关系型数据库应运而生。

代表：Redis、Mongodb

NoSQL数据库在存储速度与灵活性方面有优势，也常用于缓存。

1.4、数据库规范化

经过一系列的步骤，我们现在终于将客户的需求转换为数据表并确立这些表之间的关系，那么是否我们现在就可以在开发中使用呢？答案否定的，为什么呢！同一个项目，很多人参与了需求的分析，数据库的设计，不同的人具有不同的想法，不同的部门具有不同的业务需求，我们以此设计的数据库将不可避免的包含大量相同的数据，在结构上也有可能产生冲突，在开发中造成不便。

1.4.1. 什么是范式

要设计规范化的数据库，就要求我们根据数据库设计范式――也就是数据库设计的规范原则来做。范式可以指导我们更好地设计数据库的表结构，减少冗余的数据，借此可以提高数据库的存储效率，数据完整性和可扩展性。

设计关系数据库时，遵从不同的规范要求，设计出合理的关系型数据库，这些不同的规范要求被称为不同的范式，各种范式呈递次规范，越高的范式数据库冗余越小。目前关系数据库有六种范式：第一范式（1NF）、第二范式（2NF）、第三范式（3NF）、巴德斯科范式（BCNF）、第四范式(4NF）和第五范式（5NF，又称完美范式）。满足最低要求的范式是第一范式（1NF）。在第一范式的基础上进一步满足更多规范要求的称为第二范式（2NF），其余范式以次类推。一般说来，数据库只需满足第三范式(3NF）就行了。

1.4.2. 三大范式

第一范式（1NF）

所谓第一范式（1NF）是指在关系模型中，对列添加的一个规范要求，所有的列都应该是原子性的，即数据库表的每一列都是不可分割的原子数据项，而不能是集合，数组，记录等非原子数据项。即实体中的某个属性有多个值时，必须拆分为不同的属性。在符合第一范式（1NF）表中的每个域值只能是实体的一个属性或一个属性的一部分。简而言之，第一范式就是无重复的域。

例如:表1-1中，其中”工程地址”列还可以细分为省份，城市等。在国外，更多的程序把”姓名”列也分成2列,即”姓”和“名”。

虽然第一范式要求各列要保存原子性，不能再分，但是这种要求和我们的需求是相关联的，如上表中我们对”工程地址”没有省份，城市这样方面的查询和应用需求，则不需拆分，”姓名”列也是同样如此。

表1-1 原始表

工程号	工程名称	工程地址	员工编号	员工名称	薪资待遇	职务
P001	港珠澳大桥	广东珠海	E0001	Jack	6000/月	工人
P001	港珠澳大桥	广东珠海	E0002	Join	7800/月	工人
P001	港珠澳大桥	广东珠海	E0003	Apple	8000/月	高级技工
P002	南海航天	海南三亚	E0001	Jack	5000/月	工人

第二范式（2NF）

在1NF的基础上，非Key属性必须完全依赖于主键。第二范式（2NF）是在第一范式（1NF）的基础上建立起来的，即满足第二范式（2NF）必须先满足第一范式（1NF）。第二范式（2NF）要求数据库表中的每个实例或记录必须可以被唯一地区分。选取一个能区分每个实体的属性或属性组，作为实体的唯一标识。

第二范式（2NF）要求实体的属性完全依赖于主关键字。所谓完全依赖是指不能存在仅依赖主关键字一部分的属性，如果存在，那么这个属性和主关键字的这一部分应该分离出来形成一个新的实体，新实体与原实体之间是一对多的关系。为实现区分通常需要为表加上一个列，以存储各个实例的唯一标识。简而言之，第二范式就是在第一范式的基础上属性完全依赖于主键。

例如:表1-1中，一个表描述了工程信息，员工信息等。这样就造成了大量数据的重复。按照第二范式，我们可以将表1-1拆分成表1-2和表1-3：

l 工程信息表：（工程编号，工程名称，工程地址）：

表1-2 工程信息表

工程编号	工程名称	工程地址
P001	港珠澳大桥	广东珠海
P002	南海航天	海南三亚

l 员工信息表（员工编号，员工名称，职务，薪资水平）：

表1-3 员工信息表

员工编号	员工姓名	职务	薪资水平
E0001	Jack	工人	3000/月
E0002	Join	工人	3000/月
E0003	Apple	高级技工	6000/月

这样，表1-1就变成了两张表，每个表只描述一件事，清晰明了。

第三范式（3NF）

第三范式是在第二范式基础上，更进一层，第三范式的目标就是确保表中各列与主键列直接相关，而不是间接相关。即各列与主键列都是一种直接依赖关系，则满足第三范式。

第三范式要求各列与主键列直接相关，我们可以这样理解，假设张三是李四的兵，王五则是张三的兵，这时王五是不是李四的兵呢?从这个关系中我们可以看出，王五也是李四的兵，因为王五依赖于张三，而张三是李四的兵，所以王五也是。这中间就存在一种间接依赖的关系而非我们第三范式中强调的直接依赖。

现在我们来看看在第二范式的讲解中，我们将表1-1拆分成了两张表。这两个表是否符合第三范式呢。在员工信息表中包含：”员工编号”、”员工名称”、”职务”、”薪资水平”，而我们知道，薪资水平是有职务决定，这里”薪资水平”通过”职务”与员工相关，则不符合第三范式。我们需要将员工信息表进一步拆分，如下:

l 员工信息表：员工编号，员工名称，职务

l 职务表：职务编号，职务名称，薪资水平

现在我们已经了解了数据库规范化设计的三大范式，下面我们再来看看对表1-1优化后的数据表：

员工信息表(Employee)

员工编号	员工姓名	职务编号
E0001	Jack	1
E0002	Join	1
E0003	Apple	2

工程信息表(ProjectInfo)

工程编号	工程名称	工程地址
P001	港珠澳大桥	广东珠海
P002	南海航天	海南三亚

职务表(Duty)

职务编号	职务名称	工资待遇
1	工人	3000/月
2	高级技工	6000/月

工程参与人员记录表（Project_ Employee_info）

编号	工程编号	人员编号
1	P001	E0001
2	P001	E0002
3	P002	E0003

通过对比我们发现，表多了，关系复杂了，查询数据变的麻烦了，编程中的难度也提高了，但是各个表中内容更清晰了，重复的数据少了，更新和维护变的更容易了，哪么如何平衡这种矛盾呢？

1.4.3. 范式与效率

在我们设计数据库时，设计人员、客户、开发人员通常对数据库的设计有一定的矛盾，客户更喜欢方便，清晰的结果，开发人员也希望数据库关系比较简单，降低开发难度，而设计人员则需要应用三大范式对数据库进行严格规范化，减少数据冗余，提高数据库可维护性和扩展性。由此可以看出，为了满足三大范式，我们数据库设计将会与客户、开发人员产生分歧，所以在实际的数据库设计中，我们不能一味的追求规范化，既要考虑三大范式，减少数据冗余和各种数据库操作异常，又要充分考虑到数据库的性能问题，允许适当的数据库冗余。

二、MySQL介绍

2.1、MySQL概要

MySQL是一个关系型数据库管理系统，由瑞典MySQL AB 公司开发，目前属于 Oracle 旗下产品。MySQL 是最流行的关系型数据库管理系统之一，在 WEB 应用方面，MySQL是最好的 RDBMS (Relational Database Management System，关系数据库管理系统) 应用软件之一。

MySQL是一种关系数据库管理系统，关系数据库将数据保存在不同的表中，而不是将所有数据放在一个大仓库内，这样就增加了速度并提高了灵活性。
MySQL所使用的 SQL 语言是用于访问数据库的最常用标准化语言。MySQL 软件采用了双授权政策，分为社区版和商业版，由于其体积小、速度快、总体拥有成本低，尤其是开放源码这一特点，一般中小型网站的开发都选择 MySQL 作为网站数据库。