数据库编程(1):SQL基础篇 一

一、主流DBMS

1、数据库基础概念

        DB (DataBase ): 数据库,是存储数据的集合,也可理解为多个数据表。

        DBMS(DataBase Management System):数据库管理系统,是位于用户与操作系统之间的一层数据管理软件,可以对多个数据库进行管理。和操作系统一样是计算机的基础软件。

        DBS(DataBase System):数据库系统。可理解为DBS = DBMS + DB + DBA(数据库管理员) + 应用程序。

2、主流DBMS及其数据库模式

        下图是2019年5月DB-Engines公布的DBMS排名:

图1
图1

        其中可以看出,关系型数据库是DBMS的主流。下面对各个数据库模式概念进行说明。

(1)关系型数据库

        建立在关系模型上,SQL就是关系数据库的查询语言。

(2)键值型数据库

        通过Key-Value键值的方式来存储数据,其中Key和Value可以是简单和复杂的对象。Key是唯一标识符,Redis是最流行的键值型数据库。

        优点:查找速度明显优于关系型数据库。

        缺点:无法像关系型数据库一样自由使用条件过滤(比如WHERE),如果不知道去哪里找数据的时候就要遍历所有数据。键值型数据库典型的使用场景是作为内容缓存。

(3)文档型数据库

        专门用来管理文档,文档是处理信息的基本单位,一个文档相当于一条记录,MongoDB是最流行的文档型数据库。

(4)搜索引擎

        通常指的是收集了万维网上几千万到几十亿个网页并对网页中的每一个词(即关键词)进行索引,建立索引数据库的全文搜索引擎

是数据库检索的重要应用。而关系型数据库针对全文索引的效率较低。全文索引的核心原理是“倒排索引”(什么是倒排索引?

(5)列式数据库

        是相对于行式存储的数据库,将数据按照列存储到数据库中,这样做的好处是可以大量降低系统的I/O(因为一列都是相同数据类型,方便压缩),适用于分布式系统,不足在于功能相对有限。代表是HBase。(什么是列式数据库?

(6)图形数据库

        利用了图这种数据结构存储了实体(对象)之间的关系。最典型的例子就是社交网络中人与人的关系,数据模型主要是以结点和编来实现的,特点在于能高效地解决复杂的关系问题。

3.SQL阵营中的主流DBMS

(1)Oracle

        1979年,Oracle2诞生,它是第一个商用的RDBMS(关系型DBMS),后来越来越火,其性能和安全性最好,也最贵,适用于大型跨国企业。

(2)MySQL

        是1995年诞生的开源数据库管理系统,因为免费开源的特性,用户量迅速增长。但后面先后被SUN和Oracle公司收购,MySQL创造者担心其有闭源的风险,因此创建了MySQL的分支项目MariaDB,后者大部分情况下都是与MySQL兼容,并且增加了许多新的特性,比如支持更多的存储引擎类型。因此许多企业纷纷转向了MariaDB。

(3)SQL Server

        是1989年微软开发的商业数据库,受到了许多互联网公司,尤其是创业公司的青睐。

 

 

二、SQL在主流DBMS中的执行过程

1、Oracle中的SQL是如何执行的

        以下是整体流程图:

图2
图2
  • 六步骤

    (1)语法检查

        检查SQL拼写是否正确,如果不正确,Oracle会报语法错误。

    (2)语义检查

        检查SQL中的访问对象是否存在。比如SELECT的列名错误,系统就会报错。语法检查和语义检查的作用是保证SQL语句没有错误

    (3)权限检查

        看用户是否有访问该数据的权限。

    (4)共享池检查

        共享池是一块内存池,最主要的作用是缓存SQL语句和该语句的执行计划。Oracle通过检查共享池是否存在SQL语句的执行计划,来判断是软解析还是硬解析

        软解析:在共享池中,Oracle首先对SQL语句进行Hash运算,然后根据Hash值在库缓存中查找,如果存在SQL的执行计划,就直接拿来执行,直接进入“执行器”的环节,这就是软解析。

        硬解析:如果没有找到SQL语句和执行计划,Oracle就需要创建解析树进行解析,生成执行计划,进入“优化器”这个步骤,这就是硬解析。

    (5)优化器

        优化器就是要进行硬解析,也就是决定怎么做,比如创建解析树,生成执行计划。

    (6)执行器

        当有了解析树和执行计划之后,就知道SQL该怎么被执行了,这样就可以在执行器中执行语句了。

 

        共享池是Oracle中的术语,包括了库缓存、数据字典缓冲区等。上文也提到了库缓存,它主要缓存SQL语句和执行计划。而数据字典缓冲区存储的是Oracle中的对象定义,比如表、视图、索引等对象。当对SQL语句进行解析的时候,如果需要相关的数据,会从数据字典缓冲区中提取。

        库缓存这一步骤决定了SQL语句是否需要硬解析,而硬解析生成解析树是很消耗资源的,因此应该尽量避免硬解析。在Oracle中,绑定变量是它的一大特色。绑定变量就是在SQL语句中使用变量,通过不同的变量取值来改变SQL的执行结果。这样做的好处是,提升软解析的可能性,坏处是可能会导致生成的执行计划不够优化,因此是否绑定变量应视情况而定。

        举个例子:

正常:

        select * from player where player_id = 10001;

        select * from player where player_id = 10002;

绑定变量:

        select * from player where player_id = :player_id;

        第一个每次都要硬解析,因为在计算机看来属于两个完全不同的SQL语句。第二个只需要硬解析一次,因为用了变量名作为赋值,所以虽然值可能变了,但是语句看上去是一样的。当然,使用动态变量也有缺点,因为参数不同,会导致SQL的执行效率不同,同时SQL优化也会比较困难。

2、MySQL中的SQL是如何执行的

        MySQL是典型的C/S架构,即Client/Server架构,服务端程序使用的mysqld。整体MySQL流程如下图所示:

图3

        可以看到MySQL由三层组成:

        1.连接层:客户端和服务器端建立连接,客户端发送SQL至服务器端;

        2.SQL层:对SQL语句进行查询处理;

        3. 存储引擎层:与数据库文件打交道,负责数据的存储和读取。

        由于有存储引擎层,所以SQL层与数据库文件的存储方式无关,下面来看下SQL层的结构:

图4

        1.查询缓存:Server如果在查询缓存时发现了该SQL语句,将直接把结果返回给客户端;如果没有就进入到解析器阶段。但由于查询 缓存往往效率不高,所以在MySQL8.0之后就抛弃了这个功能。

        2.解析器:在解析器中对SQL语句进行语法分析,语义分析。

        3.优化器:在优化器中会确定SQL语句的执行路径,比如是根据全表来检索,还是根据索引来检索等。

        4.执行器:在执行之前需要判断该用户是否具备权限,如果具备权限就执行SQL查询并返回结果。在MySQL8.0以下的版本,如果设置了查询缓存,这时会将查询结果进行缓存。

        因此可以看到SQL语句在MySQL中的流程是:SQL语句→缓存查询→解析器→优化器→执行器。这一部分中,MySQL和Oracle执行SQL的原理是一样的。

        与Oracle不同的是,MySQL的存储引擎采用了插件的形式,每个存储引擎都面向一种特定的数据库应用环境。同时开源的MySQL还允许开发人员设置自己的存储引擎,下面是一些常用的存储引擎。

        1.InnoDB存储引擎:它是MySQL5.5版本之后默认的存储引擎,最大的特点是支持事务、行级锁定、外键约束等。

        2.MyISAM存储引擎:在MySQL5.5版本之前是默认的存储引擎,不支持事务、不支持外键,最大的特点是速度快,占用资源少。

       (读为主的数据表用MyISAM)。

        3.Memory存储引擎:使用系统内存作为存储介质,以便得到更快的响应速度。不过如果mysqld进程崩溃,则会导致所有的数据丢失,因此我们只有当数据是临时的情况下才使用Memory存储引擎

        4.NDB存储引擎:也叫做NDB Cluster存储引擎,主要用于MySQL Cluster分布式集群环境,类似于Oracle的RAC集群。

        5.Archive存储引擎:它有很好的压缩机制,用于文件归档,在请求写入时会进行压缩,所以也经常用来做仓库

        需要注意的是,数据库的设计在于表的设计,而在MySQL中每个表的设计都可以采用不同的存储引擎,我们可以根据需要选择存储引擎,这也正是MySQL的强大之处。

        当然完整的Oracle和MySQL结构图要复杂得多,但它们最核心的部分——SQL的执行原理是大同小异的。既然一条SQL语句会经历不同的模块,那么我们来看下,在不同的模块中,SQL执行所使用的资源(时间)是怎样的。

        首先,我们需要看下profiling是否开启,开启它可以让MySQL收集在SQL执行时所使用的资源情况。

mysql> select @@profiling;

profiling=0表示关闭,我们需要把profiling打开,即设置为1:

mysql> set profiling=1;

然后我们执行一个SQL查询:

mysql> select * from wucai.heros;

查看当前会话产生的所有profiles:

mysql> show profiles;

查看上一次查询的具体每一步执行时间,可以使用:

mysql> show profile;

图5

当然也可以指定查询某个指定的profile通过Query ID,比如:

mysql> show profile for query 2;

三、参考文献

1.陈旸,极客时间《SQL必知必会》1-3讲

2.Oracle 绑定变量详解

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 在Python中创建数据库需要使用数据库管理系统(DBMS)和相应的Python数据库API。常用的DBMSMySQL、PostgreSQLSQLite等。在Python中,我们可以使用MySQLdb、psycopg2、sqlite3等模块来连接和操作这些数据库。 具体创建数据库的步骤如下: 1. 导入相应的数据库API模块。 2. 连接数据库,获取数据库连接对象。 3. 创建游标对象,用于执行SQL语句。 4. 执行SQL语句,创建数据库。 5. 关闭游标和数据库连接。 例如,在Python中使用MySQLdb模块创建一个名为test的数据库的代码如下: ``` import MySQLdb # 连接数据库 conn = MySQLdb.connect(host='localhost', user='root', passwd='123456') # 创建游标对象 cursor = conn.cursor() # 执行SQL语句,创建数据库 cursor.execute('CREATE DATABASE test') # 关闭游标和数据库连接 cursor.close() conn.close() ``` 需要注意的是,在执行SQL语句时,需要使用游标对象的execute()方法。另外,创建数据库时需要有足够的权限,否则会报错。 ### 回答2: Python是一种高级编程语言,它被广泛用于编写各种类型的应用程序。在Python编程语言中,我们也可以使用数据库来存储和管理数据。在本文章中,我们将学习如何使用Python编程语言来创建一个数据库。 在Python编程中,我们可以使用各种第三方模块来连接和管理数据库,例如MySQLdb、psycopg2等等。这些模块提供了与MySQL、PostgreSQL数据库软件交互所需的API。但是在本文章中,我们将使用Python标准库中的sqlite3模块来创建和管理SQLite数据库SQLite数据库是一种轻量级的关系型数据库管理系统,它适用于一些小型的应用程序,例如桌面应用程序或移动应用程序。使用SQLite数据库也非常容易,因为它适用于大多数操作系统和编程语言。 在Python编程中,我们可以通过以下几个步骤来创建一个SQLite数据库: 1. 导入sqlite3模块 首先,我们需要使用Python的import语句来导入sqlite3模块,并创建一个与数据库的连接: ```python import sqlite3 conn = sqlite3.connect('example.db') ``` 在以上代码中,我们创建了一个连接到名为“example.db”的SQLite数据库的连接。如果该数据库文件不存在,则该语句将会创建一个新的数据库文件。 2. 创建游标 在SQLite数据库中,我们需要创建一个游标对象来执行SQL语句。我们可以使用连接对象的cursor()方法来创建一个游标: ```python c = conn.cursor() ``` 现在我们可以使用该游标执行SQL语句了。 3. 执行创建表的SQL语句 我们可以使用游标对象的execute()方法来执行任意的SQL语句。下面是一个用于创建一个名为“users”的表格的SQL语句的示例: ```python c.execute('''CREATE TABLE users (id INTEGER PRIMARY KEY, name TEXT, age INTEGER)''') ``` 以上SQL语句将创建一个名为“users”的表格,该表格将包括一个名为“id”的整数类型主键,一个名为“name”的文本类型列和一个名为“age”的整数类型列。 4. 提交更改 我们可以使用连接对象的commit()方法来应用对数据库的更改: ```python conn.commit() ``` 5. 关闭数据库连接 最后,我们应该关闭与数据库的连接对象,以确保所有缓冲数据都已经写入文件: ```python conn.close() ``` 现在,我们已经完成了创建一个SQLite数据库的所有步骤。在其中,我们使用了Python标准库中的sqlite3模块来创建连接和执行SQL语句。如果您想要深入了解SQLite数据库的API,那么我们建议您参考sqlite3模块的官方文档。 ### 回答3: 在Python数据库编程中,创建数据库基础中的基础数据库是一种用于组织、存储和管理数据的技术。在许多应用程序中,数据库是必不可少的,例如网站、电子商务平台和企业解决方案等。Python有着丰富的数据库接口和驱动程序,可以支持多种类型的数据库,例如MySQLSQLite、PostgreSQL等。 要进行数据库编程,首先需要在Python中安装所需的数据库模块。例如,如果要使用MySQL数据库,则需要安装Python的mysql-connector库。在安装好要使用的库之后,我们可以使用Python连接到数据库,并创建新的数据库。 在Python中,创建一个新的数据库非常简单。这里我们以MySQL数据库为例,步骤如下: 1. 导入MySQL库 ``` import mysql.connector ``` 2. 连接到MySQL数据库 ``` mydb = mysql.connector.connect( host="localhost", user="yourusername", password="yourpassword" ) ``` 这里的`host`参数是数据库所在的主机名或IP地址,`yourusername`和`yourpassword`分别是连接数据库所用的用户名和密码。如果连接成功,`mydb`对象将包含一个对数据库的连接。 3. 创建一个新的数据库MySQL中,可以使用`CREATE DATABASE`命令创建一个新的数据库。我们可以使用`mycursor`对象来执行任何SQL语句。例如,创建一个名为`mydatabase`的新数据库,可以使用以下代码: ``` mycursor = mydb.cursor() mycursor.execute("CREATE DATABASE mydatabase") ``` 这将创建一个名为`mydatabase`的新数据库。 当创建数据库时,需要注意一些细节。例如,确保数据库的名称唯一。另外,不要在代码中硬编码数据库连接凭据,而是应该将它们存储在安全的位置或使用环境变量。最后,应该避免使用模糊或不当的数据库命名,以免造成混淆和错误。 在了解了创建数据库的基本方法之后,可以进一步学习如何使用Python与数据库交互。这将包括查询、插入、更新和删除数据等操作,这些操作都是执行数据库应用程序的关键组件。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值