1.SQL 思考:
A) BETWEEN AND 对比 <= and >=
between and 等价<=和>=,属于闭环区间,也包括边界的比较值,即要注意的是between and是有等于的,between and 等价<=和>=在查询效率上等同,没有区别; 但是< >等符号,可以根据具体需求来具体定义,若想都包含就再加一个等于号=,若想只包含一头,那么在想包含的那头加上一个等于号=,若都不想包含则不用加等于号
B) ORDER BY 执行时机
order by 经过过滤后得到结果集,对结果集进行排序。
C) ORDER BY 多列顺序对结果影响
如果有多列排序,第一个是优先排序,第二个则是在第一个排序的基础上对相同数值部分进行二次排序。而不是在第一个排序完了以后再全部重新排序。
2.现在都有那些数据库,每种数据库的区别、应用场景、优点是什么
eg: 关系型、文档型、内存型、分布式…
Mysql Oracle 达梦 Hbase…
关系型 Oracle 、MySql 、Microsoft SQL Server 、SQLite 、 PostgreSQL 、 IBM DB2
非关系型
- 键值数据库:Redis、Memcached、Riak
- 列族数据库:Bigtable、HBase、Cassandra
- 文档数据库:MongoDB、CouchDB、MarkLogic
- 图形数据库:Neo4j、InfoGrid
3.了解Mysql SQL解析器、存储结构、索引结构相关知识
**Mysql SQL解析器:**首先要对sql进行解析,内部将文本格式转换为二进制结构,这个转换就是解析器,解析的目的是为了让优化器更好的处理指令,以便以最优的路径,最少的耗时返回我们想要的结果。
**存储结构:**mysql索引的数据结构是树,常用的存储引擎innodb采用的是B+Tree。
Mysql的两个存储引擎(索引结构)是:
MyISAM:
1、不支持事物:没法回滚,崩溃后无法安全恢复
2、不支持聚簇索引(数据存储方式不同):数据不能保存在索引中,单独存储
3、不支持行锁:
4、select count(),不需要扫描整个表,数值直接获取
存储结构:
数据保存在连续的内存中,如果没有行号,还会隐式加上行号。
Inodb:
1、支持事物:崩溃后可以安全恢复
2、支持聚簇,只能有一个聚簇索引,一般是主键
3、支持行锁
4、select count(*) 要扫描整个表
存储结构:
数据是存储在主键索引里面的,记住,每个索引就是一个B-tree
索引结构:
目前MySQL使用的存储引擎时InnoDB引擎,该引擎所使用的索引由B+树实现。B+树是基于B树的一种变化而形成的,要了解B+树,我们先了解B树。
4.DML/DDL/DCL:基础用法掌握。
eg: 给用户A 添加数据库B 中 的 表C 的 查询权限,DCL语句该怎么写?
grant select on B.C to A;
SQL语言共分为四大类:数据查询语言DQL,数据操纵语言DML,
数据定义语言DDL,数据控制语言DCL。
1 数据查询语言DQL
数据查询语言DQL基本结构是由SELECT子句,FROM子句,WHERE
子句组成的查询块:
SELECT <字段名表>
FROM <表或视图名>
WHERE <查询条件>
2 数据操纵语言
数据操纵语言DML主要有三种形式:
- 插入:INSERT
- 更新:UPDATE
- 删除:DELETE
3 数据定义语言DDL
数据定义语言DDL用来创建数据库中的各种对象-----表、视图、
索引、同义词、聚簇等如:
CREATE TABLE/VIEW/INDEX/SYN/CLUSTER
| | | | |
表 视图 索引 同义词 簇
4 数据控制语言DCL
数据控制语言DCL用来授予或回收访问数据库的某种特权,并控制
数据库操纵事务发生的时间及效果,对数据库实行监视等。如:
- GRANT:授权。
- ROLLBACK [WORK] TO [SAVEPOINT]:回退到某一点。
回滚—ROLLBACK
回滚命令使数据库状态回到上次最后提交的状态。其格式为:
SQL>ROLLBACK; - COMMIT [WORK]:提交。
在数据库的插入、删除和修改操作时,只有当事务在提交到数据
库时才算完成。在事务提交前,只有操作数据库的这个人才能有权看
到所做的事情,别人只有在最后提交完成后才可以看到。
提交数据有三种类型:显式提交、隐式提交及自动提交。下面分
别说明这三种类型。
(1) 显式提交
用COMMIT命令直接完成的提交为显式提交。其格式为:
SQL>COMMIT;
(2) 隐式提交
用SQL命令间接完成的提交为隐式提交。这些命令是:
ALTER,AUDIT,COMMENT,CONNECT,CREATE,DISCONNECT,DROP,
EXIT,GRANT,NOAUDIT,QUIT,REVOKE,RENAME。
(3) 自动提交
若把AUTOCOMMIT设置为ON,则在插入、修改、删除语句执行后,
系统将自动进行提交,这就是自动提交。其格式为:
SQL>SET AUTOCOMMIT ON;
5.基础查询部分:
思考题:一条SQL查询语句是如何执行的
-
1、首先客户端发送请求到服务端,建立连接。
-
2、服务端先看下查询缓存是否命中,命中就直接返回,否则继续往下执行。
-
3、接着来到解析器,进行语法分析,一些系统关键字校验,校验语法是否合规(正确)。
-
4、然后优化器进行SQL优化,比如怎么选择索引之类,然后生成执行计划。
-
5、最后执行引擎调用存储引擎API查询数据,返回结果。
详细: sql语句:select user_id、username from t_user where username = "张三" and sex = 1 1、客户端发起查询请求,与连接器建立连接,连接器确定用户是否有查询权限,没有权限,直接返回错误信息,有执行下一步。 2、查询缓存(MySQL8.0 以前),以这条SQL语句为key在内存缓冲池中是否有结果,有直接返回结果,无则执行下一步。 3、分析器进行词法分析,提取出操作为select, 表名为 t_user, 查询字段为user_id、username,查询条件为username=“张三” 和 sex=1 ,把提取的Token转换为抽象语法树接下来判断这个 sql 语句是否有语法错误,比如关键词是否正确等等,如果检查没问题就执行下一步。 4、优化器列出可能的执行方案 a. 先查询t_user表中username=“张三”的学生,然后判断是否性别为男。 b. 先找出学生中性别是男的学生,然后再查询username为“张三”的学生。 接下来计算两个查询计划的成本,若username字段为索引,usrname和sex为联合索引、或查询条件可能致使索引失效,查询字段为*, 造成成全表扫描,都有可能影响执行方案的选择。 5、执行器进行权限校验,如果没有权限就会返回错误信息,如果有权限就执行器会调用数据库引擎接口,返回引擎的执行结果。 6、执行引擎根据执行计划查询数据,并把结果集返回客户端
问题:如果表 T 中没有字段 k,而你执行了这个语句 select * from T where k=1,
那肯定是会报“不存在这个列”的错误: “Unknown column ‘k’ in ‘where clause’”
这个错误是在上面提到的哪个阶段报出来的呢?
第三阶段