优化总结之sql优化(一)

一、SQL语句执行步骤

1、语法分析
2、语义分析
3、视图转换
4、表达式转换

5、选择优化器

6、选择连接方式

7、选择连接顺序

8、选择数据的搜索路径

9、运行“执行计划”

二、选用适合的Oracle优化器

RULE(基于规则)
COST(基于成本)

CHOOSE(选择性)

三、访问Table的方式

1、全表扫描 

全表扫描就是顺序地访问表中每条记录,ORACLE采用一次读入多个数据块(database block)的方式优化全表扫描

2、通过ROWID访问表

ROWID包含了表中记录的物理位置信息,ORACLE采用索引实现了数据和存放数据的物理位置(ROWID)之间的联系,通常索引提供了快速访问ROWID的方法,因此那些基于索引列的查询就可以得到性能上的提高

四、共享 SQL 语句

1、Oracle提供对执行过的SQL语句进行高速缓冲的机制。被解析过并且确定了执行路径的SQL语句存放在SGA的共享池中。

2、Oracle执行一个SQL语句之前每次先从SGA共享池中查找是否有缓冲的SQL语句,如果有则直接执行该SQL语句。

3、可以通过适当调整SGA共享池大小来达到提高Oracle执行性能的目的。

五、访问顺序

1、选择最有效率的表名顺序(1)

ORACLE的解析器按照从右到左的顺序处理FROM子句中的表名,因此FROM子句中写在最后的表(基础表 driving table)将被最先处理 

当ORACLE处理多个表时,会运用排序及合并的方式连接它们。首先,扫描第一个表(FROM子句中最后的那个表)并对记录进行派序,然后扫描第二个表(FROM子句中最后第二个表),最后将所有从第二个表中检索出的记录与第一个表中合适记录进行合并.


只在基于规则的优化器中有效

2、选择最有效率的表名顺序(2)

    表 TAB1 16,384 条记录

     表 TAB2 1      条记录

    选择TAB2作为基础表 (最好的方法)
     select count(*) from tab1,tab2   执行时间0.96秒
     
    选择TAB2作为基础表 (不佳的方法)

     select count(*) from tab2,tab1   执行时间26.09秒

3、选择最有效率的表名顺序(3)

如果有3个以上的表连接查询, 那就需要选择交叉表(intersection table)作为基础表, 交叉表是指那个被其他表所引用的表.

SELECT * FROM LOCATION L, CATEGORY C, EMP E 
WHERE E.EMP_NO BETWEEN 1000 AND 2000
     AND E.CAT_NO = C.CAT_NO
     AND E.LOCN = L.LOCN
将比下列SQL更有效率
SELECT * FROM EMP E, LOCATION L, CATEGORY C
WHERE E.CAT_NO = C.CAT_NO
     AND E.LOCN = L.LOCN

     AND E.EMP_NO BETWEEN 1000 AND 2000

4、Where子句中的连接顺序 (1)

Oracle采用自下而上的顺序解析WHERE子句。
根据这个原理,表之间的连接必须写在其他WHERE条件之前,那些可以过滤掉最大数量记录的条件必须写在WHERE子句的末尾。

5、Where子句中的连接顺序 (2)

(低效,执行时间156.3秒)
SELECT … 
  FROM EMP E
WHERE  SAL > 50000
     AND  JOB = ‘MANAGER’
     AND  25 < (SELECT COUNT(*) FROM EMP

                         WHERE MGR = E.EMPNO)

(高效,执行时间10.6秒)
SELECT … 
  FROM EMP E
WHERE 25 < (SELECT COUNT(*) FROM EMP
                        WHERE MGR=E.EMPNO)
     AND SAL > 50000

     AND JOB = ‘MANAGER’

六、SELECT子句中避免使用“*”

Oracle在解析SQL语句的时候,对于“*”将通过查询数据库字典来将其转换成对应的列名。

如果在Select子句中需要列出所有的Column时,建议列出所有的Column名称,而不是简单的用“*”来替代,这样可以减少多于的数据库查询开销。

七、减少访问数据库的次数

当执行每条SQL语句时, ORACLE在内部执行了许多工作: 
解析SQL语句
估算索引的利用率
绑定变量 

读数据块等等

由此可见, 减少访问数据库的次数 , 就能实际上减少ORACLE的工作量.

七.1、整合简单无关联的数据库访问

如果有几个简单的数据库查询语句,你可以把它们整合到一个查询中(即使它们之间没有关系),以减少多于的数据库IO开销

注意:虽然采取这种方法,效率得到提高,但是程序的可读性大大降低,所以还是要权衡之间的利弊 

八、使用Truncate而非Delete

Delete表中记录的时候,Oracle会在Rollback段中保存删除信息以备恢复。Truncate删除表中记录的时候不保存删除信息,不能恢复。因此Truncate删除记录比Delete快,而且占用资源少。


删除表中记录的时候,如果不需要恢复的情况之下应该尽量使用Truncate而不是Delete。


Truncate仅适用于删除全表的记录。

尽量多使用COMMIT

只要有可能,在程序中尽量多使用COMMIT, 这样程序的性能得到提高,需求也会因为COMMIT所释放的资源而减少。

COMMIT所释放的资源:
 回滚段上用于恢复数据的信息.
 被程序语句获得的锁
  redo log buffer 中的空间

  ORACLE为管理上述3种资源中的内部花费

计算记录条数

Select count(*) from tablename;

Select count(1) from tablename;

Select max(rownum) from tablename;

一般认为,在没有索引的情况之下,第一种方式最快。

如果有索引列,使用索引列当然最快。

用Where子句替换Having子句

避免使用HAVING子句,HAVING 只会在检索出所有记录之后才对结果集进行过滤。这个处理需要排序、总计等操作。 如果能通过WHERE子句限制记录的数目,就能减少这方面的开销。

使用表的别名(Alias)

当在SQL语句中连接多个表时, 请使用表的别名并把别名前缀于每个Column上.这样一来,就可以减少解析的时间并减少那些由Column歧义引起的语法错误

Column歧义指的是由于SQL中不同的表具有相同的Column名,当SQL语句中出现这个Column时,SQL解析器无法判断这个Column的归属 

用EXISTS替代IN(1)

在许多基于基础表的查询中,为了满足一个条件 ,往往需要对另一个表进行联接。在这种情况下,使用EXISTS(或NOT EXISTS)通常将提高查询的效率

用EXISTS替代IN(2)

低效:
SELECT * FROM EMP (基础表)
WHERE EMPNO > 0
      AND DEPTNO IN (SELECT DEPTNO 
                                      FROM DEPT 

                                   WHERE LOC = ‘MELB’)

高效:
SELECT * FROM EMP (基础表)
WHERE EMPNO > 0
     AND EXISTS (SELECT ‘X’ 
                              FROM DEPT 
                            WHERE DEPT.DEPTNO = EMP.DEPTNO

                                 AND LOC = ‘MELB’)

用NOT EXISTS替代NOT IN (1)

在子查询中,NOT IN子句将执行一个内部的排序和合并,对子查询中的表执行一个全表遍历,因此是非常低效的。


 为了避免使用NOT IN,可以把它改写成外连接(Outer Joins)或者NOT EXISTS。

用NOT EXISTS替代NOT IN (2)

低效:
SELECT …
  FROM EMP
WHERE DEPT_NO NOT IN (SELECT DEPT_NO 
                                                FROM DEPT 

                                              WHERE DEPT_CAT=’A’) 

高效:
SELECT ….
  FROM EMP E
WHERE NOT EXISTS (SELECT ‘X’ 
                                       FROM DEPT D
                                    WHERE D.DEPT_NO = E.DEPT_NO

                                         AND DEPT_CAT = ‘A’) 

用表连接替换EXISTS

通常来说 ,采用表连接的方式比EXISTS更有效率 。 

低效:
SELECT ENAME
   FROM EMP E
WHERE EXISTS (SELECT ‘X’ 
                                FROM DEPT
                              WHERE DEPT_NO = E.DEPT_NO

                                   AND DEPT_CAT = ‘A’)

高效:
SELECT ENAME
   FROM DEPT D,EMP E
WHERE E.DEPT_NO = D.DEPT_NO

     AND DEPT_CAT = ‘A’ 

用EXISTS替换DISTINCT (1)

当提交一个包含对多表信息(比如部门表和雇员表)的查询时,避免在SELECT子句中使用DISTINCT。 一般可以考虑用EXIST替换。

EXISTS 使查询更为迅速,因为RDBMS核心模块将在子查询的条件一旦满足后,立刻返回结果。

用EXISTS替换DISTINCT (2)

低效:
    SELECT DISTINCT DEPT_NO,DEPT_NAME
       FROM DEPT D,EMP E

    WHERE D.DEPT_NO = E.DEPT_NO

高效:
    SELECT DEPT_NO,DEPT_NAME
      FROM DEPT D
    WHERE EXISTS (SELECT ‘X’
                                    FROM EMP E

                                 WHERE E.DEPT_NO = D.DEPT_NO)

如何识别低效的SQL语句是我们sql调优的关键。

由于时间关系今天只写到这,持续更新优化总结之sql优化(二)

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值