Oracle SQL性能优化
造成SQL语句性能不佳大致有两个原因:
开发人员只关注查询结果的正确性,忽视查询语句的效率,比如使用表的别名、避免使用“*”等。
开发人员对SQL语句执行原理、影响SQL执行效率的主要因素不清楚。
* 前者可以通过深入学习SQL语法及各种SQL调优技巧进行解决。
SQL调优是一个系统工程,熟悉SQL语法、掌握各种内嵌函数、分
析函数的用法只是编写高效SQL的必要条件。
* 后者从分析SQL语句执行原理入手,最直接的工具就是通过执行计划,
通过执行计划可以看到SQL 的执行路径,逻辑读,物理读等信息,
通过这些信息,可以帮助我们判断SQL 是否还有优化的余地。
SQL 编写的注意事项
1、选择最有效率的表名顺序
ORACLE的解析器按照从右到左的顺序处理FROM子句中的表名,因此FROM子句中写在最后的表(基础表 driving table)将被最先处理。当ORACLE处理多个表时,会运用排序及合并的方式连接它们。首先,扫描第一个表(FROM子句中最后的那个表)并对记录进行派序,然后扫描第二个表(FROM子句中最后第二个表),最后将所有从第二个表中检索出的记录与第一个表中合适记录进行合并。
只在基于规则的优化器中有效。
举例:
表 TAB1 16,384 条记录
表 TAB2 1 条记录
/*选择TAB2作为基础表 (高效的语句)*/
select count(*) from tab1,tab2
/*选择TAB2作为基础表 (低效的语句)*/
select count(*) from tab2,tab1
如果有3个以上的表连接查询, 那就需要选择交叉表(intersection table)作为基础表, 交叉表是指那个被其他表所引用的表。
SELECT * FROM
LOCATION L, CATEGORY C, EMP E
WHERE
E.EMP_NO BETWEEN 1000 AND 2000
AND E.CAT_NO = C.CAT_NO
AND E.LOCN = L.LOCN
将比下列SQL更有效率
SELECT * FROM
EMP E, LOCATION L, CATEGORY C
WHERE E.CAT_NO = C.CAT_NO
AND E.LOCN = L.LOCN
AND E.EMP_NO BETWEEN 1000 AND 2000
2、 where子句中的连接顺序
Oracle采用自下而上的顺序解析WHERE子句。 根据这个原理,表之间的连接必须写在其他WHERE条件之前,那些可以过滤掉最大数量记录的条件必须写在WHERE子句的末尾。
/*低效的语句*/
SELECT E.ENAME
FROM EMP E
WHERE SAL > 3000
AND JOB = ‘MANAGER’
AND 25 < (SELECT COUNT(*) FROM EMP
WHERE MGR = E.EMPNO);
/*高效的语句*/
SELECT E.ENAME
FROM EMP E
WHERE 25 < (SELECT COUNT(*) FROM EMP
WHERE MGR=E.EMPNO)
AND SAL > 3000
AND JOB = ‘MANAGER’;
3、 SELECT子句中避免使用“*”
·Oracle在解析SQL语句的时候,对于“*”将通过查询数据库字典来将其转换成对应的列名。
·如果在Select子句中需要列出所有的Column时,建议列出所有的Column名称,而不是简单的用“*”来替代,这样可以减少多于的数据库查询开销。
4、使用Truncate而非Delete
·Delete表中记录的时候,Oracle会在rollback段中保存删除信息以备恢复。
Truncate删除表中记录的时候不保存删除信息,不能恢复。因此Truncate删除记录比Delete快,而且占用资源少。
·删除表中记录的时候,如果不需要恢复的情况之下应该尽量使用Truncate而不是Delete。
·Truncate仅适用于删除全表的记录。
5、 尽量多使用COMMIT
只要有可能,在程序中尽量多使用COMMIT, 这样程序的性能得到提高,需求也会因为COMMIT所释放的资源而减少。
COMMIT所释放的资源:
·回滚段上用于恢复数据的信息.
·被程序语句获得的锁
·redo log buffer 中的空间
·ORACLE为管理上述3种资源中的内部花费
6、 计算记录条数
Select count(*) from tablename;
Select count(1) from tablename;
Select max(rownum) from tablename;
一般认为,在没有索引的情况之下,第一种方式最快。 如果有索引列,使用索引列当然最快。
7、 用Where子句替换Having子句
避免使用HAVING子句,HAVING 只会在检索出所有记录之后才对结果集进行过滤。这个处理需要排序、总计等操作。 如果能通过WHERE子句限制记录的数目,就能减少这方面的开销。
8、使用表的别名(Alias)
当在SQL语句中连接多个表时, 请使用表的别名并把别名前缀于每个Column上.这样一来,就可以减少解析的时间并减少那些由Column歧义引起的语法错误。
Column歧义指的是由于SQL中不同的表具有相同的Column名,当SQL语句中出现这个Column时,SQL解析器无法判断这个Column的归属。
SQL 执行的注意事项
1、设置合适的SGA
(1) 假设内存有512M,建议Oracle的SGA大约240M,其中:共享池(SHARED_POOL_SIZE)可以设置60M到80M,根据实际的用户数、查询等来定。数据块缓冲区可以大致分配120M-150M。
(2) 假设内存有1G,Oracle 的SGA可以考虑分配500M:共享池分配100M到150M,数据缓冲区分配300M到400M。
(3) 内存2G以上:共享池300M到500M就足够啦,再多也没有太大帮助;数据缓冲区是尽可能的大,但是一定要注意两个问题:一是要给操作系统和其他应用留够内存,二是对于32位的操作系统,Oracle的SGA有1.75G的限制。
2、共享 SQL 语句
Oracle提供对执行过的SQL语句进行高速缓冲的机制。被解析过并且确定了执行路径的SQL语句存放在SGA的共享池中。Oracle执行一个SQL语句之前每次先从SGA共享池中查找是否有缓冲的SQL语句,如果有则直接执行该SQL语句。可以通过适当调整SGA共享池大小来达到提高Oracle执行性能的目的。
注意:
Oracle对两者采取的是一种严格匹配策略,要达成共享。SQL语句必
须完全相同(包括空格、换行等)。能够使用共享的语句必须满足三个
条件:
① 字符级的比较。
当前被执行的语句和共享池中的语句必须完全相同。
例如: SELECT * FROM ATABLE;和下面每一个SQL语句都不同:
SELECT *from ATABLE
Select * From Atable;
② 语句所指对象必须完全相同 即两条SQL语句操作的数据库对象必须同一。
③语句中必须使用相同命名的绑定变量。如:第一组的两个SQL语句是相同
的,可以共享;而第二组中两个语句不同,即使在运行时赋予不同的绑定变
量以相同的值:
●第一组select pin,name from people where pin = :blk1.pin;
select pin,name from people where pin =:blk1.pin;
●第二组 select pin,name from people where pin =:blk1.ot_jnd;
select pin,name from people where pin = :blk1.ov_jnd;
3、 SQL语句执行步骤
语法分析> 语义分析> 视图转换 >表达式转换> 选择优化器 >选择连接方式 >选择连接顺序 >选择数据的搜索路径 >运行“执行计划”
4、选用适合的Oracle优化器
RULE(基于规则) COST(基于代价) CHOOSE(选择性)
CBO(Cost-BasedOptimization): 基于代价的优化器
CBO的思路是让Oracle 获取所有执行计划相关的信息,通过对这些信息做计算分析,最后得出一个代价最小的执行计划作为最终的执行计划。此时,Oracle 会使用一种叫做动态采样的技术,在分析SQL的时候,动态的收集表,索引上的一些数据块,使用这些数据块的信息及字典表中关于这些对象的信息来计算出执行计划的代价,从而挑出最优的执行计划。
5、访问Table的方式
全表扫描
全表扫描就是顺序地访问表中每条记录,ORACLE采用一次读入多个数据块(database block)的方式优化全表扫描。
通过ROWID访问表
ROWID包含了表中记录的物理位置信息,ORACLE采用索引实现了数据和存放数据的物理位置(ROWID)之间的联系,通常索引提供了快速访问ROWID的方法,因此那些基于索引列的查询就可以得到性能上的提高。
在SQLPLUS中打开自动查询执行计划功能
sqlplus scott/tiger@orcl
1、 SQL>@?/RDBMS/ADMIN/utlxplan.sql创建PLAN_TABLE表
2、 SQL> SET AUTOTRACE ON 包含执行计划和统计信息
SQL>SET TIMING ON 查看语句运行时间
3、 select count(*) from tab1 where x > 0;
4、 create index tab1_x_index on tab1(x);
5、 select count(*) from tab1 where x > 0;
6、
7、 当用使用全表扫描时,可以创建主键,这样可以使用到索引
8、 insert into t select rownum from dual connect by level<10000;
9、 drop table t;
10、 通过表访问数据:
11、 1、TABLE ACCESS FULL
12、 select * from t;
13、
14、 create table t (id int primary key);
15、 insert into t select rownum from dual connect by level<10000;
16、 通过索引的访问数据
17、 1、索引快速扫描(index fast full scan)
18、 select * from t;
19、 2、索引唯一扫描(index unique scan)
20、 select * from t where id=10;
21、 3、索引范围扫描(index range scan)
22、 select * from t where id<10;
23、 4、索引全扫描(index full scan)
24、 select id from t order by id;