oracle开发知识点

最新推荐文章于 2023-08-14 16:06:30 发布

longminbo

最新推荐文章于 2023-08-14 16:06:30 发布

阅读量670

点赞数

文章标签： oracle date sql 优化 null table

本文链接：https://blog.csdn.net/longminbo/article/details/5614987

版权

1. 分区表

Oracle 建议如果单个表超过2G就最好对其进行分区。对大表的查询、增加、修改等操作可以分解到表的不同分区来并行执行，可使运行速度更快；

1) Range分区

　　Range分区呢是应用范围比较广的表分区方式，它是以列的值的范围来做为分区的划分条件，将记录存放到列值所在的range分区中，比如按照时间划分，2008年1季度的数据放到a分区，08年2季度的数据放到b分区，因此在创建的时候呢，需要你指定基于的列，以及分区的范围值，如果某些记录暂无法预测范围，可以创建maxvalue分区，所有不在指定范围内的记录都会被存储到maxvalue所在分区中，并且支持指定多列做为依赖列

2) Hash分区

　　通常呢，对于那些无法有效划分范围的表，可以使用hash分区，这样对于提高性能还是会有一定的帮助。hash 分区会将表中的数据平均分配到你指定的几个分区中，列所在分区是依据分区列的hash值自动分配，因此你并不能控制也不知道哪条记录会被放到哪个分区中，hash分区也可以支持多个依赖列。

3) List分区

你能控制记录存储在哪个分区。它的分区列只能有一个，要创建一个default分区存储那些不在指定范围内的记录。

2. sql优化

1)索引列

a) 避免在索引列上使用NOT 通常，我们要避免在索引列上使用NOT, 当ORACLE”遇到”NOT,他就会停止使用索引转而执行全表扫描.

b) 避免在索引列上使用IS NULL 和IS NOT NULL
避免在索引中使用任何可以为空的列，ORACLE 将无法使用该索引．对于单列索引，如果列包含空值，索引中将不存在此记录. 对于复合索引，如果每个列都为空，索引中同样不存在此记录. 如果至少有一个列不为空，则记录存在于索引中．举例: 如果唯一性索引建立在表的A 列和B 列上, 并且表中存在一条记录的A,B 值为(123,null) , ORACLE 将不接受下一
条具有相同A,B 值（123,null）的记录(插入). 然而如果所有的索引列都为空，ORACLE 将认为整个键值为空而空不等于空. 因此你可以插入1000 条具有相同键值的记录,当然它们都是空! 因为空值不存在于索引列中,所以WHERE 子句中对索引列进行空值比较将使ORACLE 停用该索引.
低效: (索引失效)
SELECT … FROM DEPARTMENT WHERE DEPT_CODE IS NOT NULL;
高效: (索引有效)
SELECT … FROM DEPARTMENT WHERE DEPT_CODE >=0;

c)总是使用索引的第一个列：
如果索引是建立在多个列上, 只有在它的第一个列(leading column)被where 子句引用时, 优化器才会选择使用该索引. 这也是一条简单而重要的规则，当仅引用索引的第二个列时, 优化器使用了全表扫描而忽略了索引

d)某些SELECT 语句中的WHERE 子句不使用索引. 这里有一些例子.

在下面的例子里, (1)‘!=' 将不使用索引. 记住, 索引只能告诉你什么存在于表中, 而不能告诉你什么不存在于表中. (2) ‘||'是字符连接函数. 就象其他函数那样, 停用了索引. (3) ‘+'是数学函数. 就象其他数学函数那样, 停用了索引. (4)相同的索引列不能互相比较,(5)索引列上使用计算．(5)内部发生的类型转换, (6)%在第一个字符。这个索引将不会被用到. 这将会启用全表扫描. 举例:
低效：
SELECT … FROM DEPT WHERE SAL * 12 > 25000;
高效:
SELECT … FROM DEPT WHERE SAL > 25000/12;

e) 合理的索引设计：
例：表record有620000行，试看在不同的索引下，下面几个SQL的运行情况：
语句A
SELECT count(*) FROM record
WHERE date >'19991201' and date< '19991214‘ and amount=2000
语句B
SELECT count(*) FROM record
WHERE date>'19990901' and place IN ('BJ','SH')
语句C
SELECT date,sum(amount) FROM record group by date
1 在date上建有一个非聚集索引
A：(25秒)
B：(27秒)
C：(55秒)
分析：
date上有大量的重复值，在非聚集索引下，数据在物理上随机存放在数据页上，在范围查找时，必须执行一次表扫描才能找到这一范围内的全部行。
2 在date上的一个聚集索引
A：（14秒）
B：（14秒）
C：（28秒）
分析：
在聚集索引下，数据在物理上按顺序在数据页上，重复值也排列在一起，因而在范围查找时，可以先找到这个范围的起末点，且只在这个范围内扫描数据页，避免了大范围扫描，提高了查询速度。
3 在place，date，amount上的组合索引
A：（26秒）
C：（27秒）
B：（<1秒）
分析：
这是一个不很合理的组合索引，因为它的前导列是place，第一和第二条SQL没有引用place，因此也没有利用上索引；第三个SQL使用了place，且引用的所有列都包含在组合索引中，形成了索引覆盖，所以它的速度是非常快的。
4 在date，place，amount上的组合索引
A： (<1秒)
B：（<1秒）
C：（11秒）
分析：
这是一个合理的组合索引。它将date作为前导列，使每个SQL都可以利用索引，并且在第一和第三个SQL中形成了索引覆盖，因而性能达到了最优。

总结1
缺省情况下建立的索引是非聚集索引，但有时它并不是最佳的；合理的索引设计要建立在对各种查询的分析和预测上。一般来说：
有大量重复值、且经常有范围查询（between, ><，>=,<=）和order by、group by发生的列，考虑建立聚集索引；
经常同时存取多列，且每列都含有重复值可考虑建立组合索引；在条件表达式中经常用到的不同值较多的列上建立检索，在不同值少的列上不要建立索引。比如在雇员表的“性别”列上只有“男”与“女”两个不同值，因此就无必要建立索引。如果建立索引不但不会提高查询效率，反而会严重降低更新速度。
组合索引要尽量使关键查询形成索引覆盖，其前导列一定是使用最频繁的列。

2) 尽早过滤掉更多的记录

2.1) 选择最有效率顺序

a)表名顺序(只在基于规则的优化器中有效)：
ORACLE 的解析器按照从右到左的顺序处理FROM 子句中的表名，FROM 子句中写在最后的表(基础表driving table)将被最先处理，在FROM 子句中包含多个表的情况下,你必须选择记录条数最少的表作为基础表。如果有3个以上的表连接查询, 那就需要选择交叉表(intersection table)作为基础表, 交叉表是指那个被其他表所引用的表.

b) WHERE 子句中的连接顺序．：
ORACLE 采用自下而上的顺序解析WHERE 子句,根据这个原理,表之间的连接必须写在其他WHERE 条件之前, 那些可以过滤掉最大数量记录的条件必须写在WHERE 子句的末尾.

2.2) 分组查询

a) 用Where 子句替换HAVING 子句：
避免使用HAVING 子句, HAVING 只会在检索出所有记录之后才对结果集进行过滤. 这个处理需要排序,总计等操作. 如果能通过WHERE 子句限制记录的数目,那就能减少这方面的开销. (非oracle 中)on、where、having 这三个都可以加条件的子句中，on 是最先执行，where 次之，having 最后，因为on 是先把不符合条件的记录过滤后才进行统计，它就可以减少
中间运算要处理的数据，按理说应该速度是最快的， where 也应该比having 快点的，因为它过滤数据后才进行sum，在两个表联接时才用on 的，所以在一个表的时候，就剩下where 跟having 比较了。在这单表查询统计的情况下，如果要过滤的条件没有涉及到要计算字段，那它们的结果是一样的，只是where 可以使用rushmore 技术，而having 就不能，在速度上后者要慢如果要涉及到计算的字段，就表示在没计算之前，这个字段的值是不确定的，where 的作用时间是在计算之前就完成的，而having 就是在计算后才起作用的，所以在这种情况下，两者的结果会不同。在多表联接查询时， on 比where 更早起作用。系统首先根据各个表之间的联接条件，把多个表合成一个临时表后，再由where进行过滤，然后再计算，计算完后再由having 进行过滤。

b) 优化GROUP BY:
提高GROUP BY 语句的效率, 可以通过将不需要的记录在GROUP BY 之前过滤掉.下面两个
查询返回相同结果但第二个明显就快了许多.
低效:
SELECT JOB , AVG(SAL)
FROM EMP
GROUP by JOB
HAVING JOB = ‘PRESIDENT'
OR JOB = ‘MANAGER'
高效:
SELECT JOB , AVG(SAL)
FROM EMP
WHERE JOB = ‘PRESIDENT'
OR JOB = ‘MANAGER'
GROUP by JOB

3)避免排序

a) 替代IN、用NOT EXISTS 替代NOT IN：
在许多基于基础表的查询中,为了满足一个条件,往往需要对另一个表进行联接.在这种情况下, 使用EXISTS(或NOT EXISTS)通常将提高查询的效率. 在子查询中,NOT IN 子句将执行一个内部的排序和合并. 无论在哪种情况下,NOT IN 都是最低效的(因为它对子查询中的表执行了一个全表遍历). 为了避免使用NOT IN ,我们可以把它改写成外连接(Outer Joins)或NOT EXISTS.
例子：查询位置在MELB的部门里的所有员工
（高效）SELECT * FROM EMP (基础表) WHERE EMPNO > 0 AND EXISTS (SELECT ‘X'
FROM DEPT WHERE DEPT.DEPTNO = EMP.DEPTNO AND LOC = ‘MELB')
(低效)SELECT * FROM EMP (基础表) WHERE EMPNO > 0 AND DEPTNO IN(SELECT DEP
TNO FROM DEPT WHERE LOC = ‘MELB')

b) 替换DISTINCT：
当提交一个包含一对多表信息(比如部门表和雇员表)的查询时,避免在SELECT 子句中使用DISTINCT. 一般可以考虑用EXIST 替换, EXISTS 使查询更为迅速,因为RDBMS 核心模块将在子查询的条件一旦满足后,立刻返回结果. 例子：查询有雇员的部门
(低效):
SELECT DISTINCT DEPT_NO,DEPT_NAME FROM DEPT D , EMP E
WHERE D.DEPT_NO = E.DEPT_NO
(高效):
SELECT DEPT_NO,DEPT_NAME FROM DEPT D WHERE EXISTS ( SELECT ‘X'
FROM EMP E WHERE E.DEPT_NO = D.DEPT_NO);

6)减少解析时间

a)SELECT 子句中避免使用‘ * ‘：
ORACLE 在解析的过程中, 会将'*' 依次转换成所有的列名, 这个工作是通过查询数据字典完成的, 这意味着将耗费更多的时间

b)使用表的别名(Alias)：
当在SQL 语句中连接多个表时, 请使用表的别名并把别名前缀于每个Column 上.这样一来, 就可以减少解析的时间并减少那些由Column 歧义引起的语法错误.

c) sql 语句用大写的；因为oracle 总是先解析sql 语句，把小写的字母转换成大写的再执行

7)避免使用耗费资源的操作:
带有DISTINCT,UNION,MINUS,INTERSECT,ORDER BY 的SQL 语句会启动SQL 引擎执行耗费资源的排序(SORT)功能. DISTINCT 需要一次排序操作, 而其他的至少需要执行两次排序. 通常, 带有UNION, MINUS , INTERSECT 的SQL 语句都可以用其他方式重写. 如果你的数据库的SORT_AREA_SIZE 调配得好, 使用UNION , MINUS, INTERSECT 也是可以考虑
的, 毕竟它们的可读性很强

3.存储
   1）表空间由一个或者多个文件组成，组成表空间的文件可以是文件系统上的各种文件；表空间包含段。
   2）段由一个或者多个区段组成，有table段、index段等。包含在表空间中，但是可以跨表空间内的多个文件。
   3）区段是磁盘上一组逻辑连续的块。区段只在一个表空间中，二期总是在该表空间内的一个文件中。
   4）块是数据库中最小的分配单位，也是数据库使用的最小I/O单位；在给段分配空间的时候，分配空间至少为一个块的整数被大小。

4.时间

imestamp 数据类型ITPUB个人空间` N pc!B1SUh1P ITPUB个人空间+mvA_:u%EF/E
date数据类型的主要问题是他粒度不能足够区别出两个事件哪个先发生。oracle已在date数据类型上扩展出来了timestamp数据类型，他包括了任何date数据类型的年月日时分秒的信息，而且包括了小数秒的信息。

Oracle使用天来作为消逝时间的单位，d1-d2 NUMBER 返回D1和D2之间相差的天数。该值是一个数值，其小数部分代表一天的几分之几。

默认格式是：DD-MON-RR。

SELECT TO_CHAR(date1,'MM/DD/YYYY HH24:MI:SS') "Date" FROM date_table;

dt1-dt2 INTERVAL 返回DT1和DT2之间的时间间隔。
SYSDATE 返回当前的系统时间。 SELECT SYSDATE FROM DUAL；

在某段时间内:
select * from up_date where update between to_date('2007-07-07 00:00:00','yyyy-mm-dd hh24:mi:ss') and to_date('2007-09-07 00:00:00','yyyy-mm-dd hh24:mi:ss')
select * from up_date where update < to_date('2007-09-07 00:00:00','yyyy-mm-dd hh24:mi:ss') and update >＝ to_date('2007-07-07 00:00:00','yyyy-mm-dd hh24:mi:ss')

5.sql 语句

(1) 分页查询 30到40之间记录

SELECT * FROM
(
SELECT row_ .*, rownum rownum_
FROM (SELECT * FROM TABLE_NAME) row_
WHERE rownum <= 40
)
WHERE rownum_ >= 30