DB2中的终极SQL性能调节技术

使用针对工作负载的正确的性能调节技术,以避免硬件升级和优化DB2性能

  性能通过响应时间,吞吐量,峰值响应时间,命中和每秒会话来衡量。SQL编码和调节技术直接影响性能。开发高性能的DB2应用需要对DB2技术的深入了解。

  当然在小数据量时这些技术无足轻重。忽略的连接,子查询,表的表达式和CASE表达式的程序完全可以在轻量级负载下工作的很好。使用100%的SELECT INFO语句来进行数据获取的程序,在开始会非常的迅速。但是一旦数据量和会话速度增加,性能将受到很大影响。DB2的可扩展性需要小的,优化的SQL加上方案设计,性能结构,缓冲池,和针对工作负载模式优化的存储。另外的方案就是升级硬件了。当然对于有着硬件升级的无尽预算的人来说,不用阅读本文了。对于其他人,我将讲解如何编码聪明的SQL以及调优的访问路径。

   指针对于DB2性能的影响

  曾经有段时间,在一个大的复杂的银行应用程序中存在着一个批处理程序。这个新的批处理程序和访问路径被通过代码走查的方式检查过了。因为项目截止日期的原因测试很少; 在实际的首次运行中,程序在运行10个小时之后终止了。一个很慢的代码走查之后,发现了7个指针,每个指针访问一个不同的表中的数据。每个指针在其他打开的指针的循环中被打开,在彼此间传递数据。也就是说,这个程序在DB2以外竟然结合了7个表。这不是聪明的SQL。这个信息需要进入到7个表; 然而,每个指针只能进入一个。因此,7个指针被合并为一个聪明的指针: 

SELECT COL1, COL2, rest of the columnsFROM ADDR A, NAME N, T3, T4, T5, T6, T7WHERE A.COL1 = N.COL9AND N.COL9 = T3.COL3AND T3.COL3 = T4.COL4AND T4.COL4 <> T5.COL5AND T4.COLX <> T5.COLYAND T5.COL6 = T6.COL6AND T6.COL6 = T7.COL7AND T6.CODE = :hv

  这个批处理在第二天用了四分钟就完成了。大多数人可能会结束这个成功的任务了,但是务实的人不会。一个缓慢的EXPLAIN信息走查发现了一个有趣的表连接序列问题。优化器选择了开始7个表的复杂的循环连接,还使用了一系列的大的数据表(ADDR和NAME),它们每个都包含5千万行数据。这不是DB2优化器的典型行为。然而,有一些使用<>比较小表之间列的连接情况。这些比较对于优化器来说很难估计,因为DB2 catalog包含了相等列而非不等列。这里就需要访问路径优化了。DB2优化者脑中肯定有多种推荐的解决方案,一些可以在包或语句层次上,另外的一些工作在谓词层次。当然还有其他一些传统方式不奏效情况下的终极技术。一个要求就是如下的性能调节技术提供给你的catalog以足够的统计,使用统计向导来保证优化器有关于你的数据的精确全景。

   DB2性能调节技术

  包级别的SQL调优——需要REOPT(ONCE/ALWAYS/AUTO) BIND选项。这个语句通告优化器来在运行时重新优化包中的每个语句,至少ONCE,或者ALWAYS(每次执行),在DB2 9中可以AUTO(需要时)。这项技术的开销由选择的选项和SQL语句的数量及复杂性决定。这些开销在批处理程序中可以忽略不计,但是在短期运行的交易中会有很大影响。在我们的例子中,批处理程序指针只有一个谓词和一个基数为1的主机变量。REOPT是一个调节选项,用来优化非统一列值分布和主机变量内容高可变的情况,是COLCARDF=1的反面。包级别的调节并不合适。

  语句级别的调节技术——包括OPTIMIZE FOR n ROWS和FETCH FIRST n ROWS ONLY。这些语句,放在SELECT语句末尾,是在不需要结果集的情况下进行优化的。优化器假设除了这些语句的所有的SELECT语句需要整个结果,这些结果偏向于诸如数序和表预取的访问路径。因为我们的批处理指针一定需要整个结果,因此语句级别的调节也不是合适的技术。

  谓词界别的调节技术——包括增加一个假的过滤器(TX.CX=TX.CX)或增加一个空操作到谓词上(+0,-0,/1,*1, CONCAT ‘’)。一个假的过滤器能够通过减少总过滤器因素(表中满足资格的行的比例)改变优化器。这个方法能够改变表连接的顺序,索引选择和连接方法。多个假过滤器是允许的,但是必须在没有引用过的一列上。空操作(no op)能够通过降级一个过滤器从符合到不符合来改变优化器的工作方式,但是只在z/OS上有用,LUW优化器却不受其影响。这个改变也会影响一个表连接序列,索引选择和连接方法。谓词级别的技术可以被一起使用来获取想要的结果。我们例子中的指针对多个谓词级别调节的结合不起反应,因此是采用重武器的时候了。

  一些终极调节技术包括使用DISTINCE的表的表达式和其他终极跨查询的块优化方法。这些技术要求手动查询重写。它们强制使得优化器以一个指定顺序的方式执行查询块。使用这些技术视需要终极提醒的,因为他们能把表连接序列,索引选择和连接方法从好改到坏。DISTINCE表表达式强制优化器优先于其他查询块执行圆括号中的查询。如果SELECT DISTINCE中指定的列引用了不同的表,表表达式可以被实例化为唯一的以供排序。我们的批处理指针有一个非优化的连接序列,使用该技术得到如下查询:  

SELECT All columns needed FROM ADDR, NAME, (SELECT DISTINCT columns from tables 3 through 7FROM T3, T4, T5, T6, T7WHERE join conditions T3 through T7AND T6.CODE =:hv) AS TEMPWHERE join conditions for ADDR, NAME and TEMP

  这样的查询重写迫使优化器通过T7连接表T3来连接ADDR和NAME。如果关键字DISTINCT在上例中省略了,DB2优化器合并表表达式查询和输出查询,这样就和原来的语句和连接序列一样了。SELECT DISTINCT是一个关键的组件。然而,因为列列表跨越了多个表,临时的5个表连接结果实例为一个唯一的工作文件以供排序。排序的开销平均在每次执行几千行,这是可以忽略的负载。批处理程序现在可以在两分钟之内完成任务了。

   更多未来的调节技术

  其他的一些查询重写技术从全异的查询块中获取信息,以重写查询。IBM曾经将此技术成为跨查询块优化; DB2 9中被成为全局优化。一个好消息就是这项技术开始在DB2优化器的自我查询重写(QWR)阶段中出现了。所有DB2查询都能使用它也是指日可待了。同时,我们也需要将一些终极方法掌握在自己的手里。 
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
目录 1. DB2 1.1. 创建一个返回结果集的存储过程\自定义函数 12 1.2. DB2 高级应用 14 1.3. 删除表数据时候出现日志已满的解决方法 24 1.4. DB2快照函数全解析 25 1.5. DB2的22个命令小技巧 26 1.6. DB2实现类型ORACLE的一些功能 29 1.7. 字符数据类型转换的时候需要注意的问题(原) 30 1.8. 本地谓词的使用注意(原) 31 1.9. windows/Linux或Unix下查看DB2端口号 31 1.10. 尽量让fetch first n row only或者分页的时候结合optimize for n rows使用(原) 32 1.11. 格式化字符串(原) 33 1.12. 10大DB2优化技巧 33 1.13. 使用DB2的整数转换浮点小数时注意(原) 41 1.14. 使用递归制造测试数据(原) 42 1.15. 尽量使用自定义函数来代替存储过程 42 1.16. VALUES(…) 与 VALUES …的区别(原) 44 1.17. DB2的表锁和行锁 45 1.18. 修改表结构后不允许对表进行任何操作(原) 57 1.19. 解决暂挂表(原) 58 1.20. DB2LOOK语法及使用 58 导出表结构的表结构脚本 59 1.21. DB2的函数大全 64 1.22. DB2数据库为单个会话锁定技巧 64 1.23. EXISTS和COUNT(*)的使用(原) 68 1.24. 如果表比较大,进行COUNT的时候,可选择COUNT_BIG(*) 69 1.25. 序列(SEQUENCE) (原) 69 1.26. 数据的导入和导出 69 1 加载数据: 69 2 卸载数据: 70 3 在Load过程使用的Exception 表有何作用,该如何创建?(原) 70 4如何导出(EXPORT),导入(LOAD)包含由公式生成字段的表 70 5 LOAD命令和自生成列值 72 6 用load命令和identityoverride参数向有identity列的表装载数据后的注意事项 74 1.27. 利用快照函数查询数据库服务器本地以及远程的连接数 74 1.28. 查看SQL的执行计划 74 1.29. 如何查看数据库ABC的配置文件的内容? 75 1.30. 查看是哪张表挂起(原) 75 1.31. 导出(导入)数据库的所有表数据(db2move) 75 1.32. 备份数据库,恢复数据库 75 1.33. 建立数据库、缓冲池、表空间、表案例 77 1.34. 建立别名 78 1.35. 建立视图 78 1.36. 建立唯一性索引 78 1.37. 查看表的索引 79 1.38. 查看表 79 1.39. 建立触发器 79 1.40. 查看存储过程 79 1.41. view application 79 1.42. kill application 79 1.43. lock table(x) 79 1.44. lock table(s) 80 1.45. 列出所有的系统表 80 1.46. 列出系统数据库目录 80 1.47. 显示当前活动数据库 80 1.48. 查看命令选项 80 1.49. 表空间 80 1.50. 表空间容器 80 1.51. 如何知道SEQUENCE的状况 81 1.52. 如何知道SCHEMA的状况 81 1.53. 如何知道INDEX的状况 81 1.54. 查看装载数据库的instance 81 1.55. 创建数据库的instance 81 1.56. 创建数据库的catalog 81 1.57. 如何在命令行下执行DB2脚本(script) 82 1.58. 怎么样获取表结构以及索引的信息 82 1.59. 如果怀疑应用程序有死锁现象,如何确认是否死锁,并判断是哪些程序引起的死锁? 84 1.60. 数据库创建以后相关的目录和文件都有哪一些? 85 1.61. 自增列(IDENTITY) 86 1.62. 修改表结构的注意事项(原) 86 1.63. 可使用VALUES 来代替多个[not] in的条件语句 87 1.64. 计算数据库缓冲池的命率公式 87 1.65. 查看表空间状态 88 1.66. UPDATE的N种用法 88 Examples 88 1.67. 查看表状态的快照命令 90 1.68. RUNSTATS的使用案例 91 1.69. Bufferpool设置过大导致数据库无法启动的解决方案 98 1.70. 查看DB2是否存在僵尸进程 98 1.71. 监控执行成本最高的SQL语句 99 1.72. 监控运行最长的SQL语句 99 1.73. 给表增加generated al
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值