最近在做线上oracle11g thin链接升级的时候,搞出一个线上故障,原因是增加的oracle.jdbc.ReadTimeout参数设置有问题。
系统中一个以前配置了以下几个参数:
1.blocking-timeout-millis 500ms
2.query-timeout 180s
3.idle-timeout-minutes 30m
升级后增加了2个参数:
1.oracle.jdbc.ReadTimeout 60000ms
2.oracle.net.CONNECT_TIMEOUT 10000ms
先来解释下这几个参数的作用:
blocking-timeout-millis :是应用获取数据库链接的等待时间。一般数据库链接都是一个池子,当链接数已经达到了最大链接数的时候,应用如果还要获取链接就会出现等待的现象,等待链接释放并回到链接池,如果等待的时间过长就应该踢掉这个等待,不然应用很可能出现雪崩现象。而这个blocking-timeout-millis就是控制这个等待时间的。
query-timeout:是一个sql执行的时间,如果该sql执行的时间超过它配置的时间就会出现ora01013,用户取消请求操作的异常。
idle-timeout-minutes:是一个数据库链接在多久没有被使用彻底销毁的时间。如果对于资源的要求不是那么高的话,一般配置30m就行了。配置久一点无非是没有使用的链接占用一点内存而已。
oracle.jdbc.ReadTimeout 这个参数实际上是从socket读取数据的时间,总体上说这个时间应该包含了query-timeout的时间。如果这个时间配置得比query-timeout短的话就会出现query-timeout的设置值无效,变为更短的oracle.jdbc.ReadTimeout的值。我搞出的故障也是这个值设得太短导致。
oracle.net.CONNECT_TIMEOUT 是应用去获取数据库链接的时候,发现还没有达到最大链接数,还需要重新创建链接的创建时间。这个时间一般10s也足够了,如果10s还没有创建好链接,该请求尽早的滚蛋也好,免得应用僵死。
更多更详细的请参考:http://www.admin10000.com/document/1360.html。