任何软件,特别是企业级系统组件的升级工作,是一个非常复杂的过程。升级路径、数据留存预案、回退步骤、原有业务功能冲击程度,都是需要反复测试论证的问题。所有的运维人员在遇到升级问题的时候,都要抱有谨慎的态度。
笔者最近接手一个升级过的系统,在测试过程中遇到了一些问题。经过查找MOS和网络资源加以解决。记录下来,留待需要的朋友。
1、环境介绍
接手的是一个升级到10.2.0.4的Linux版。
SQL> select * from v$version;
BANNER
-----------------------------------------------
Oracle Database 10g Release 10.2.0.4.0 - 64bit Production
PL/SQL Release 10.2.0.4.0 - Production
CORE 10.2.0.4.0 Production
TNS for Linux: Version 10.2.0.4.0 - Production
NLSRTL Version 10.2.0.4.0 - Production
2、故障问题展示
在巡检中,发现记录Oracle内部作业调度的视图dba_scheduler_jobs不能支持查询。
SQL> select * from dba_scheduler_jobs;
select * from dba_scheduler_jobs
ORA-01882: 未找到时区
1882错误的官方解释信息如下:
[oracle@allfirst ~]$ oerr ora 1882
01882, 00000, "timezone region %s not found"
// *Cause: The specified region name was not found.
// *Action: Please contact Oracle Customer Support.
但是,并不是所有的字段都不支持查询动作。
SQL> select owner, job_name from dba_scheduler_jobs;
OWNER JOB_NAME
------------------------------ ------------------------------
SYS SQLSCRIPT_4084880
SYS AUTO_SPACE_ADVISOR_JOB
SYS GATHER_STATS_JOB
SYS FGR$AUTOPURGE_JOB
SYS PURGE_LOG
EXFSYS RLM$SCHDNEGACTION
EXFSYS RLM$EVTCLEANUP
ORACLE_OCM MGMT_STATS_CONFIG_JOB
ORACLE_OCM MGMT_CONFIG_JOB
9 rows selected
从字段性质看,值得怀疑与时区有关的字段是Time Zone。
SQL> select column_name, data_type from dba_tab_columns where owner='SYS' and table_name=upper('dba_scheduler_jobs') and data_type like '%TIME ZONE%';
COLUMN_NAME DATA_TYPE
------------------------------ ------------------------------
START_DATE TIMESTAMP(6) WITH TIME ZONE
END_DATE TIMESTAMP(6) WITH TIME ZONE
LAST_START_DATE TIMESTAMP(6) WITH TIME ZONE
NEXT_RUN_DATE TIMESTAMP(6) WITH TIME ZONE
但是,也并不是所有的time zone类型字段都不能显示。而且这样的问题不止出现在这个视图中。
SQL> select start_date from dba_scheduler_jobs;
START_DATE
-----------------------------------------------------
19-3月 -12 05.48.23.742796 下午 +08:00
28-1月 -14 02.42.49.000000 下午 +08:00
13-5月 -13 07.40.35.640706 下午 +08:00
13-5月 -13 07.32.40.314879 下午 +08:00
9 rows selected
SQL> select * from SYS.scheduler$_job ;
select * from SYS.scheduler$_job
ORA-01882: 未找到时区
3、问题分析
从直观看,应该是数据库部分数据表中与timezone有关的数值出现问题造成的。
时区TimeZone在Oracle中不仅仅是一个环境变量,而且是融入到数据取值保存过程中的。Oracle字段类型中,与时区有关的字段类型只有两个:timestamp with time zone和timestamp with local time zone。
Oracle的时区是通过时区文件来进行控制的,不同版本的数据库,选择不同版本的时区文件。
SQL> select * from v$timezone_file;
FILENAME VERSION
------------ ----------
timezlrg.dat 4
一个经常发生的故障,是升级数据库过程中,没有升级time zone文件。这样导致升级失败现象。Time Zone文件是归属在DST技术体系下。10.2.0.2使用的是DST版本为DSTv2、10.2.0.3使用DSTv3、10.2.0.4使用DSTv4。从我们刚才的测试来看,使用的DST版本是正确的。
时区问题的另一个特点是服务器、客户端特性差异。如果需要确定是否是服务器问题,需要直接到服务器上执行命令。
[oracle@allfirst /]$ sqlplus /nolog
SQL*Plus: Release 10.2.0.4.0 - Production on 星期二 1月 28 14:54:51 2014
Copyright (c) 1982, 2007, Oracle. All Rights Reserved.
SQL> conn / as sysdba
已连接。
SQL> select * from dba_scheduler_jobs;
ERROR:
ORA-01882: 未找到时区区域 %s
说明是数据库服务器端问题。如果是客户端问题,则需要及时升级客户端版本。
一种猜想是:当Oracle进行版本升级的时候,使用数据库时区文件的确是升级了,但是对应的内部数据还没有进行更新。这样就存在不兼容的问题。
在MOS中,我们也检查到了对应的讨论文章:Time Zone IDs for 7 Time Zones Changed in Time Zone Files Version 3 and Higher, Possible ORA-1882 After Upgrade (文档 ID 414590.1)。
其中,介绍了使用检查脚本进行修复的解决方案。
4、问题解决
在MOS文章中,介绍了故障的解决方法,就是从中下载SQL脚本Fix1882.sql,到界面上进行执行。
解压之后,上传到Server段的$ORACLE_HOME/rdbms/admin目录下。注意:Oracle强烈推荐在服务端执行脚本。
[oracle@allfirst /]$ cd $ORACLE_HOME
[oracle@allfirst 10g]$ cd rdbms/admin/
[oracle@allfirst admin]$ ls -l | grep Fix
-rw-r--r-- 1 root root 11278 01-28 14:58 Fix1882.sql
更换执行权限。
[root@allfirst admin]# chown oracle:dba Fix1882.sql
[root@allfirst admin]# ls -l | grep Fix
-rw-r--r-- 1 oracle dba 11278 1月 28 14:58 Fix1882.sql
在SQLPLUS中执行程序。
[oracle@allfirst ~]$ sqlplus /nolog
SQL*Plus: Release 10.2.0.4.0 - Production on 星期二 1月 28 15:00:36 2014
Copyright (c) 1982, 2007, Oracle. All Rights Reserved.
SQL> conn / as sysdba
已连接。
SQL> @?/rdbms/admin/Fix1882.sql
PL/SQL 过程已成功完成。
会话已更改。
drop view FIX1882V
*
第 1 行出现错误:
ORA-00942: 表或视图不存在
视图已创建。
drop table FIX1882_PROGRESS *
第 1 行出现错误:
ORA-00942: 表或视图不存在
表已创建。
drop table ADJUST_TZ_TAB
*
第 1 行出现错误:
ORA-00942: 表或视图不存在
表已创建。
PL/SQL 过程已成功完成。
过程已创建。
过程已创建。
ORA-1882 in SYS.SCHEDULER$_JOB(LAST_ENABLED_TIME), checking rows
Found ORA-1882 on SYS.SCHEDULER$_JOB(LAST_ENABLED_TIME): AAABPpAABAAACuiAAA
Row successfully modified: SYS.SCHEDULER$_JOB(LAST_ENABLED_TIME)
AAABPpAABAAACuiAAA
(篇幅原因,有省略……)
视图已删除。
执行过程需要消耗几分钟,从输出信息看,Oracle脚本在检查每个包括Time Zone相关字段,进行修改处理。输出信息里面还包括了数据行的rowid信息。
执行之后,检查数据行。
SQL> select last_start_date from dba_scheduler_jobs;
LAST_START_DATE
----------------------------------------------
19-3月 -12 05.48.44.066014 下午 +08:00
27-1月 -14 10.00.02.601102 下午 +08:00
27-1月 -14 10.00.02.619984 下午 +08:00
18-3月 -12 03.00.00.095899 上午 PST8PDT
28-1月 -14 02.42.49.099626 下午 +08:00
28-1月 -14 02.40.35.095036 下午 +08:00
01-1月 -14 01.01.01.097621 上午 +08:00
27-1月 -14 10.00.02.633247 下午 +08:00
9 rows selected
故障解决!
5、结论
升级故障是我们日常运维经常遇到的问题。一套系统进行升级,问题、故障是不能避免的。对我们而言,详细的规划和前期研究,反复的测试实验,可以最大程度的减少我们的风险和压力。
来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/17203031/viewspace-1077450/,如需转载,请注明出处,否则将追究法律责任。
转载于:http://blog.itpub.net/17203031/viewspace-1077450/