job broken 问题的处理及相关知识

OS suse10

DBMS 11.1.07

有物化视图不能正确刷新,其实定议物化视图时自动衍生出一job ,根据刷新时间刷新物化视图

看job 的相关信息可以在user_jobs 里. 查看信息

SQL> select job, last_date,broken , failures  from user_jobs;

       JOB LAST_DATE B   FAILURES
---------- --------- - ----------
         2 01-MAY-13 Y         16

发现此job 已的状态是broken, job失败后,会一直尝试,并失败次数为16次 就会broken门限超过16,就自动让job broken掉


SQL> select job, last_date,broken , failures  from user_jobs;

       JOB LAST_DATE B   FAILURES
---------- --------- - ----------
         2 01-MAY-13 Y         17


修改broken 为N

SQL> execute dbms_job.broken(2,false);

PL/SQL procedure successfully completed.

SQL> commit;

Commit complete.

 

SQL> select job, last_date,broken , failures  from user_jobs;

       JOB LAST_DATE B   FAILURES
---------- --------- - ----------
         2 01-MAY-13 N         16

SQL> commit;  


Commit complete.

这里记的提交

下次执行如果能执行成功,会将failure 清0

Connected.
SQL> select job, last_date,broken , failures  from user_jobs;

       JOB LAST_DATE B   FAILURES
---------- --------- - ----------
         2 16-MAY-13 N          0

 

在这里详细说一下,dbms_job的相关管理包

 

在alert 日志里发现了

 

Thu May 16 14:41:06 2013
Errors in file /opt/oracle/db/diag/rdbms/mos5200/mos52001/trace/mos52001_ora_16103.trc:
ORA-12012: error on auto execute of job 2
ORA-12008: error in materialized view refresh path
ORA-01013: user requested cancel of current operation
ORA-06512: at "SYS.DBMS_SNAPSHOT", line 2545
ORA-06512: at "SYS.DBMS_SNAPSHOT", line 2751
ORA-06512: at "SYS.DBMS_IREFRESH", line 685
ORA-06512: at "SYS.DBMS_REFRESH", line 195
ORA-06512: at line 1
Thu May 16 14:41:41 2013

MOS 解释

In this Document
SyCause
 
Object Privleges -  If the owner has not granted explicit rights to these objects the scheduled job will fail.


 
Solution
 
-- To implement the solution, please execute the following steps:
grant select privileges on the master table(s) or the "select any table" system privilege to the given snapshot owner, not through a role.

Example:
If the mview is REFRESH FAST type, then need to grant SELECT in MLOG table like
>GRANT SELECT ON MLOG$_<tableName> to mview_owner;

If mview is in Replication environment, then need to grant SELECT on RUPD$_ table like
>GRANT SELECT ON RUPD$_<tableName> to mview_owner;


在这里介绍一下job 的相关知识,以下信息来源自网络

设置初始化参数 job_queue_processes
sql> alter system set job_queue_processes=n;(n>0)
  job_queue_processes最大值为1000
  
查看job queue 后台进程
  sql>select name,description from v$bgprocess;
  
dbms_job package 用法介绍
  包含以下子过程:
  Broken()过程。
  change()过程。
  Interval()过程。
  Isubmit()过程。
  Next_Date()过程。
  Remove()过程。
  Run()过程。
  Submit()过程。
  User_Export()过程。
  What()过程。
  
Broken()过程更新一个已提交的工作的状态,典型地是用来把一个已破工作标记为未破工作。
  这个过程有三个参数:job 、broken与next_date。
 
  PROCEDURE Broken (job    IN binary_integer,
           Broken  IN boolean,
           next_date IN date :=SYSDATE)
  
  job参数是工作号,它在问题中唯一标识工作。
  broken参数指示此工作是否将标记为破——TRUE说明此工作将标记为破,而FLASE说明此工作将标记为未破。
  next_date参数指示在什么时候此工作将再次运行。此参数缺省值为当前日期和时间。
  job如果由于某种原因未能成功之行,oracle将重试16次后,还未能成功执行,将被标记为broken重新启动状态为broken的job,有如下两种方式;
利用dbms_job.run()立即执行该job
    sql>begin
    sql>dbms_job.run(:jobno)
    sql>end;
    sql>/
利用dbms_job.broken()重新将broken标记为false
    sql>begin
    sql>dbms_job.broken (:job,false,next_date)
    sql>end;
    sql>/
Change()过程用来改变指定工作的设置。
  这个过程有四个参数:job、what 、next_date与interval。
  
  PROCEDURE Change (job    IN binary_integer,
           What    IN varchar2,
           next_date IN date,
           interval  IN varchar2)
  
  此job参数是一个整数值,它唯一标识此工作。
  What参数是由此工作运行的一块PL/SQL代码块。
  next_date参数指示何时此工作将被执行。
  interval参数指示一个工作重执行的频度。
  
Interval()过程用来显式地设置重执行一个工作之间的时间间隔数。这个过程有两个参数:job与interval。
  
  PROCEDURE Interval (job   IN binary_integer,
            Interval IN varchar2)
  
  job参数标识一个特定的工作。interval参数指示一个工作重执行的频度。
  
ISubmit()过程用来用特定的工作号提交一个工作。这个过程有五个参数:job、what、next_date、interval与no_parse。
  
  PROCEDURE ISubmit (job    IN binary_ineger,
            What   IN varchar2,
            next_date IN date,
            interval IN varchar2,
            no_parse IN booean:=FALSE)
  
  这个过程与Submit()过程的唯一区别在于此job参数作为IN型参数传递且包括一个由开发者提供的工作号。如果提供的工作号已被使用,将产生一个错误。
  
Next_Date()过程用来显式地设定一个工作的执行时间。这个过程接收两个参数:job与next_date。
  
  PROCEDURE Next_Date(job     IN binary_ineger,
            next_date  IN date)
  job标识一个已存在的工作。next_date参数指示了此工作应被执行的日期与时间。
  
Remove()过程来删除一个已计划运行的工作。这个过程接收一个参数:
  
  PROCEDURE Remove(job IN binary_ineger);
  
  job参数唯一地标识一个工作。这个参数的值是由为此工作调用Submit()过程返回的job参数的值。已正在运行的工作不能由调用过程序删除。
  
Run()过程用来立即执行一个指定的工作。这个过程只接收一个参数:
  
  PROCEDURE Run(job IN binary_ineger)
  
  job参数标识将被立即执行的工作。
  
使用Submit()过程,工作被正常地计划好。
  这个过程有五个参数:job、what、next_date、interval与no_parse。
  
  PROCEDURE Submit ( job    OUT binary_ineger,
            What   IN varchar2,
            next_date IN date,
            interval IN varchar2,
            no_parse IN booean:=FALSE)
  
  job参数是由Submit()过程返回的binary_ineger。这个值用来唯一标识一个工作。
  what参数是将被执行的PL/SQL代码块。
  next_date参数指识何时将运行这个工作。
  interval参数何时这个工作将被重执行。
  no_parse参数指示此工作在提交时或执行时是否应进行语法分析——TRUE指示此PL/SQL代码在它第一次执行时应进行语法分析,而FALSE指示本PL/SQL代码应立即进行语法分析。
  
User_Export()过程返回一个命令,此命令用来安排一个存在的工作以便此工作能重新提交。
  此程序有两个参数:job与my_call  
  PROCEDURE User_Export(job    IN binary_ineger,
             my_call  IN OUT varchar2)

  job参数标识一个安排了的工作。my_call参数包含在它的当前状态重新提交此工作所需要的正文。
  
 What()过程应许在工作执行时重新设置此正在运行的命令。这个过程接收两个参数:job与what。
  
  PROCEDURE What (job IN binary_ineger,
          What IN OUT varchar2)
  job参数标识一个存在的工作。what参数指示将被执行的新的PL/SQL代码。
查看相关job信息相关视图
  dba_jobs
  all_jobs
  user_jobs
  dba_jobs_running 包含正在运行job相关信息
  
查看相关信息
  SQL>SELECT JOB, NEXT_DATE, NEXT_SEC, FAILURES, BROKEN FROM DBA_JOBS;
  
  
  正在运行的JOB相关信息
  SQL>SELECT SID, r.JOB, LOG_USER, r.THIS_DATE, r.THIS_SEC FROM DBA_JOBS_RUNNING r, DBA_JOBS j
  WHERE r.JOB = j.JOB;

  JOB QUEUE LOCK相关信息
  SQL>SELECT SID, TYPE, ID1, ID2 FROM V$LOCK WHERE TYPE = 'JQ';
  
  

  运行JOB
  SQL> begin
   2 dbms_job.run(:job1);
   3 end;
   4 /
  
  PL/SQL 过程已成功完成。
  
  SQL> select to_char(a,'yyyy/mm/dd hh24:mi:ss') 时间 from TEST;
  


1/24    一小时;(一天24小时)
1/1440    一分;(一天1440分钟)
1/3600   24秒;
1/86400 一秒(一天86400秒)


1、 每分钟执行
  
   Interval => TRUNC(sysdate,'mi') + 1 / (24*60)
  
   2、 每天定时执行
  
   例如:每天的凌晨2点执行
  
   Interval => TRUNC(sysdate) + 1 +2 / (24)
  
   3、 每周定时执行
  
   例如:每周一凌晨2点执行
  
   Interval => TRUNC(next_day(sysdate,'星期一'))+2/24
  
   4、 每月定时执行
  
   例如:每月1日凌晨2点执行
  
   Interval =>TRUNC(LAST_DAY(SYSDATE))+1+2/24
  
   5、 每季度定时执行
  
   例如每季度的第一天凌晨2点执行
  
   Interval => TRUNC(ADD_MONTHS(SYSDATE,3),'Q') + 2/24
  
   6、 每半年定时执行
  
   例如:每年7月1日和1月1日凌晨2点
  
   Interval => ADD_MONTHS(trunc(sysdate,'yyyy'),6)+2/24
  
   7、 每年定时执行
  
   例如:每年1月1日凌晨2点执行
  
   Interval =>ADD_MONTHS(trunc(sysdate,'yyyy'),6)+2/24
  
  
  
   一。job的运行频率设置

1.每天固定时间运行,比如早上8:10分钟:Trunc(Sysdate+1) + (8*60+10)/24*60

2.Toad中提供的:

每天:trunc(sysdate+1)

每周:trunc(sysdate+7)

每月:trunc(sysdate+30)

每个星期日:next_day(trunc(sysdate),'SUNDAY')

每天6点:trunc(sysdate+1)+6/24

半个小时:sysdate+30/1440

3.每个小时的第15分钟运行,比如:8:15,9:15,10:15...:trunc(sysdate,'hh')+75/1440。原先我设置的是trunc(sysdate,'hh')+15/1440,发现居然不行。

JOB为什么不运行?

1.先来了解一下JOB的参数说明:与job相关的参数一个是job_queue_processes,这个是运行JOB时候所起的进程数,
当然系统里面JOB大于这个数值后,就会有排队等候的,最小值是0,表示不运行JOB,最大值是36,在OS上对应的进程时SNPn,
9i以后OS上管理JOB的进程叫CJQn。可以使用下面这个SQL确定目前有几个SNP/CJQ在运行。

select * from v$bgprocess,这个paddr不为空的snp/cjq进程就是目前空闲的进程,有的表示正在工作的进程。

另外一个是job_queue_interval,范围在1--3600之间,单位是秒,这个是唤醒JOB的process,因为每次snp运行完他就休息了,需要定期唤醒他,这个值不能太小,太小会影响数据库的性能。

2.诊断:先确定上面这两个参数设置是否正确,特别是第一个参数,设置为0了,所有JOB就不会跑,确认无误后,我们继续向下。

3.使用下面的SQL察看JOB的的broken,last_date和next_date,last_date是指最近一次job运行成功的结束时间,next_date是根据设置的频率计算的下次执行时间,根据这个信息就可以判断JOB上次是否正常,还可以判断下次的时间对不对,SQL如下:

select * from dba_jobs

有时候我们发现他的next_date是4000年1月1日,说明job要不就是在running,要不就是状态是break(broken=Y),如果发现JOB的broken值为Y,找用户了解一下,确定该JOB是否可以broken,如果不能broken,那就把broken值修改成N,修改再使用上面的SQL察看就发现他的last_date已经变了,JOB即可正常运行,修改broken状态的SQL如下:

declare

BEGIN

DBMS_JOB.BROKEN(<JOB_ID>,FALSE);

END;

4.使用下面的SQL查询是否JOB还在Running

select * from dba_jobs_running

如果发现JOB已经Run了很久了还没有结束,就要查原因了。一般的JOB running时会锁定相关的相关的资源,可以查看一下v$access和v$locked_object这两个view,如果发现其他进程锁定了与JOB相关的Object,包括PKG/Function/Procedure/Table等资源,那么就要把其他进程删除,有必要的话,把JOB的进程也删除,再重新跑看看结果。

5.如果上面都正常,但是JOB还不run,怎么办?那我们要考虑把JOB进程重启一次,防止是SNP进程死了造成JOB不跑,指令如下:

alter system set job_queue_processes=0

alter system set job_quene_processes=10 --恢复原来的值


 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值