参照这个例子:http://cherryqq.iteye.com/blog/855022
思路: data表中有4条数据 ,relation有3条数据,通过data_id 对应,需要定时删除 data表中在relation表中没有data_id引向的数据,
通过存储过程+job的方式。
已有表结构
tab_page_data
create table TAB_PAGE_DATA ( DATA_ID CHAR(32) not null, PAGE_ID NUMBER not null, PARENT_ID NUMBER, SYSTEM_ID NUMBER, EXTENSION VARCHAR2(255), CREATEDTIME DATE, TITLE VARCHAR2(255), AUTHORS VARCHAR2(255), DOMAIN VARCHAR2(255), CONTENT CLOB, CONTENTLENGTH NUMBER, SUMMARY VARCHAR2(1000), CLASSIFY_DIR_ID NUMBER, FLAG NUMBER )
tab_page_relation
create table TAB_PAGE_RELATION
(
UNIQUE_ID CHAR(32) not null,
DATA_ID CHAR(32),
NICK_ID NUMBER,
URL VARCHAR2(512),
UPDATE_TIME DATE default sysdate,
INSERT_TIME DATE default sysdate not null,
LAST_CRAWLER_TIME DATE default sysdate
)
tab_page_data插入测试数据 四条
insert into tab_page_data (DATA_ID, PAGE_ID, PARENT_ID, SYSTEM_ID, EXTENSION, CREATEDTIME, TITLE, AUTHORS, DOMAIN, CONTENT, CONTENTLENGTH, SUMMARY, CLASSIFY_DIR_ID, FLAG)
values ('b3764d3494655859cd0de9309f3376d6', 0, 0, 1, 'html', to_date('30-10-2013 11:55:27', 'dd-mm-yyyy hh24:mi:ss'), 'AutoCADArchitecture2010中国标准件库', '', '鹏宇成MIS管理系统', 'test', 4762, 'test', null, null);
insert into tab_page_data (DATA_ID, PAGE_ID, PARENT_ID, SYSTEM_ID, EXTENSION, CREATEDTIME, TITLE, AUTHORS, DOMAIN, CONTENT, CONTENTLENGTH, SUMMARY, CLASSIFY_DIR_ID, FLAG)
values ('0f8342f81e3931ce8667f001409aef03', 0, 0, 1, 'html', to_date('30-10-2013 11:59:02', 'dd-mm-yyyy hh24:mi:ss'), '在安装AIP的模块的时候会出现1722或1904错误', '', '鹏宇成MIS管理系统', 'test', 12311, 'test', null, null);
insert into tab_page_data (DATA_ID, PAGE_ID, PARENT_ID, SYSTEM_ID, EXTENSION, CREATEDTIME, TITLE, AUTHORS, DOMAIN, CONTENT, CONTENTLENGTH, SUMMARY, CLASSIFY_DIR_ID, FLAG)
values ('6fd0b3d8bddf94a4c59a467a893eaab7', 0, 0, 2, 'html', to_date('30-10-2013 12:06:52', 'dd-mm-yyyy hh24:mi:ss'), '无障碍台盆', '', '鹏宇成公司网', 'test', 62694, 'test', null, null);
insert into tab_page_data (DATA_ID, PAGE_ID, PARENT_ID, SYSTEM_ID, EXTENSION, CREATEDTIME, TITLE, AUTHORS, DOMAIN, CONTENT, CONTENTLENGTH, SUMMARY, CLASSIFY_DIR_ID, FLAG)
values ('62cfc3e5aec21b533eac4358d39cab56', 0, 0, 1, 'html', to_date('30-10-2013 12:27:58', 'dd-mm-yyyy hh24:mi:ss'), 'Autodesk产品服务详细介绍', '', '鹏宇成MIS管理系统', 'test', 6889, 'test', null, null);
tab_page_relation 三条
insert into tab_page_relation (UNIQUE_ID, DATA_ID, NICK_ID, URL, UPDATE_TIME, INSERT_TIME, LAST_CRAWLER_TIME)
values ('00244IUVNKIG0FMKJIO6SO8T1R100010', 'b3764d3494655859cd0de9309f3376d6', 10001, 'http://mis.pyc.com.cn/report_forms/knowledge_info.aspx?knid=1109&p=17&y=1&id=', to_date('30-10-2013 11:55:28', 'dd-mm-yyyy hh24:mi:ss'), to_date('30-10-2013 11:55:28', 'dd-mm-yyyy hh24:mi:ss'), to_date('30-10-2013 11:55:28', 'dd-mm-yyyy hh24:mi:ss'));
insert into tab_page_relation (UNIQUE_ID, DATA_ID, NICK_ID, URL, UPDATE_TIME, INSERT_TIME, LAST_CRAWLER_TIME)
values ('00014HT98UKDD6IVHOR5VVLSAF100010', '0f8342f81e3931ce8667f001409aef03', 10001, 'http://mis.pyc.com.cn/report_forms/knowledge_info.aspx?knid=332&p=2&y=1&id=1', to_date('30-10-2013 11:59:03', 'dd-mm-yyyy hh24:mi:ss'), to_date('30-10-2013 11:59:03', 'dd-mm-yyyy hh24:mi:ss'), to_date('30-10-2013 11:59:03', 'dd-mm-yyyy hh24:mi:ss'));
insert into tab_page_relation (UNIQUE_ID, DATA_ID, NICK_ID, URL, UPDATE_TIME, INSERT_TIME, LAST_CRAWLER_TIME)
values ('0012RS6G1LNPOJV7SQBUSI2LLF100010', '6fd0b3d8bddf94a4c59a467a893eaab7', 10000, 'http://www1.pyc.com.cn/Application/Family.aspx?pid=319', to_date('30-10-2013 12:06:52', 'dd-mm-yyyy hh24:mi:ss'), to_date('30-10-2013 12:06:52', 'dd-mm-yyyy hh24:mi:ss'), to_date('30-10-2013 12:06:52', 'dd-mm-yyyy hh24:mi:ss'));
创建历史记录表
CREATE TABLE TAB_PAGE_DATA_HISTORY AS SELECT * FROM tab_page_data WHERE 1=2;
在plsql下 创建存储过程
PRO_PAGE_DATA_CLEAR
CREATE OR REPLACE PROCEDURE PRO_PAGE_DATA_CLEAR IS
DATAID NUMBER(32);
BEGIN
INSERT INTO TAB_PAGE_DATA_HISTORY
SELECT *
FROM TAB_PAGE_DATA TPDD
WHERE TPDD.DATA_ID IN
(SELECT TPD.DATA_ID
FROM TAB_PAGE_DATA TPD
WHERE TPD.DATA_ID NOT IN
(SELECT DISTINCT TPR.DATA_ID FROM TAB_PAGE_RELATION TPR));
COMMIT;
END PRO_PAGE_DATA_CLEAR;
在oracle服务器本机sqlplus / as sysdba 本机登陆 登陆用户 conn pyc3/pyc3
创建一个job,名称为job2013 ;作用是每分钟(60×24=1440)执行一次存储过程PRO_PAGE_DATA_CLEAR
SQL> variable job2013 number;
SQL> begin
2 dbms_job.submit(:job2013,'PRO_PAGE_DATA_CLEAR;',sysdate,'sysdate+1/1440');
3 end;
4 /
PL/SQL 过程已成功完成。
运行job2013
SQL> begin
2 dbms_job.run(:job2013);
3 end;
4 /
PL/SQL 过程已成功完成。
查看运行效果 。
select * from tab_page_data_history;
停止job
SQL> begin
2 dbms_job.remove(:job2013);
3 end;
4 /
===========================================
6,查询jobs的相关视图
select job,last_date,last_sec,broken,failures,interval, what from dba_jobs
详解 dba_jobs中几个比较重要的字段
job: 指的是job的id号。比如上面的 41
failures:job执行的时候失败次数,如果超过了15次,那么broken列将被标为Y,以后就不会运行该job了
broken:默认为N,如果为Y,意味着不再执行该job!
interval:执行job的间隔时间。
what:该job的实际工作。
二:job 的相关知识:
1,DBA_JOBS
DBA_JOBS
===========================================
字段(列) 类型 描述
JOB NUMBER 任务的唯一标示号
LOG_USER VARCHAR2(30) 提交任务的用户
PRIV_USER VARCHAR2(30) 赋予任务权限的用户
SCHEMA_USER VARCHAR2(30) 对任务作语法分析的用户模式
LAST_DATE DATE 最后一次成功运行任务的时间
LAST_SEC VARCHAR2(8) 如HH24:MM:SS格式的last_date日期的小时,分钟和秒
THIS_DATE DATE 正在运行任务的开始时间,如果没有运行任务则为null
THIS_SEC VARCHAR2(8) 如HH24:MM:SS格式的this_date日期的小时,分钟和秒
NEXT_DATE DATE 下一次定时运行任务的时间
NEXT_SEC VARCHAR2(8) 如HH24:MM:SS格式的next_date日期的小时,分钟和秒
TOTAL_TIME NUMBER 该任务运行所需要的总时间,单位为秒
BROKEN VARCHAR2(1) 标志参数,Y标示任务中断,以后不会运行
INTERVAL VARCHAR2(200) 用于计算下一运行时间的表达式
FAILURES NUMBER 任务运行连续没有成功的次数
WHAT VARCHAR2(2000) 执行任务的PL/SQL块
CURRENT_SESSION_LABEL RAW MLSLABEL 该任务的信任Oracle会话符
CLEARANCE_HI RAW MLSLABEL 该任务可信任的Oracle最大间隙
CLEARANCE_LO RAW MLSLABEL 该任务可信任的Oracle最小间隙
NLS_ENV VARCHAR2(2000) 任务运行的NLS会话设置
MISC_ENV RAW(32) 任务运行的其他一些会话参数
--------------------------
2,描述 INTERVAL参数值
每天午夜12点: 'TRUNC(SYSDATE + 1)'
每天早上8点30分: 'TRUNC(SYSDATE + 1) + (8*60+30)/(24*60)'
每星期二中午12点: 'NEXT_DAY(TRUNC(SYSDATE ), ''TUESDAY'' ) + 12/24'
每个月第一天的午夜12点: 'TRUNC(LAST_DAY(SYSDATE ) + 1)'
每个季度最后一天的晚上11点: 'TRUNC(ADD_MONTHS(SYSDATE + 2/24, 3 ), 'Q' ) -1/24'
每星期六和日早上6点10分: 'TRUNC(LEAST(NEXT_DAY(SYSDATE, ''SATURDAY"), NEXT_DAY(SYSDATE, "SUNDAY"))) + (6×60+10)/(24×60)'
每月25号00:00执行: 'TRUNC(LAST_DAY(SYSDATE ) + 25)'
--------------------------
1:每分钟执行
Interval => TRUNC(sysdate,'mi') + 1/ (24*60)
或
Interval => sysdate+1/1440
2:每天定时执行
例如:每天的凌晨1点执行
Interval => TRUNC(sysdate) + 1 +1/ (24)
3:每周定时执行
例如:每周一凌晨1点执行
Interval => TRUNC(next_day(sysdate,'星期一'))+1/24
4:每月定时执行
例如:每月1日凌晨1点执行
Interval =>TRUNC(LAST_DAY(SYSDATE))+1+1/24
5:每季度定时执行
例如每季度的第一天凌晨1点执行
Interval => TRUNC(ADD_MONTHS(SYSDATE,3),'Q') + 1/24
6:每半年定时执行
例如:每年7月1日和1月1日凌晨1点
Interval => ADD_MONTHS(trunc(sysdate,'yyyy'),6)+1/24
7:每年定时执行
例如:每年1月1日凌晨1点执行
Interval =>ADD_MONTHS(trunc(sysdate,'yyyy'),12)+1/24
3. 查看相关job信息
相关视图
dba_jobs
all_jobs
user_jobs
dba_jobs_running 包含正在运行job相关信息