从头认识SpringBatch批处理框架---JobRepository数据库存储元数据并分析存储元数据表

JobRepository存储执行期的元数据,提供两种默认实现,一种是存放在内存中,默认实现类为:MapJobRepositoryFactoryBean。在xml中的配置如下:

<bean id="jobRepository"   
        class="org.springframework.batch.core.repository.support.MapJobRepositoryFactoryBean">  
    </bean> 

另一种是存入数据库中,可以随时监控批处理Job的执行状态,查看Job执行结果是成功还是失败,并且使得在Job失败的情况下重新启动Job成为可能。具体配置如下:

<?xml version="1.0" encoding="UTF-8"?>  
<bean:beans xmlns="http://www.springframework.org/schema/batch"      
    xmlns:bean="http://www.springframework.org/schema/beans"   
    xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"      
    xmlns:p="http://www.springframework.org/schema/p"   
    xmlns:tx="http://www.springframework.org/schema/tx"      
    xmlns:aop="http://www.springframework.org/schema/aop"   
    xmlns:context="http://www.springframework.org/schema/context"      
    xsi:schemaLocation="http://www.springframework.org/schema/beans   
    http://www.springframework.org/schema/beans/spring-beans-3.0.xsd    
    http://www.springframework.org/schema/tx   
    http://www.springframework.org/schema/tx/spring-tx-3.0.xsd    
    http://www.springframework.org/schema/aop   
    http://www.springframework.org/schema/aop/spring-aop-3.0.xsd    
    http://www.springframework.org/schema/context   
    http://www.springframework.org/schema/context/spring-context-2.5.xsd  
    http://www.springframework.org/schema/batch   
    http://www.springframework.org/schema/batch/spring-batch-2.2.xsd">  
      
    <!-- 作业仓库 -->  
    <job-repository id="jobRepository" data-source="dataSource"  
        transaction-manager="transactionManager" isolation-level-for-create="SERIALIZABLE"  
        table-prefix="BATCH_" max-varchar-length="1000"  
    />  
      
    <!-- 作业调度器 -->  
    <bean:bean id="jobLauncher"   
        class="org.springframework.batch.core.launch.support.SimpleJobLauncher">  
        <bean:property name="jobRepository" ref="jobRepository"/>  
    </bean:bean>  
      
    <!-- 事务管理器 -->  
    <bean:bean id="transactionManager" class="org.springframework.jdbc.datasource.DataSourceTransactionManager">  
        <bean:property name="dataSource" ref="dataSource" />  
    </bean:bean>  
      
    <!-- 数据源 -->  
    <bean:bean id="dataSource" class="org.springframework.jdbc.datasource.DriverManagerDataSource">  
        <bean:property name="driverClassName">  
            <bean:value>com.mysql.jdbc.Driver</bean:value>  
        </bean:property>  
        <bean:property name="url">  
            <bean:value>jdbc:mysql://localhost:3306/mydatabase</bean:value>  
        </bean:property>  
        <bean:property name="username" value="root"></bean:property>  
        <bean:property name="password" value="wbw123456"></bean:property>  
    </bean:bean>  
</bean:beans>  


注意:在使用数据库的仓库时,需要初始化数据库表,数据库表脚本位置放在org\springframework\batch\spring-batch-core\3.0.6.RELEASE\spring-batch-core-3.0.6.RELEASE.jar目录下,并且针对不同的数据库提供了不同的数据库脚本

 

在这里我们选用schema-mysql.sql 具体的建表语句如下:

-- Autogenerated: do not edit this file  
  
CREATE TABLE BATCH_JOB_INSTANCE  (  
    JOB_INSTANCE_ID BIGINT  NOT NULL PRIMARY KEY ,  
    VERSION BIGINT ,  
    JOB_NAME VARCHAR(100) NOT NULL,  
    JOB_KEY VARCHAR(32) NOT NULL,  
    constraint JOB_INST_UN unique (JOB_NAME, JOB_KEY)  
) ENGINE=InnoDB;  
  
CREATE TABLE BATCH_JOB_EXECUTION  (  
    JOB_EXECUTION_ID BIGINT  NOT NULL PRIMARY KEY ,  
    VERSION BIGINT  ,  
    JOB_INSTANCE_ID BIGINT NOT NULL,  
    CREATE_TIME DATETIME NOT NULL,  
    START_TIME DATETIME DEFAULT NULL ,  
    END_TIME DATETIME DEFAULT NULL ,  
    STATUS VARCHAR(10) ,  
    EXIT_CODE VARCHAR(2500) ,  
    EXIT_MESSAGE VARCHAR(2500) ,  
    LAST_UPDATED DATETIME,  
    JOB_CONFIGURATION_LOCATION VARCHAR(2500) NULL,  
    constraint JOB_INST_EXEC_FK foreign key (JOB_INSTANCE_ID)  
    references BATCH_JOB_INSTANCE(JOB_INSTANCE_ID)  
) ENGINE=InnoDB;  
  
CREATE TABLE BATCH_JOB_EXECUTION_PARAMS  (  
    JOB_EXECUTION_ID BIGINT NOT NULL ,  
    TYPE_CD VARCHAR(6) NOT NULL ,  
    KEY_NAME VARCHAR(100) NOT NULL ,  
    STRING_VAL VARCHAR(250) ,  
    DATE_VAL DATETIME DEFAULT NULL ,  
    LONG_VAL BIGINT ,  
    DOUBLE_VAL DOUBLE PRECISION ,  
    IDENTIFYING CHAR(1) NOT NULL ,  
    constraint JOB_EXEC_PARAMS_FK foreign key (JOB_EXECUTION_ID)  
    references BATCH_JOB_EXECUTION(JOB_EXECUTION_ID)  
) ENGINE=InnoDB;  
  
CREATE TABLE BATCH_STEP_EXECUTION  (  
    STEP_EXECUTION_ID BIGINT  NOT NULL PRIMARY KEY ,  
    VERSION BIGINT NOT NULL,  
    STEP_NAME VARCHAR(100) NOT NULL,  
    JOB_EXECUTION_ID BIGINT NOT NULL,  
    START_TIME DATETIME NOT NULL ,  
    END_TIME DATETIME DEFAULT NULL ,  
    STATUS VARCHAR(10) ,  
    COMMIT_COUNT BIGINT ,  
    READ_COUNT BIGINT ,  
    FILTER_COUNT BIGINT ,  
    WRITE_COUNT BIGINT ,  
    READ_SKIP_COUNT BIGINT ,  
    WRITE_SKIP_COUNT BIGINT ,  
    PROCESS_SKIP_COUNT BIGINT ,  
    ROLLBACK_COUNT BIGINT ,  
    EXIT_CODE VARCHAR(2500) ,  
    EXIT_MESSAGE VARCHAR(2500) ,  
    LAST_UPDATED DATETIME,  
    constraint JOB_EXEC_STEP_FK foreign key (JOB_EXECUTION_ID)  
    references BATCH_JOB_EXECUTION(JOB_EXECUTION_ID)  
) ENGINE=InnoDB;  
  
CREATE TABLE BATCH_STEP_EXECUTION_CONTEXT  (  
    STEP_EXECUTION_ID BIGINT NOT NULL PRIMARY KEY,  
    SHORT_CONTEXT VARCHAR(2500) NOT NULL,  
    SERIALIZED_CONTEXT TEXT ,  
    constraint STEP_EXEC_CTX_FK foreign key (STEP_EXECUTION_ID)  
    references BATCH_STEP_EXECUTION(STEP_EXECUTION_ID)  
) ENGINE=InnoDB;  
  
CREATE TABLE BATCH_JOB_EXECUTION_CONTEXT  (  
    JOB_EXECUTION_ID BIGINT NOT NULL PRIMARY KEY,  
    SHORT_CONTEXT VARCHAR(2500) NOT NULL,  
    SERIALIZED_CONTEXT TEXT ,  
    constraint JOB_EXEC_CTX_FK foreign key (JOB_EXECUTION_ID)  
    references BATCH_JOB_EXECUTION(JOB_EXECUTION_ID)  
) ENGINE=InnoDB;  
  
CREATE TABLE BATCH_STEP_EXECUTION_SEQ (  
    ID BIGINT NOT NULL,  
    UNIQUE_KEY CHAR(1) NOT NULL,  
    constraint UNIQUE_KEY_UN unique (UNIQUE_KEY)  
) ENGINE=InnoDB;  
  
INSERT INTO BATCH_STEP_EXECUTION_SEQ (ID, UNIQUE_KEY) select * from (select 0 as ID, '0' as UNIQUE_KEY) as tmp where not exists(select * from BATCH_STEP_EXECUTION_SEQ);  
  
CREATE TABLE BATCH_JOB_EXECUTION_SEQ (  
    ID BIGINT NOT NULL,  
    UNIQUE_KEY CHAR(1) NOT NULL,  
    constraint UNIQUE_KEY_UN unique (UNIQUE_KEY)  
) ENGINE=InnoDB;  
  
INSERT INTO BATCH_JOB_EXECUTION_SEQ (ID, UNIQUE_KEY) select * from (select 0 as ID, '0' as UNIQUE_KEY) as tmp where not exists(select * from BATCH_JOB_EXECUTION_SEQ);  
  
CREATE TABLE BATCH_JOB_SEQ (  
    ID BIGINT NOT NULL,  
    UNIQUE_KEY CHAR(1) NOT NULL,  
    constraint UNIQUE_KEY_UN unique (UNIQUE_KEY)  
) ENGINE=InnoDB;  
  
INSERT INTO BATCH_JOB_SEQ (ID, UNIQUE_KEY) select * from (select 0 as ID, '0' as UNIQUE_KEY) as tmp where not exists(select * from BATCH_JOB_SEQ);  

SpringBatch框架进行元数据的管理共有九张表:

 

下面分别对9张表的数据结构讲解哈:

BATCH_JOB_INSTANCE(作业实例表,存放JOB的实例信息)

字段名称字段 类型
字段说明
 
JOB_INSTANCE_IDbigint  主键 ,作业实例编号,根据BATCH_JOB_SEQ自动生成
VERSION      bigint 版本号
JOB_NAME
varchar
 
作业名称 即在配置文件定义的JobId字段内容
JOB_KEYvarchar作业标识,根据作业参数序列化生成的标识,需要注意通过JOB_NAME+JOB_KEY能够唯一区分一个作业实例


注意:JOB_KEY------如果同一个Job,则JOB_KEY一定不能相同,籍作业参数不能相同,如果不是同一个Job,JOB_KEY可以相同,也就是作业参数可以相同

BATCH_JOB_EXECUTION_PARAMS(作业参数表,用于存放每个JOB执行的时候的参数信息,即对于的JOB实例)

字段名称字段类型字段说明
JOB_EXECUTION_IDbigint外键ID,作业执行器ID编号,一个作业实例可能又会多行参数记录
TYPE_CDvarchar参数的类型,总共有四种 String、Date、Double、Long
KEY_NAMEvarchar参数的名字
STRING_VALvarchar参数如果是String,就存放String类型的参数值
DATE_VALdatetime参数如果是Date,就存放Date类型的参数值
LONG_VALbigint参数如果是Long,就存放Long类型的参数值
DOUBLE_VALdouble参数如果是Double,就存放Double类型的参数值

IDENTIFYING                           char              用于标识作业参数是否标识作业实例

------------------------------------------------------------------------------------------------------------------------------------------------------------------

BATCH_JOB_EXECUTION(作业执行器表,存放当前作业的执行信息,创建时间、执行时间、执行结束时间、执行状态、执行Job实例等信息)

字段名称字段类型字段说明
JOB_EXECUTION_IDbigint主键
VERSIONbigint版本号
JOB_INSTANCE_IDbigint作业实例ID
CREATE_TIMEdatetime作业执行器创建时间
START_TIMEdatetime作业执行器开始执行时间
END_TIMEdatetime作业执行器结束时间 
STATUSvarchar作业执行器执行的状态:COMPLETED、FAILED、STARTING、UNKNOW等
EXIT_CODEvarchar作业执行器退出代码 如:UNKNOW、EXECUTING、COMPLETED等
EXIT_MESSAGEvarchar作业执行器退出信息,通常存放异常信息
LAST_UPDATEDdatetime本条记录上次更新时间
JOB_CONFIGURATION_LOCATIONvarchar作业配置文件的位置
   


运用BATCH_JOB_INSTANCE和BATCH_JOB_EXECUTION两张表联合查询Job信息

 

SELECT  
    bi.JOB_NAME,bi.JOB_KEY,be.CREATE_TIME,be.START_TIME,be.END_TIME,be.`STATUS`  
FROM  
    batch_job_instance bi  
LEFT JOIN batch_job_execution be ON bi.JOB_INSTANCE_ID = be.JOB_INSTANCE_ID  
where bi.JOB_NAME='billJob'  

BATCH_JOB_EXECUTION_CONTENXT(作业执行上下文表,存放上下文信息)

字段名称字段类型字段说明
JOB_EXECUTION_IDbigint外键ID,作业执行器编号
SHORT_CONTEXTvarchar作业执行器上下文字符串格式
SERIALIZED_CONTEXTtext序列化的作业执行上下文


BATCH_JOB_EXECUTION_SEQ表(用于BATCH_JOB_EXECUTION和BATCH_JOB_EXECUTION_CONTEXT提供主键生成)

 

BATCH_JOB_SEQ表(用于BATCH_JOB_INSTNCE和BATCH_JOB_EXECUTION_PARAMS提供主键生成)

BATCH_STEP_EXECUTION(作业步执行器,存放每个Step执行器的信息:开始时间、执行完成时间、读/写次数等)

字段名称字段类型字段说明
STEP_EXECUTION_IDbigint 主键
VERSIONbigint版本
STEP_NAMEvarchar作业步的名称
JOB_EXECUTION_IDbigint作业执行器ID
START_TIMEdatetime作业步执行器执行开始时间
END_TIMEdatetime作业步执行器执行结束时间
STATUSvarchar作业步执行器执行状态
 COMPLETED, STARTING, STARTED, STOPPING, STOPPED, FAILED, ABANDONED, UNKNOWN
 存在于org.springframework.batch.core.BatchStatus
COMMIT_COUNTbigint事务提交次数
READ_COUNTbigint读数据次数
FILTER_COUNTbigint过滤掉的数据次数
WRITE_COUNTbigint写数据次数
READ_SKIP_COUNTbigint读数据跳过的次数
WRITE_SKIP_COUNTbigint写数据跳过的次数
PROCESS_SKIP_COUNTbigint处理数据跳过的次数
ROLLBACK_COUNTbigint事务回滚的次数
EXIT_CODEvarchar作业步执行器退出编码,状态码存在于org.springframework.batch.core.ExitStauts
EXIT_MESSAGEvarchar作业步执行器退出描述,一般是异常信息
LAST_UPDATEDdatetime本条记录上次更新时间
   


BATCH_STEP_EXECUTION_CONTEXT(作业步执行器上下文,存放作业步执行的上下文信息)

字段名称字段类型字段说明
STEP_EXECUTION_IDbigint作业步执行器ID
SHORT_CONTEXTvarchar作业步执行器上下文字符串格式
SERIALIZED_CONTEXTtext序列化作业步执行器上下文

BATCH_STEP_EXECUTION_SEQ(用于BATCH_STEP_EXECUTION和BATCH_STEP_EXECUTION_CONTEXT提供主键)

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值