批处理流程
SpringBatch的程序运行大纲:
JobLauncher:作业调度器,作业启动的主要入口。
Job:作业,需要执行的逻辑。
Step:作业步骤,一个Job作业由一个或者多个step步骤组成,完成所有的step操作,一个Job作业才算完成。
ItemReader:Step执行过程中,数据输入。可以从数据源(数据库、文件系统、队列等)中读取Item(数据记录)。
ItemWriter:Step执行过程中,数据输出。将Item(数据记录)写入到数据源(数据库、文件系统、队列等)。
ItemProcessor:Item数据加工逻辑(输入),比如:数据清洗、数据转换、数据过滤、数据校验等。
JobRepository:保存Job或者检索Job的信息,SpringBatch需要持久化Job(可以选择数据库/内存),JobRepository就是持久化的接口。
案例:基于H2内存数据库的SpringBatch
需求:打印一个Hello SpringBatch 不带读/写/处理
步骤一:导入依赖
<parent> <artifactId>spring-boot-starter-parent</artifactId> <groupId>org.springframework.boot</groupId> <version>2.7.3</version> </parent> <dependencies> <dependency> <groupId>org.springframework.boot</groupId> <artifactId>spring-boot-starter</artifactId> </dependency> <dependency> <groupId>org.springframework.boot</groupId> <artifactId>spring-boot-starter-batch</artifactId> </dependency> <dependency> <groupId>org.springframework.boot</groupId> <artifactId>spring-boot-starter-web</artifactId> </dependency> <dependency> <groupId>com.h2database</groupId> <artifactId>h2</artifactId> <scope>runtime</scope> </dependency> <dependency> <groupId>org.projectlombok</groupId> <artifactId>lombok</artifactId> <optional>true</optional> </dependency> <dependency> <groupId>org.springframework.boot</groupId> <artifactId>spring-boot-starter-test</artifactId> <scope>test</scope> </dependency> </dependencies>
具体代码:
package com.pjk.springBatch.demo_1; import org.springframework.batch.core.Job; import org.springframework.batch.core.Step; import org.springframework.batch.core.StepContribution; import org.springframework.batch.core.configuration.annotation.EnableBatchProcessing; import org.springframework.batch.core.configuration.annotation.JobBuilderFactory; import org.springframework.batch.core.configuration.annotation.StepBuilderFactory; import org.springframework.batch.core.launch.JobLauncher; import org.springframework.batch.core.scope.context.ChunkContext; import org.springframework.batch.core.step.tasklet.Tasklet; import org.springframework.batch.repeat.RepeatStatus; import org.springframework.beans.factory.annotation.Autowired; import org.springframework.boot.SpringApplication; import org.springframework.boot.autoconfigure.SpringBootApplication; import org.springframework.context.annotation.Bean; @EnableBatchProcessing//启动SpringBatch的注解 @SpringBootApplication//springboot项目的启动注解 public class HelloJob { @Autowired private JobLauncher jobLauncher;//作业启动器 @Autowired private JobBuilderFactory jobBuilderFactory;//job工厂--用于构建job对象 @Autowired private StepBuilderFactory stepBuilderFactory;//用于构建step对象 //构建一个step对象的执行任务(逻辑对象) @Bean public Tasklet tasklet() { return new Tasklet() { @Override public RepeatStatus execute(StepContribution stepContribution, ChunkContext chunkContext) throws Exception { //要执行的逻辑 System.out.println("hello springBatch!"); return RepeatStatus.FINISHED;//执行完了 } }; } //构建一个step对象 @Bean public Step steoOne() { //tasklet 是step的执行逻辑 类似与 Thread里的runable接口 不太懂 return stepBuilderFactory.get("stepOne").tasklet(tasklet()) .build(); } //构造一个 job 对象 @Bean public Job job() { return jobBuilderFactory.get("hello-job").start(steoOne()).build(); } public static void main(String[] args) { SpringApplication.run(HelloJob.class, args); } }
配置文件:application.propertites
# 应用服务 WEB 访问端口 server.port=8080 #************H2 Begin**************** #创建表的MySql语句位置 #spring.datasource.schema=classpath:schema.sql ##插入数据的MySql语句的位置 #spring.datasource.data=classpath:data.sql #remote visit spring.h2.console.settings.web-allow-others=true #console url。Spring启动后,可以访问 http://127.0.0.1:8080/h2-console 查看数据库 spring.h2.console.path=/h2-console #default true。咱也可以用命令行访问好数据库,感兴趣的同学点这个链接 http://www.h2database.com/html/tutorial.html?highlight=Mac&search=mac#firstFound spring.h2.console.enabled=true spring.h2.console.settings.trace=true #指定数据库的种类,这里 file意思是文件型数据库 spring.datasource.url=jdbc:h2:file:~/test #用户名密码不需要改,都是临时值 spring.datasource.username=san spring.datasource.password= #指定Driver,有了Driver才能访问数据库 spring.datasource.driver-class-name=org.h2.Driver spring.batch.jdbc.initialize-schema=ALWAYS