Spring-batch restart重拉机制

最新推荐文章于 2023-06-10 17:21:53 发布

原创最新推荐文章于 2023-06-10 17:21:53 发布

· 785 阅读

0 ·

版权

本文探讨了Spring Batch中Reader-Processor-Writer模式下不同commit-interval设置对数据处理的影响，尤其是在遇到异常重启时的数据一致性问题。通过实例分析，解释了如何避免数据重复处理，确保批处理任务的正确性和效率。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

对于Spring-batch中的Reader-processor-writer模式，例如

<batch:step id="test-01">
    <batch:tasklet>
        <batch:chunk reader="testR" processor="testP" commit-interval="1">
            <batch:writer>
                <bean class="com.test.TestW">
            <batch:writer>
        <batch:chunk>
    <batch:tasklet>
<batch:step>

如果reader读取为两条数据，第二条数据异常断批，由于commint-interval为1，第一条会执行processor和writer，且成功commit，第二条Processor会回滚，writer不会执行。当restart时，会从第二条数据重新处理，第一条已处理不会再重复处理。

如果此时将

<batch:chunk reader="testR" processor="testP" commit-interval="1">

改为

<batch:chunk reader="testR" processor="testP" commit-interval="2">

这时，reader读取两条数据，第二条数据异常断批，则两条数据都会回滚掉，restart时会重新执行。

以上，目前已验证Reader-processor-writer模式重拉不会导致数据重复处理。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

咦？头发呢？

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

SpringBatch 自定义ItemReader和可重新启动Reader(十五)

境里婆娑

09-21

2407

文章目录一、自定义CustomItemReader二、job 监听器三、配置job四、改造CustomItemReader，发生异常批处理作业从停止的地方重新启动前言：在一些业务场景中，可能现有的reader不符合我们的要求，SpringBatch提供自定义reader，实现ItemReader接口，满足我们业务场景。 SpringBatch其它文章直通车： SpringBatch读单个文...

SpringBatch总结

春风化雨的博客

08-01

891

SpringBatch主要是一个轻量级的大数据量的并行处理(批处理)的框架。作用和Hadoop很相似，不过Hadoop是基于重量级的分布式环境(处理巨量数据)，而SpringBatch是基于轻量的应用框架(处理中小数据)。旨在帮助企业建立健壮、高效的批处理应用。Spring Batch是Spring的一个子项目,使用Java语言并基于Spring框架为基础开发,使得已经使用Spring框架的开发者或者企业更容易访问和利用企业服务。

参与评论您还未登录，请先登录后发表或查看评论

Spring Batch可重启性

最佳 Java 编程

06-04

361

首先，我要非常感谢来自Spring的优秀人员，他们花了无数时间来确保Spring Batch作业的可行性，以及发出重新启动作业的看似神奇的能力！感谢您提供的这个优雅的工具集，它使我们能够浏览大量数据集，同时使我们在跌倒时能够摆脱尘埃！在承认我还有很多东西要学习的同时，我想分享一下有关可重新启动性方面的经验教训。这篇文章将包括如何识别Spring Batch的Step＆Job Exe...

Spring Batch重试(restart)原理

技术札记

07-01

4187

保存元数据的表 batch_job_execution batch_job_execution_context batch_job_execution_params batch_job_execution_seq batch_job_instance batch_job_seq batch_step_execution batch_step_execution_context batch_s...

Spring Batch 作业重启

langfeiyes的博客

02-06

1434

了解Spring Batch 作业启动方式后，接下来一起学习一下Spring Batch作业重启逻辑。

batch spring 重复执行_spring-batch – Spring批处理：重新启动作业,然后自动启动下一个作业...

weixin_30495469的博客

12-24

628

只是根据incomplete-co.de提供的建议回顾实际完成的工作.我创建了一个类似于下面的恢复流程.恢复流程包装了我的实际批处理,仅负责为内部作业提供正确的作业参数.它可以是首次执行时的初始参数,正常执行时的新参数或上次执行失败时的旧参数.incrementer="wrapperRunIdIncrementer"restartable="true">job-parameters-extr...

spring-batch-reference.rar_SpringBatch英文读物pdf_batch

09-24

7. **错误处理（Error Handling）**：Spring Batch 提供了丰富的错误处理机制，包括跳过失败的项、重启失败的步骤以及记录错误日志。这使得开发者可以优雅地处理运行时异常，而不会中断整个作业。 8. **作业重启和...

深入了解 Spring 之 Spring Batch 框架

weixin_70730532的博客

05-27

885

一. 概述 spring batch 是 spring 提供的一个数据处理框架，其功能包括记录/跟踪，事务管理，作业统计，作业重启，跳过和资源管理等。它还提供了更高级的技术服务和功能，通过优化和分区技术实现极高容量和高性能的批处理作业。首先会对其框架所涉及到概念进行讲解，接着对其框架大体原理进行解读。二. 概念及原理 1. JobLa...

Spring Batch 批处理（7） - 异常处理及容错机制

Hello World

03-10

6506

异常处理及重启机制 1.对于chunk类型的Step,spring batch为我们提供了用于管理它的状态 2.状态的管理是通过ItemStream接口来实现的 3.ItemStream接口：（1）open():每一次step执行会调用（2）Update():每一个chunk去执行都会调用（3）Close():所有的chunk执行完毕会调用 ![file](https://imgconv...

spring-boot-reference.pdf

05-18

Spring Boot Documentation 1. About the Documentation 2. Getting Help 3. First Steps 4. Working with Spring Boot 5. Learning about Spring Boot Features 6. Moving to Production 7. Advanced Topics II. ...

batch spring 重复执行_Spring Batch从相同的执行和步骤重新启动未完成的作业

weixin_39687881的博客

12-24

570

我使用以下逻辑重新启动未完成的Spring Batch(例如，在应用程序异常终止之后)作业：public void restartUncompletedJobs() {LOGGER.info("Restarting uncompleted jobs");try {jobRegistry.register(new ReferenceJobFactory(documetPipelineJob));Li...

spring batch job重复多次执行的配置--spring batch restart Step already complete or not restartable

xiaokanfuchen86的博客

03-04

5666

1、问题：spring batch程序运行执行完某个job的时候，job配置的参数不变，程序再次运行的时候，程序提示：spring batch restart Step already complete or not restartable, so no action to execute: 2、原因：Spring Batch需要每次唯一的作业参数来执行。 3、解决：但是在测试阶段，程序需要被一次又一次的执行，我们可以在创建job的时候新增参数来满足要求： 1）Job配置如下： import.

Spring Batch之Step的重试（十九）

qq_21370419的博客

01-06

1733

Step执行期间read、process、write发生的任何异常都会导致Step执行失败，进而导致作业的失败。处理任务阶段发生的异常可以让业务失败，也可以通过Skip的设置，跳过部分异常；但是另外还有部分异常，例如并发对数据库的操作导致的数据库锁的异常和网络不稳定导致的网络连接异常。这类异常的出现可能在下次重新操作的时候消失，数据库锁的异常在下次操作可能正确恢复，网络不能连接的异常可能在重试几次后恢复正常。因此，这些异常出现的时候，不期望作业发生异常，也不期望跳过处理，而是希望通过几次重试...

Spring Batch重复跑批

Nothing is difficult if you put your heart into it

06-16

6113

Spring Batch默认不允许重复跑批，这里我理解的分享一下

batch spring 重复执行_Spring Batch_JOB重启机制

weixin_32052253的博客

01-17

2142

Spring Batch_JOB重启机制在这一篇文章对于restart做了试验，http://my.oschina.net/xinxingegeya/blog/344817在这片文章里，我们只是当job成功时，重启了job，对于job失败后，重启job有什么效果，我没有演示，下面我们就来演示一下当job失败退出后，再重启job有什么效果。先做一个导致job失败的情景，如下的processor...

Spring Batch 如何健壮可重启可追溯 SKIP/RETRY/RESTART策略的应用

gmyzzzzz

11-26

8412

前提：你已经有了一定的Spring基础你已经可以跑动一个简单的Spring batch 的实例参考：Spring-Batch-In-Action 参考：http://www.cnblogs.com/gulvzhe/archive/2011/10/25/2224249.html 先盗几个图 JobLauncher 指定一个 JobRepository JobLauncher 指定一

batch spring 重复执行_Spring Batch批处理

weixin_39554170的博客

01-14

1034

Spring Batch批处理批处理顾名思义是批量处理大量数据，但是这个大量数据又不是特别大的大数据，比Hadoop等要轻量得多，适合企业单位人数薪资计算，财务系统月底一次性结算等常规数据批量处理。Spring Batch是一个用于创建健壮的批处理应用程序的完整框架。您可以创建可重用的函数来处理大量数据或任务，通常称为批量处理。如Spring Batch文档中所述，使用该框架的最常见方案如下：•定...

SpringBatch从入门到实战(四)：步骤控制和作业重启

人不风流枉少年

06-10

1043

start(Step) 后面跟next(jobExecutionDecider())。from都是取作业执行决策器jobExecutionDecider返回的值与on做比较。// 不支持put chunkContext.getStepContext().getJobExecutionContext().put("code", "500");} };} }

Spring Batch入门

章全蛋的博客

07-31

472

文章目录Spring Batch 入门Spring Batch 概述Spring Batch 主要有以下功能：SpringBatch如何实现批处理的官方文档 Spring Batch 入门 Spring Batch 概述 Spring Batch 是一个轻量级的、完善的批处理框架，旨在帮助企业建立健壮的批处理应用。 Spring Batch 是Spring的一个子项目，使用Java语言并基于Spring框架为基础开发，使得已经使用Spring框架的开发者或者企业更容易访问和利用服务。 Spring Ba

讲一下springbatch中的skiplimit

最新发布

03-22

<think>好的，我现在需要为用户讲解Spring Batch中的SkipLimit。首先，我得回忆一下自己对SkipLimit的理解，确保没有记错。然后，思考如何组织语言，让用户能逐步理解这个概念。首先，用户可能已经知道Spring Batch是处理批量任务的框架，但可能对错误处理机制不太清楚。SkipLimit是错误处理的一部分，用于控制允许跳过的异常次数。需要先介绍Skip机制的整体作用，再引出SkipLimit的重要性。接下来，我需要分步骤解释。第一步，说明Skip机制是什么，允许在读取、处理或写入数据时跳过某些错误，继续处理后续的数据。然后，自然过渡到SkipLimit，说明它是用来限制允许跳过的次数，超过这个限制作业就会失败。然后，可能需要举一个例子，比如配置一个SkipLimit为10的情况，当第11次错误发生时，作业停止。这样用户能更直观地理解。还要提到应用场景，比如数据清洗时部分数据格式错误，允许跳过这些错误继续处理其他数据。但需要强调，并非所有异常都应该跳过，只有可恢复的或可忽略的异常才配置跳过。接下来，用户可能会想知道如何配置，需要简要说明在Step配置中使用skipLimit方法，并指定异常类型。例如，在代码中.skip(MyException.class).skipLimit(10)。这里要注意，可能需要解释不同的组件（reader, processor, writer）如何单独设置Skip策略，或者全局设置。另外，需要区分SkipLimit和RetryLimit的不同，避免用户混淆。Retry是重试，而Skip是跳过继续处理，两者可以结合使用。在结构上，先定义，再作用，配置方法，示例，注意事项，最后与其他机制对比。这样用户能逐步深入理解。现在检查是否有遗漏的点，比如SkipLimit的默认值是多少？默认应该是0，也就是不允许跳过，需要显式配置。这点可能需要提到。还要确保术语使用正确，比如Step、Chunk等术语是否正确使用。可能需要提到在基于块的步骤中配置SkipLimit。最后，确认所有解释符合Spring Batch的官方文档，避免给出错误信息。比如，SkipLimit的具体配置方法是否正确，是否需要结合skip和skipLimit方法使用。总结思考步骤后，整理成结构清晰的回答，用中文表达，确保每个部分自然衔接，用户容易理解。</think>在Spring Batch中，**SkipLimit** 是一个关键的错误处理机制，用于控制作业在遇到可跳过的异常时继续执行的容错能力。以下是逐步解析： --- ### 1. Skip机制的作用 Spring Batch的 **Skip机制** 允许在以下场景中跳过错误项，继续处理后续数据： - **读取阶段（Read）**：如文件某行格式错误。 - **处理阶段（Process）**：如业务逻辑校验失败。 - **写入阶段（Write）**：如数据库插入违反约束。通过跳过非致命错误，保证作业的持续执行，而非直接失败。 --- ### 2. SkipLimit的定义 - **SkipLimit** 是一个整数值，表示允许跳过的最大异常次数。 - 当跳过的异常次数超过此限制时，作业会立即失败（抛出 `SkipOverflowException`）。 - 例如：若设置 `skipLimit=5`，第6次跳过时会终止作业。 --- ### 3. 如何配置SkipLimit 在定义作业步骤（`Step`）时，通过链式方法配置： ```java @Bean public Step myStep() { return stepBuilderFactory.get("myStep") .<Input, Output>chunk(10) .reader(reader()) .processor(processor()) .writer(writer()) .faultTolerant() .skip(MyException.class) // 指定跳过的异常类型 .skipLimit(5) // 设置最大跳过次数 .build(); } ``` - **`.skip(异常类)`**：明确哪些异常可跳过（如数据格式错误）。 - **`.skipLimit(n)`**：设置跳过的上限。 --- ### 4. 示例场景假设一个数据清洗作业： - 配置 `skipLimit=3`，跳过 `DataFormatException`。 - 当第4次遇到相同异常时，作业失败。 --- ### 5. 注意事项 - **精确指定异常类型**：避免跳过不应忽略的异常（如系统级错误）。 - **与Retry结合**：可配合重试机制（`retryLimit`）先重试再跳过。 - **性能影响**：频繁跳过可能降低效率，需权衡容错与性能。 --- ### 6. SkipLimit与其他机制对比 | 机制 | 行为 | 适用场景 | |------------|--------------------|------------------------------| | Skip | 跳过当前项继续处理 | 可忽略的局部错误（如单条数据） | | Retry | 重试失败操作 | 临时性错误（如网络波动） | | Restart | 重启整个作业 | 持久化错误后的恢复 | --- ### 总结通过合理配置 **SkipLimit**，可以显著提升Spring Batch作业的健壮性，确保在部分数据处理失败时仍能完成批量任务。核心原则是：**明确可跳过的异常类型，并设置合理的跳过次数阈值**。