全面解析大数据批处理框架Spring Batch,所谓完美解析方案是什么

本文深入探讨了Spring Batch批处理框架,介绍其在批处理业务场景中的应用,包括对账等典型业务,强调其在健壮性、可靠性和扩展性方面的优势。文章详细讲解了Spring Batch的模型与架构,如Job、Step和领域模型,以及如何通过多线程、并行Step、远程Chunking和分区模式实现扩展性。同时,指出了Spring Batch的不足,并提出企业级批处理平台的理想解决方案,包括集成调度框架、增强监控和权限管理功能。
摘要由CSDN通过智能技术生成

如今微服务架构讨论的如火如荼。但在企业架构里除了大量的OLTP交易外,还存在海量的批处理交易。在诸如银行的金融机构中,每天有3-4万笔的批处理作业需要处理。针对OLTP,业界有大量的开源框架、优秀的架构设计给予支撑;但批处理领域的框架确凤毛麟角。是时候和我们一起来了解下批处理的世界哪些优秀的框架和设计了,今天我将以Spring Batch为例,和大家一起探秘批处理的世界。

  • 初识批处理典型场景
  • 探秘领域模型及关键架构
  • 实现作业健壮性与扩展性
  • 批处理框架的不足与增强

批处理典型业务场景

对账是典型的批处理业务处理场景,各个金融机构的往来业务和跨主机系统的业务都会涉及到对账的过程,如大小额支付、银联交易、人行往来、现金管理、POS业务、ATM业务、证券公司资金账户、证券公司与证券结算公司。

13894260-8072dd6e50544cc0
全面解析大数据批处理框架Spring Batch,所谓完美解析方案是什么

下面是某行网银的部分日终跑批实例场景需求。

13894260-7c0bf5a18bc499eb
全面解析大数据批处理框架Spring Batch,所谓完美解析方案是什么

涉及到的需求点包括:

  1. 批量的每个单元都需要错误处理和回退;
  2. 每个单元在不同平台中运行;
  3. 需要有分支选择;
  4. 每个单元需要监控和获取单元处理日志;
  5. 提供多种触发规则,按日期,日历,周期触发;

除此之外典型的批处理适用于如下的业务场景:

  1. 定期提交批处理任务(日终处理)
  2. 并行批处理:并行处理任务
  3. 企业消息驱动处理
  4. 大规模的并行处理
  5. 手动或定时重启
  6. 按顺序处理依赖的任务(可扩展为工作流驱动的批处理)
  7. 部分处理:忽略记录(例如在回滚时)
  8. 完整的批处理事务

与OLTP类型交易不同,批处理作业两个典型特征是批量执行与自动执行(需要无人值守):前者能够处理大批量数据的导入、导出和业务逻辑计算;后者无需人工干预,能够自动化执行批量任务。

13894260-95e62999f2041e3d
全面解析大数据批处理框架Spring Batch,所谓完美解析方案是什么

在关注其基本功能之外,还需要关注如下的几点:

  • 健壮性:不会因为无效数据或错误数据导致程序崩溃;
  • 可靠性:通过跟踪、监控、日志及相关的处理策略(重试、跳过、重启)实现批作业的可靠执行;
  • 扩展性:通过并发或者并行技术实现应用的纵向和横向扩展,满足海量数据处理的性能需求;

苦于业界真的缺少比较好的批处理框架,Spring Batch是业界目前为数不多的优秀批处理框架(Java语言开发),SpringSource和Accenture(埃森哲)共同贡献了智慧。

13894260-f6cc21e0c4835f5b
全面解析大数据批处理框架Spring Batch,所谓完美解析方案是什么

Accenture在批处理架构上有着丰富的工业级别的经验,贡献了之前专用的批处理体系框架(这些框架历经数十年研发和使用,为Spring Batch提供了大量的参考经验)。

SpringSource则有着深刻的技术认知和Spring框架编程模型,同时借鉴了JCL(Job Control Language)和COBOL的语言特性。2013年JSR-352将批处理纳入规范体系,并被包含在了JEE7之中。这意味着,所有的JEE7应用服务器都会有批处理的能力,目前第一个实现此规范的应用服务器是Glassfish 4。当然也可以在Java SE中使用。

13894260-542f6b355e2962ec
全面解析大数据批处理框架Spring Batch,所谓完美解析方案是什么

但最为关键的一点是:JSR-352规范大量借鉴了Spring Batch框架的设计思路,从上图中的核心模型和概念中可以看出究竟,核心的概念模型完全一致。

通过Spring Batch框架可以构建出轻量级的健壮的并行处理应用,支持事务、并发、流程、监控、纵向和横向扩展,提供统一的接口管理和任务管理。

13894260-5e653c2818c62188
全面解析大数据批处理框架Spring Batch,所谓完美解析方案是什么

框架提供了诸如以下的核心能力,让大家更关注在业务处理上。更是提供了如下的丰富能力:

  1. 明确分离批处理的执行环境和应用
  2. 将通用核心的服务以接口形式提供
  3. 提供“开箱即用” 的简单的默认的核心执行接口
  4. 提供Spring框架中配置、自定义、和扩展服务
  5. 所有默认实现的核心服务能够容易的被扩展与替换,不会影响基础层
  6. 提供一个简单的
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值