etl spring_spring 批量Vs ETL过程[关闭]

这是一个非常大的问题,我之前已经进行了很长时间和长时间的讨论,而且没有一个硬性规定 . 我并不认为自己是ETL专家,但我已熟悉ETL领域的一些大枪,如Datastage等 . 虽然很容易同意Java Batch处理在很多方面类似于ETL(您对ETL的断言与读取/处理/写入类似是合理的)我认为它通常用于BI场景中 . 事实上,如果你看一下Jasper网站,它就是它们完整BI堆栈的一个组成部分,而且许多其他ETL提供程序是相同的 . 我看到它在数据仓库场景中使用了很多,并且在那里工作得很好 . 大量移动和数据转换是它闪耀的地方 . 我在哪里看到的问题是在尝试在两者之间应用复杂的业务逻辑时 . 我不想在这里开始任何宗教辩论,这只是我的经历 . ETL工具就是这样的工具 . 它在某些方面几乎归结为打包与定制,这是一个我根本不想进入的辩论 . 但是,如果您有一个充满Java开发人员的公司,并且许多业务逻辑已经用Java编写用于其他应用程序样式(如Web或集成),那么将批处理应用程序样式保持在相同的技术中是很有意义的 . ETL工具在可用性方面已经走了很长的路,但它们仍然是相当大的复杂工具,学习有效地使用它们需要一些时间 . 我意识到学习Spring Batch的时间并不完全是零,但我认为很容易同意让Java人员加快Java框架的速度比教他们使用工具更好,我们倾向于喜欢编码 . 由于ETL通常不是免费的,因此成本问题也经常出现 . 我知道有一些开源实现,有些是Java,但我没有在大型 生产环境 环境中使用它们的经验,所以我无法发表评论 . 这就是我愿意参加一个论坛帖子 . 我认为ETL肯定是工具箱中的另一个工具,在某些情况下可能与自定义批处理解决方案重叠 . 决定使用哪个取决于关于你的特定场景的很多因素 .

Spring框架和大数据平台在处理ETL(提取、转换和加载)过程时有一些区别。下面是它们之间的主要区别: 1. 功能范围:Spring框架是一个轻量级的Java开发框架,主要用于构建企业级应用程序。它提供了一组库和工具,用于简化Java应用程序的开发和管理。而大数据平台是一种用于处理大规模数据集的技术架构,包括分布式存储、计算和处理引擎等组件。 2. 数据规模:Spring框架通常用于处理中小规模的数据集,适合小型企业或中小型应用程序。而大数据平台专注于处理大规模数据集,可以处理海量数据,适合大型企业或需要处理大数据量的应用场景。 3. 数据处理方式:Spring框架主要通过编写代码来实现ETL过程,开发人员需要手动编写代码来完成数据的提取、转换和加载等操作。而大数据平台通常使用分布式计算和处理引擎,如Hadoop、Spark等,可以自动化地进行并行化的数据处理。 4. 生态系统支持:Spring框架具有丰富的生态系统,提供了许多扩展和集成库,可以与其他技术栈无缝集成。而大数据平台也有自己的生态系统,包括各种数据存储和处理技术,如Hadoop、Hive、HBase等。 总的来说,Spring框架更适合处理中小规模的数据集和应用程序,而大数据平台更适合处理大规模的数据集和需要进行并行化处理的场景。选择哪种方式取决于您的具体需求和应用场景。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值