这是一个非常大的问题,我之前已经进行了很长时间和长时间的讨论,而且没有一个硬性规定 . 我并不认为自己是ETL专家,但我已熟悉ETL领域的一些大枪,如Datastage等 . 虽然很容易同意Java Batch处理在很多方面类似于ETL(您对ETL的断言与读取/处理/写入类似是合理的)我认为它通常用于BI场景中 . 事实上,如果你看一下Jasper网站,它就是它们完整BI堆栈的一个组成部分,而且许多其他ETL提供程序是相同的 . 我看到它在数据仓库场景中使用了很多,并且在那里工作得很好 . 大量移动和数据转换是它闪耀的地方 . 我在哪里看到的问题是在尝试在两者之间应用复杂的业务逻辑时 . 我不想在这里开始任何宗教辩论,这只是我的经历 . ETL工具就是这样的工具 . 它在某些方面几乎归结为打包与定制,这是一个我根本不想进入的辩论 . 但是,如果您有一个充满Java开发人员的公司,并且许多业务逻辑已经用Java编写用于其他应用程序样式(如Web或集成),那么将批处理应用程序样式保持在相同的技术中是很有意义的 . ETL工具在可用性方面已经走了很长的路,但它们仍然是相当大的复杂工具,学习有效地使用它们需要一些时间 . 我意识到学习Spring Batch的时间并不完全是零,但我认为很容易同意让Java人员加快Java框架的速度比教他们使用工具更好,我们倾向于喜欢编码 . 由于ETL通常不是免费的,因此成本问题也经常出现 . 我知道有一些开源实现,有些是Java,但我没有在大型 生产环境 环境中使用它们的经验,所以我无法发表评论 . 这就是我愿意参加一个论坛帖子 . 我认为ETL肯定是工具箱中的另一个工具,在某些情况下可能与自定义批处理解决方案重叠 . 决定使用哪个取决于关于你的特定场景的很多因素 .
etl spring_spring 批量Vs ETL过程[关闭]
最新推荐文章于 2024-06-07 10:55:50 发布