文章目录
1.SeaTunnel 的介绍
1.1 SeaTunnel是什么
SeaTunnel是一个非常易于使用的超高性能分布式数据集成平台,支持海量数据的实时同步。
1.2 使用场景
海量数据同步
海量数据集成
具有海量数据的 ETL
海量数据聚合
多源数据处理
1.3 主要核心思想
利用控制反转的设计模式,SeaTunnel 的日常使用,就是编辑配置文件。编辑好的配置文件由 SeaTunnel 转换为具
体的 Spark 或 Flink 任务。如图所示。
将配置文件翻译成spark或者flink任务。
与之相对应的有datax datax是单点的,只能单机运行。
seatunnel 可以借助spark/flink 做到分布式的。
1.4 SeaTunnel 的工作流程:
2. Seatunnel 安装和使用
2.1 下载seatunnel 和环境配置
wget