既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上大数据知识点,真正体系化!
由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新
二、SeaTunnel 的使用场景及其特点
1、使用场景
- 海量数据ETL
- 海量数据聚合
- 多源数据处理
2、特点
- 简单易用,灵活配置,无需开发
- 实时流式处理
- 高性能
- 海量数据处理能力
- 模块化和插件化,易于扩展
- 支持利用SQL做数据处理和聚合
- Spark Structured Streaming
- 支持Spark 2.x
三、SeaTunnel 的工作流程
SeaTunnel 是在 Spark 和 Flink 的基础上做了一层包装,其工作流程图:
其中 SeaTunnel 的引擎:
- Source:数据源输入
- Transform:数据处理
- Sink:结果输出
SeaTunnel 的基本思想是控制反转的设计模式,在我们日常使用中,主要就是编辑配置文件,再指定配置文件启动 SeaTunnel,将其转换为具体的Spark或Flink任务。
四、Linux 下安装 SeaTunel 步骤
1、下载安装包
官网下载地址:Apache SeaTunnel
2、上传 Linux 服务器后,解压缩
命令: tar -zxvf apache-seatunnel-2.3.2-bin.tar.gz
3、下载连接器插件
从 seatunnel v2.2.0开始,二进制包默认不提供连接器依赖,所以第一次使用时,我们需要下载连接器。
具体说明位置在:/home/seaTunnel/apache-seatunnel-2.3.2/config/plugin_config
大家一定要挑选自己需要的包下载!!!不用的注释掉!!!
开始下载:./bin/install-plugin.sh
下载的好慢,随便截两张图……
下载的jar包会存放到:/home/seaTunnel/apache-seatunnel-2.3.2/connectors/seatunnel/
五、Linux 下安装 Flink
1、下载安装包
官网下载地址:Downloads | Apache Flink
2、上传 Linux 服务器,解压缩
命令:tar -zxvf flink-1.18.0-bin-scala_2.12.tgz
3、启动时报错:
**【解决方法】**更换启动方式:
❤️参考:Flink系列:解决/bin/config.sh: line 32: syntax error near unexpected token
六、SeaTunnel 实现 MySQL 跨数据库的表数据同步
1、配置 SeaTunnel 的 Flink 引擎
2、下载 MySQL 驱动jar包
(1)地址:https://repo1.maven.org/maven2/mysql/mysql-connector-java/8.0.30/mysql-connector-java-8.0.30.jar
(2)将 jar 包放到 ${SEATUNNEL_HOME}/lib 下
否则后面运行 Seatunnel 报错:
3、已知 MySQL A 库中有表 A1,在 B 库中创建表 B1,结构与 A1 相同
4、在 ${SEATUNNEL_HOME}/conf 下创建配置文件
既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上大数据知识点,真正体系化!
由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新
小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上大数据知识点,真正体系化!**
由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新