自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(329)
  • 收藏
  • 关注

原创 数据同步工具调研选型:SeaTunnel 与 DataX 、Sqoop、Flume、Flink CDC 对比

Apache SeaTunnel 是一个非常易用的超高性能分布式数据集成产品,支持海量数据的离线及实时同步。每天可稳定高效同步万亿级数据,已应用于数百家企业生产,也是首个由国人主导贡献到 Apache 基金会的数据集成顶级项目。SeaTunnel 主要解决数据集成领域的常见问题:数据源多样:常用的数据源有数百种,版本不兼容。随着新技术的出现,出现了更多的数据源。用户很难找到能够全面快速支持这些数据源的工具。复杂同步场景。

2023-11-14 10:54:43 6800 7

原创 SeaTunnel毕业!首个国人主导的数据集成项目成为Apache顶级项目

这是首个由国人主导并贡献到 ASF 的大数据集成领域的顶级项目,这一里程碑的达成标志着 SeaTunnel 在开源软件开发领域的突破,并为其在技术、社区合作和开放创新方面的卓越表现获得了广泛认可。

2023-06-01 14:54:13 4533

原创 (四)收官篇!从分层架构到数据湖仓架构系列:数据服务层和数据应用层及湖仓技术趋势小结

本文为系列文章末篇,将详细剖析数据仓库分层下的数据服务层和数据应用层设计,并对当下湖仓技术以及未来技术趋势进行系统的总结。

2025-11-19 15:56:24 1013

原创 深陷 Sqoop+Canal 困境?中控技术用 SeaTunnel 打造高效数据采集破局方案

核心数据一致性达99.99%、开发效率提升50%、运维成本降低70%——这是中控技术采用 Apache SeaTunnel 构建数据采集框架及相关数据服务体系后的实测成效。

2025-11-19 15:44:51 1717

原创 Apache SeaTunnel 如何将 CDC 数据流转换为 Append-Only 模式?

RowKindExtractor 是 Apache SeaTunnel 的一个转换插件,它能将 CDC 数据流转为 Append-Only 模式,并提取原始 RowKind 信息为新字段。本文将介绍 RowKindExtractor 的核心功能,其在 CDC 数据同步场景下的使用方法,以及配置选项、注意事项及多种应用示例。

2025-11-19 15:10:13 750

原创 结项报告完整版 | Apache SeaTunnel支持metalake开发

接下来是关于Apache SeaTunnel支持metalake开发这一项目的完整报告:

2025-11-12 11:29:38 559

原创 结项报告完整版:Apache SeaTunnel 支持 Flink 引擎 Schema Evolution 功能

接下来是关于在 Flink 引擎上对 Schema Evolution 功能的支持这一项目的完整报告:

2025-11-12 11:06:58 1003

原创 数据采集故障频发,中控技术靠SeaTunnel实现日均TB级核心数据同步任务0出错

崔俊乐,中控技术股份有限公司数据技术主管。拥有多年数据领域工作经验,深度参与集团级数据平台的规划、建设与技术演进。在大数据技术的采集、存储与计算方面具备深厚的架构与实践经验。作为SeaTunnel的深度实践者,他将分享如何利用该工具在企业内部构建高效、统一的数据链路,驱动数据技术方向的落地与创新。

2025-11-05 15:06:49 885

原创 LLM 时代,DataAgent × WhaleTunnel 如何将数据库变更瞬时 “转译” 为洞察?

在软件世界中,用户的形态正在发生变化。

2025-11-05 14:59:26 523

原创 Apache SeaTunnel 支持 Metalake 开发了!避免任务配置敏感信息暴露

在2025年开源之夏活动中,我参与了Apache SeaTunnel项目的开发,目标是解决任务配置中敏感信息暴露的问题。

2025-11-05 14:42:00 1011

原创 (三)从分层架构到数据湖仓架构系列:数据仓库分层之贴源层和数据仓库层设计

本文为系列文章第三篇,详细剖析了数据仓库分层下的贴源层和数据仓库层设计。

2025-10-29 11:04:50 682

原创 数据采集故障频发,中控技术靠SeaTunnel实现日均TB级核心数据同步任务0出错

在企业数字化浪潮中,数据采集早已不是 "能同步就行" 的简单命题——多元异构数据源的割裂、TB 级数据的吞吐压力、跨系统同步的稳定性挑战,正成为多数企业的 "数据顽疾"。而中控技术,这家服务全球 35000 家客户的工业 AI 平台型企业,却用 Apache SeaTunnel 交出了一份惊艳答卷:核心数据同步任务实现 0 故障运行。

2025-10-29 10:45:33 560

原创 Apache SeaTunnel 9 月动态:多模块修复 + 新功能上线,社区贡献成果亮眼

本月,社区 21 位贡献者共同参与了 Apache SeaTunnel 的修复与功能升级,助力数据同步能力提升。

2025-10-29 10:24:35 768

原创 (二)从分层架构到数据湖仓架构:数据仓库分层下的技术架构与举例

本文为系列文章第二篇,详细剖析了数据仓库分层下的技术架构,并附以以示例,希望能够为相关从业者提供数据湖仓设计与实践的系统指引。

2025-10-23 17:58:25 466

原创 预祝 1024!X2SeaTunnel:一场 AI Coding 与数据平台结合的深度实践

(记录时间非常重要,实现代码的时候,是 2025 年 6 月,当下 AI 的发展是每个月一变,到现在 2025 年 10 月,AI Agent 模式已经可以覆盖更加底层,更加复杂的需求了。就像做 SQL 引擎之间的转换的时候,可以考虑用抽象语法树的方式来做。就像 CPU 很快的时候,硬盘就会成为瓶颈,迭代产品目标的过程中,我们每次的功能验证就是瓶颈,所以我们要有意识地加快功能验证的步骤,比如我在开发 X2SeaTunnel 的时候,把编译打包,功能验证,观察等都尽量流程化,脚本化。

2025-10-23 17:30:09 863

原创 速看!用 Apache SeaTunnel 轻松实现数据到 S3 Tables 的快速集成

本文将介绍如何使用 Apache SeaTunnel ,一个高性能、分布式的大规模数据集成工具,通过兼容 Iceberg rest catalog 的实现对接 S3 Tables 实现实时和批量数据集成。

2025-10-23 17:27:41 681

原创 新兴数据湖仓手册·从分层架构到数据湖仓架构(2025):数据仓库分层的概念与设计

数据仓库通过分层结构,使得每层数据都有特定的应用范围和职能,从而保证数据结构层次更清晰,结构更明确。使用时,数据表的层级划分能帮助用户快速理解和定位相关数据,减少查询复杂性。

2025-10-15 17:50:34 1075

原创 最佳实践:基于Apache SeaTunnel从MySQL同步到PostgreSQL

今天和大家分享一个 简单但常见的 MySQL 到 MySQL 数据同步与合并场景案例,这个案例也是我在实际工作中遇到的问题,希望能抛砖引玉,欢迎有更丰富经验的大佬一起分享交流。

2025-10-15 16:15:32 860

原创 AI Coding实现X2SeaTunnel的设计、开发与落地

当企业数据集成作业规模突破千万级,从 DataX、Sqoop 迁移到 Apache SeaTunnel 的过程往往布满荆棘——配置格式不兼容、字段映射易出错、批量转换效率低,每一步都可能成为项目推进的 “拦路虎”。

2025-10-15 15:40:51 650

原创 从小时级到分钟级:多点DMALL如何用Apache SeaTunnel把数据集成成本砍到1/3?

过去我们依赖 Spark 自研同步工具,虽然稳定,却面临“启动慢、资源重、扩展难”的痛点。

2025-10-10 17:36:53 716

原创 (三)数仓人必看!ODS 到 DWS 各层设计规范全解析,含同步/存储/质量核心要点

本文为系列文章第三篇,详细剖析了数仓各层的设计规范,包含同步、存储、质量等核心要点。

2025-09-25 16:50:25 933

原创 用 SeaTunnel 同步 MySQL 到 Doris:全量增量 + SQL 过滤

Apache SeaTunnel 能够实现 MySQL 到 Doris 的全量和增量数据同步,同时也支持 SQL 级别的数据过滤。

2025-09-25 16:35:28 625

原创 一文掌握 Apache SeaTunnel 构建系统与分发基础架构

本文介绍基于Maven的SeaTunnel构建系统与分发基础架构。涵盖多模块项目如何构建、二进制分发包如何组装、连接器插件如何打包与发现,以及如何创建Docker镜像用于部署。有关运行时插件加载机制的信息,请参阅插件管理与发现(有关CI/CD工作流程和测试的详细信息,请参阅CI/CD与测试框架(

2025-09-25 15:44:20 874

原创 干货预警!Apache SeaTunnel 助力多点 DMALL 构建数据集成平台,探索AI新零售行业应用!

亲爱的社区朋友们,数据集成领域的一场知识盛宴即将来袭!9 月 30 日下午 2 点,Apache SeaTunnel 社区精心策划的又一场线上 Meetup 将准时与大家云端相见!

2025-09-18 18:31:49 293

原创 Apache SeaTunnel 2.3.12 发布!核心引擎升级、连接器生态再扩张

近期,Apache SeaTunnel 2.3.12 正式发版。这是继 2.3.11 之后的又一次迭代,本周期合并 82 个 PR,提供 9 项新特性、30+ 项功能增强、20+ 处文档修正,并修复 43 个 Bug。核心改进集中在 SensorsData 与 Databend 生态接入,Paimon、ClickHouse、MaxCompute 等连接器读写能力扩充,SQL Transform 语法与向量函数增强,以及 Zeta 引擎 Checkpoint 细粒度监控及 REST 接口易用性提升等方面。

2025-09-18 18:24:56 1046 1

原创 从“分散”到“统一”,中控技术利用SeaTunnel构建高效数据采集框架,核心数据同步任务0故障运行!

本文将深入探讨中控技术基于 Apache SeaTunnel 构建企业级数据采集框架的实践,重点分享集群高可用配置、性能调优、容错机制及数据质量监控等方面的具体思考与方案。

2025-09-18 18:06:51 1511

原创 喜报!白鲸开源 CEO 荣登「2025 中国数智化转型升级先锋人物」榜

北京白鲸开源 CEO 郭炜入选《2025中国数智化转型升级先锋人物》榜单,在现场获得了组委会颁发的荣誉证书和奖杯。

2025-09-10 10:31:45 397

原创 一行代码引发 12G 内存 5 分钟爆仓!SeaTunnel Kafka 连接器“内存溢出“元凶抓到了

在Apache SeaTunnel 2.3.9版本的Kafka连接器实现中,存在一个潜在的内存溢出风险。

2025-09-10 10:10:40 449

原创 实测有效|用 SeaTunnel 免费实现 MySQL→Oracle 实时同步,步骤超细

要说 MySQL 同步到Oracle的工具,除了传统的 OGG,应该考虑的就是 ST(SeaTunnel) 了吧,简直太好用啦 ~

2025-09-10 10:02:03 787

原创 (一)数据模型架构原则:四层七阶,数据湖仓建模的“第一块基石”

《新兴数据湖仓设计与实践手册·数据湖仓建模及模型命名规范(2025年)》 由四篇递进式指南组成,以“模型架构—公共规范—分层规范—命名规范”为主线,系统构建可演进、可治理、可共享的现代数据湖仓。

2025-09-02 17:55:33 775

原创 当数据消费者从人变成 Agent,所有软件都将被改写!

在经历了半个世纪的数据仓库演进后,企业的数智化转型正迎来一次真正意义上的范式重构。

2025-09-02 17:41:35 828

原创 SeaTunnel 如何给 MySQL 表做“精准切片”?一篇读懂 CDC 分片黑科技

Apache SeaTunnel MySQL CDC连接器为了实现并行读取,需要将大表切分成多个分片(Split)。对于非主键表,连接器提供了多种智能切分策略来保证数据的完整性和读取效率。本文将详细介绍 Apache SeaTunnel 支持的核心切分策略,切分策略机制及实现方式,并对比各个切分策略的优劣势。

2025-09-02 17:29:55 992

原创 Apache SeaTunnel闪耀2025中国数据库技术大会,荣获「年度优秀技术团队奖」

近日,第十六届中国数据库技术大会(DTCC 2025)在北京举行。Apache SeaTunnel 作为下一代多模态、高性能、分布式海量数据集成领域的领军项目受邀参会,并摘得 2025 “年度优秀技术团队奖”。

2025-08-27 14:28:32 304

原创 收藏!史上最全 Apache SeaTunnel Source 连接器盘点 (2025版),一篇通晓数据集成生态

今天,我们将为您献上一份史上最全的 Apache SeaTunnel Source 连接器清单,带您一文领略其生态系统的广度与深度。无论您是架构师、数据工程师还是开发者,这份清单都值得您收藏!

2025-08-20 14:12:41 1024

原创 把数套数据传输通道一键“折叠”成 SeaTunnel:同程工程师周晓晨的实战笔记

本文将以“选型—落地—共建—展望”为主线,透视同程旅行如何把 SeaTunnel 从备选方案变成统一数据通道,并通过 Operator、Sqoop 迁移工具、Fluss Connector、Scala 编译等二次开发,让开源项目真正长在企业的土壤上;也记录了一位程序员如何在社区里完成“使用者→贡献者→深度贡献者”的身份蜕变。

2025-08-20 11:18:39 999

原创 SeaTunnel MCP Server 入选《中国信通院开源商业产品及企业典型案例集(2025)》

在本次活动中,白鲸开源申报的「SeaTunnel MCP Server:分布式数据集成能力的“神经中枢”」案例成功入选《中国信通院开源商业产品及企业典型案例集(2025)》,并获得主办方颁发的奖牌。

2025-08-13 16:00:51 379

原创 Apache SeaTunnel 新定位!迈向多模态数据集成的统一工具

在人工智能时代,数据不再是简单的数字和表格那么简单了。

2025-08-12 11:45:21 1609

原创 中国 Apache 项目 OpenRank 排行榜 Top 20:白鲸开源深度参与两大上榜项目

如果把开源世界比作一条奔涌的大河,过去十年里,中国开发者已经从“岸边试水”变成了“中流击水”。。而在影响力与贡献度的双轴坐标上,。从数量上来看,在全球 Apache 项目 OpenRank 排行榜 Top20 中,中国项目占据了 7 席。但中国开发者对于 Apache 基金会项目的参与不仅论“数量”,更是讲究“质量”。Apache 基金会各国开发者贡献度排行榜 Top 20 显示,中国在贡献度、开发者总数以及贡献仓库数量等多个维度均排名第一,充分体现了中国开发者在 Apache 项目上的深度参与。

2025-08-06 17:24:29 828

原创 从《中国开源年度报告》看中国开源力量的十年变迁中,Apache SeaTunnel 的跃迁

十年前,中国开发者更多扮演着开源世界的“搬运工”:下载、试用、反馈,贡献寥寥。转折点出现在 2019 年前后,ASF 孵化器里的中国面孔开始增多,SeaTunnel 正是在 2021 年迈入孵化器的大门。2023 年,中国开发者对 Apache 基金会的贡献度首次超过美国,2024 年则把优势扩大到“比美国少一半的人,却交出了近一半的贡献”。技术纵深——自研 Zeta 引擎在同样硬件下数据同步性能快 30%,让“国产替代”不再只是口号;场景纵深。

2025-08-06 17:07:57 1099

原创 深入底层:如何优雅部署 SeaTunnel 分离集群到 Kubernetes

*准备 Kubernetes 环境:**确保已搭建并运行一个可用的 Kubernetes 集群,并安装所有必要的组件。**构建 SeaTunnel Docker 镜像:**如果没有二次开发需求,可直接使用官方提供的镜像。否则,在本地编译打包后,编写 Dockerfile 并构建 SeaTunnel 镜像。

2025-08-06 16:36:12 985

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除