etl调度工具 ctm_数据仓库建设4——ETL&可视化&运维管理

ETL

ETL模块:统一调度管理、统一监控管理、ETL出错管理、ETL回溯处理等。

ETL设计原则:

  • 模块化的系统。将管理控制类模块与具体数据模块严格分开。
  • 统一的调度与管理。
  • 高效的ETL加载策略。
  • 安全的数据管理与用户管理。
  • 便利的消息通知机制。
858038d6e02fd4a90c6439d3777872d5.png

ETL逻辑架构图

1.操作数据层ETL

将需要处理的数据从业务数据库导入ODS层的预处理过程。主要系统的数据量、环境的异构性、数据的加载方式、数据的加载策略、ETL执行时间、开发工具等。

数据加载方式:

  • 【增量加载】有时间戳、数据量较大,数据产生较快的交易流水表。
  • 【全量加载】包含时间戳、数据量较小、数据产生较缓慢的流水表。
  • 【全量加载】没有时间戳的业务表,同时增加业务日期字段(BIZ_DATA),标识是那一天的数据,并根据该字段删除超过期限的数据。

数据加载策略:

  • 数据加载窗口,有的系统每天数据处理完之后有相应的标志,有的没有(和业务人员定好时间),确保采集到的源数据是每天最新的数据。
  • 数据加载顺序:一般ODS层ETL没有依赖关系,主要依据是ETL执行时间和服务器的性能。采用多线程并行加载方式࿰
  • 0
    点赞
  • 18
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值