数据仓库技术支持-ETL1

数据仓库技术支持-ETL1

 

新手小白的大数据学习逆袭之路!

 

目录

数据仓库技术支持-ETL1

1.什么是ETL

2.Extract 抽取

3.Transform 转换

 

3.Load 加载

4.ETL作用

5.如何做ETL

1)新建一个项目

2)新建两个数据源 

3)新建SSIS包(包括维度表 事实表)

 


 

 

1.什么是ETL

 

ETL,即提取(Extract)、转换(Transform)、加载(Load),是数据仓库中常用的一种数据处理过程。它用于从各种不同的数据源中提取数据,经过一系列的转换处理,最终将数据加载到目标数据仓库或者目标数据库中,以支持数据分析、报表生成等应用。

 

让我用更简单的语言解释一下:

 

 提取(Extract):这一步是从源系统(如数据库、日志文件、API等)中提取数据。数据可以是结构化的、半结构化的或非结构化的,这些数据通常分散在不同的系统中。

 

 转换(Transform):在这一步,数据经过清洗、转换、合并、聚合等处理,以符合目标数据仓库的格式和要求。这个过程可能包括数据清洗、数据规范化、数据验证、数据计算等操作,以确保数据的质量和一致性。

 

 加载(Load):最后一步是将经过转换处理后的数据加载到目标数据仓库或数据库中。这可能涉及到将数据插入到数据库表中、更新现有数据或者创建新的数据表。

 

ETL过程是数据仓库中非常重要的一环,它可以帮助组织和整合不同来源的数据,为企业提供数据驱动的决策支持。随着大数据时代的到来,ETL技术也在不断发展,出现了各种各样的ETL工具和框架,如Apache Hadoop、Apache Spark等,以满足不同规模和复杂度的数据处理需求。

 

2.Extract 抽取

 

688a7f39fc1c45b4a48d70d843da37d4.png

 

 

3.Transform 转换

 

9c3900af7fba4d8ca89dd79d9a27aa14.png

 

3.Load 加载

 

2787c9ce091849f988c999785528f2ec.png

 

4.ETL作用

 

把源数据的数据抽取 转换 加载到数据仓库中去

 

5.如何做ETL

 

下面我们开始做ETL开发 我们打开下面的文件目录 

 

410660deed2a4c5b9a92867864d7b73b.png

 

88e73093f070426bab3f8b770214225f.png

 

1)新建一个项目

 

3cebb1c9de5e4a48aa18e5ce75bdff7b.png

 

63f3f4b6eab7447782160baec3b06605.png

 

2)新建两个数据源 

 

96b3be75bc4949628de3cf25eb47440f.png

 

48d6f54afe264584bc65a7a16df74a5a.png

 

9b9bf7eaa49c4bcd8e9ec9f015aba68e.png

 

3)新建SSIS包(包括维度表 事实表)

f480423d0062473db09ddd33f9e90964.png

 

 

 

 

  • 25
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值