ETL 部署和简单的例子

ETL 部署和简单的例子

1. ETL 部署

先安装 Java 环境.
开源的 ETL 工具: Kettle, kettle 是用 Java 编写的.
官方文档: https://help.pentaho.com/Documentation/8.2
下载路径: https://sourceforge.net/projects/pentaho/files/Pentaho%208.1/client-tools/

下载 pdi-ce-8.1.0.0-365.zip 这个压缩包, 下载过程很慢.
在这里插入图片描述

百度网盘下载:
链接:https://pan.baidu.com/s/1wkr__IFTtX1s23qw_8Bzlw
提取码:ns39

下载完后直接解压便可使用.

在这里插入图片描述

几个子程序的功能和启动方式:

  1. Spoon.bat: 图形界面方式启动作业和转化设计器
  2. Pan.bat: 命令行方式执行转换
  3. Kitchen.bat: 命令行方式执行作业
  4. Cart.bat: 启动 web 服务, 用于 Kettle 的远程运行或集群运行
  5. Encr.bat: 密码加密

2. ETL 简单例子

Kettle 的 Spoon 设计器用来设计转换 (Transformation) 和作业 (Job)

  1. 转换: 主要是针对数据的各种处理, 一个转换里可以包括多个步骤 (Step)
  2. 作业: 比转换更高一级的处理流程, 一个作业里包括多个作业项 (Job Entry), 一个作业项代表一项工作, 转换也是一个作业项

双击 Spoon.bat 文件.

在这里插入图片描述

新建立一个转换后, 建立一个随机数.

在这里插入图片描述在这里插入图片描述

在这里插入图片描述

在这里插入图片描述在这里插入图片描述

在这里插入图片描述

生成文件有两个:
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

删除文件.

在这里插入图片描述

预览操作.

在这里插入图片描述在这里插入图片描述在这里插入图片描述

字段选择

在这里插入图片描述

增加常量

在这里插入图片描述
在这里插入图片描述

复制数量

在这里插入图片描述
在这里插入图片描述在这里插入图片描述

计算器

在这里插入图片描述在这里插入图片描述

过滤操作.

在这里插入图片描述

在这里插入图片描述

链接操作的使用

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Oracle和Hive都是常见的数据仓库,都有自己的ETL工具和技术。以下是两者的ETL技术说明: 1. Oracle SQL的ETL: Oracle SQL的ETL技术是使用Oracle数据库提供的工具和技术来实现数据的抽取、转换和加载。Oracle SQL的ETL技术包括以下几个步骤: - 数据抽取:使用Oracle SQL提供的数据抽取工具将数据从数据源中抽取出来。 - 数据转换:使用Oracle SQL提供的数据转换工具对抽取的数据进行转换和清洗,以满足数据仓库中的数据格式和数据质量要求。 - 数据加载:使用Oracle SQL提供的数据加载工具将转换后的数据加载到数据仓库中。 2. Hive的ETL: Hive的ETL技术是使用Hive提供的工具和技术来实现数据的抽取、转换和加载。Hive的ETL技术包括以下几个步骤: - 数据抽取:使用Hive提供的数据抽取工具将数据从数据源中抽取出来,可以使用Hive的JDBC或ODBC驱动程序连接到各种数据源。 - 数据转换:使用Hive提供的数据转换工具,如HiveQL,对抽取的数据进行转换和清洗,以满足数据仓库中的数据格式和数据质量要求。 - 数据加载:使用Hive提供的数据加载工具将转换后的数据加载到数据仓库中,可以使用Hive的INSERT语句或LOAD DATA语句将数据加载到Hive表中。 总的来说,Oracle SQL和Hive的ETL技术都是用来将数据从各种数据源中抽取出来,进行清洗、转换和加载,以满足数据仓库中的数据格式和数据质量要求。两者的具体实现方式和工具略有不同,需要根据具体情况选择合适的方案。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值