《ETL原理及应用》学习笔记 ·004【kettle的使用-2】

注:前言、目录见 https://blog.csdn.net/qq_44220418/article/details/108428971

Tips:本节内容偏操作,了解如何操作、进行了什么操作即可
Tips:本节所有输出均为Excel输出

一、Excel输入

按照上一节的方法,将【Excel输入】、【Excel输出】拖入,连接处一个步骤。

【浏览】选择要输入的Excel文件,点击【增加】。
浏览

利用这种方式我们可以新增很多Excel表格作为输入。
增加

如果Excel表格有多个Sheet,需要为其指定好使用哪些Sheet。
在这里插入图片描述

获取字段,完成输入。
在这里插入图片描述

二、XML输入

示例xml文件内容如下:

<?xml version="1.0" encoding="UTF-8"?>

<levelOne>
  <levelTwo id="first">
    <level3 id="1" value="0.5"/>
    <level3 id="2" value="1.5"/>
    <level3 id="3" value="2.5"/>
  </levelTwo>
  <levelTwo id="second">
    <level3 id="1" value="3.5"/>
    <level3 id="2" value="4.5"/>
    <level3 id="3" value="5.5"/>
  </levelTwo>
  <levelTwo id="third">
    <level3 id="1" value="6.5"/>
    <level3 id="2" value="7.5"/>
    <level3 id="3" value="8.5"/>
  </levelTwo>
</levelOne>

1、XML input stream (StAX)

这种不常用

按照上一节的方法,将【XML input stream (StAX)】、【Excel输出】拖入,连接处一个步骤。

选择好文件,确认即可。

在这里插入图片描述

输出结果

大致如下图。
在这里插入图片描述

2、Get data from XML

这种常用

按照上一节的方法,将【Get data from XML】、【Excel输出】拖入,连接处一个步骤。

【浏览】选择要输入的xml文件,点击【增加】。
在这里插入图片描述

在【内容】中填写【循环读取路径】,可通过【获取XML文档的所有路径】选择一个合适的路径。

接下来根据之前的循环读取路径,填写相应的字段,xml路径可以从每一个循环读取路径的节点开始进行查找,比如这里填写的【名称】是id,填写的【节点】为“属性”,填写的【XML路径】为../@id就代表了循环读取路径levelOne/levelTwo/level3的每一个元素节点level3的父节点的属性id,填写的【类型】为String
在这里插入图片描述

输出结果

如下图。

在这里插入图片描述

解释一下,很简单的理由,这个xml文档共有9个元素节点levelOne/levelTwo/level3,每个这样的元素节点都有其父节点levelOne/levelTwo,其属性id的值即为某一行字段的值
在这里插入图片描述

如果换一个例子,我可以设置【XML文件输入】中的【循环读取路径】设置为/levelOne/levelTwo,在【内容】中设置字段的【XML路径】为@id、【节点】为“属性”,其他和之前一样,将得到如下输出:
在这里插入图片描述

三、JSON输入

按照上一节的方法,将【JSON输入】、【Excel输出】拖入,连接处一个步骤。

【浏览】选择要输入的json文件,点击【增加】。在这里插入图片描述

填写好【字段】中的相关输入,其中*..$..都代表通配符,但是在一个【字段】栏目中的不同字段必须统一地使用*..或者$..中的其中一种
在这里插入图片描述

输出结果

如下图。
在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

God-Excious

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值