Kettle多文件合并、XML组件、JSON组件、返回记录组件、表输入组件、更新组件

关注【郑大钱呀】【】【】【】,我们一起交流,一起学习。

Kettle多文件合并

在开发工作中,我们经常会处理将多个相同格式的文件,写到一张表里,或者一个文件中,也就是多文件合并,假设现在有2个相同格式csv文件,内容如下:

文件1内容

id,name,sex
1,小赵,男
2,小黄,男
3,小美,女

文件2内容

id,name,sex
4,小张,男
5,小丽,女
6,小红,女

此时我们需要将上面文件的内容写入一张user的表中,我们该如何做呢?具体步骤如下,先拖两个控件,并建立连接,如下图:


下面配置文本控件,如下图:

下面配置内容部分

下面配置字段,配置完成后点击确定


接着我们配置表输出控件


配置完成后,点击启动运行即可


最后我们去数据库里看一下数据,两个文件的数据都有了

Get data from XML组件

我们有一个xml文件,内容如下:

<?xml version="1.0" encoding="UTF-8" ?>
<all_data>
    <row id="1">
        <name>小红</name>
        <age>10</age>
    </row>
    <row id="2">
        <name>小明</name>
        <age>12</age>
    </row>
</all_data>

此时我们想要提取xml文件中的数据,输入到一个文本文件中,具体步骤如下,我们首先拖拽控件,并建立连接,如下图:

下面配置Get data from XML,如下图:


定位要循环的路径

获取字段,点击预览可以预览数据


配置完成后,点击启动即可

下面我们看一下最后的结果文件

JSON INPUT组件

上面我们说了从xml文件中获取数据,我们再看一下从json文件数据中获取数据,有一个JSON文件,内容如下:

{
  "userinfo": [
    {
      "name": "张三",
      "age": "20"
    },
    {
      "name": "李四",
      "age": "14"
    },
    {
      "name": "王二",
      "age": "52"
    }
  ]
}

我们现在想将json文件中的name、age,提取到txt中,具体操作如下,拖拽如下控件:


下面我们双击该组件 进入配置页面,如下图:


配置名称、jsonpath路径、数据类型,配置完成后可以预览数据,看看对不对

这里贴一下jsonPath语法表

文本配置就不细说了,配置完成,直接点击允许,最后看下结果:

生成记录组件

生成记录的作用就是批量的生成一些数据,比如我们想生成1000条数据,并且写到文本文件里,用于测试,具体步骤如下,先拖拽两个控件,并且建立连接,如下图:

双击生成记录,配置该控件,如下图:

文本控件配置和之前一样,就不细说了,最后点击运行

查看文本文件内容:

表输入控件

该控件的作用就是从数据库中的数据,然后再给其他控件输出,比如我们有一张user表,如下:


我们现在将数据库的数据写入一个文本文件中,具体操作如下,先拖两个控件:

双击表输入控件,进行配置,如下图:

值得注意的是,如果你没有已有的数据库连接,需要新建,这里我们以mysql为例,连接mysql需要先去上网上下载如下图中的两个驱动包,并把它们放到kettle的lib目录,如下图:


然后我们点击新建创建连接,如下图:


配置完成后,保存即可,最后我们把文本文件配置一下,点击一下启动,结果如下:


我们最后看下结果:

SQL文件输出

我们有时候需要将数据库中的数据导成SQL文件,此时我们就可以使用该组件,我们假如想要将user表导成SQL文件,具体操作如下:


下面主要看一下SQL文件输出组件的配置,如下:


配置完成后,我们点击一下启动,看一下生成的sql文件,如下图:

更新控件

更新主要用于对比两个目标的数据是否存在更新,如果有变动,则更新目标表,如果数据不存在则会报错。我们现在有两张表,一张user表,另一张user1表,我们想把user表的数据更新到user1表中,两张表的内容如下:


下面我们开始具体操作,首先拖拽组件,如下图:


我们这里说一下更新组件,双击进入配置界面,如下图:

配置完成后,点击启动执行,最后查看一下user1表的数据,如下图:


更新成功
但是此时如果有数据不存在,就会有报错,如下图:

结尾

本期的内容就到这里了,如有不足之处还请大家多多指正,欢迎大家留言、关注、转发、收藏,谢谢。

  • 1
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
### 回答1: 解析JSON通常需要使用某种程序语言,例如JavaScript、Python、PHP等。但是,Kettle也可以用来解析JSON,通过使用KettleJSON转换器步骤,可以从JSON文件中获取数据,并将其转换为可供ETL管道使用的格式。 ### 回答2: kettle是一款用于数据集成和转换的ETL工具,不仅支持从各种数据源中提取数据,还可以将数据加载到目标系统中。通过使用kettle,我们可以很方便地解析JSON数据。 kettle提供了一些特定的步骤来解析JSON数据。首先,我们需要使用JSON输入步骤来读取JSON数据文件或从URL获取JSON数据。这个步骤负责读取JSON数据并将其转换为kettle的内部数据结构。在输入步骤中,我们需要配置JSON路径,以指定我们要提取的数据位置。 接下来,我们可以使用kettle的转换步骤来对JSON数据进行处理。我们可以使用JSON转换步骤将JSON数据转换为kettle的行数据格式,其中每个属性或字段都作为一个列存储在行中。这个步骤允许我们选择我们想要保留的字段,并可以进行重命名、计算和转换操作。 在转换步骤中,我们还可以使用JSON输出步骤来将处理后的数据保存为JSON文件或向外部系统发送JSON数据。这个步骤负责将kettle的行数据格式转换为JSON数据格式。 除了步骤之外,kettle还提供了一些函数和变量来处理JSON数据。我们可以使用kettle的JavaScript脚本来手动解析和处理JSON数据。在脚本中,我们可以使用JSON解析函数来解析JSON字符串,并使用JSON对象的属性和方法来操作JSON数据。 总结来说,要使用kettle解析JSON数据,我们需要使用JSON输入步骤读取JSON数据,使用JSON转换步骤对数据进行处理,以及使用JSON输出步骤将处理后的数据保存为JSON文件。此外,我们还可以使用kettle的JavaScript脚本来手动解析和处理JSON数据。 ### 回答3: Kettle是一款开源的ETL工具,可以用来进行数据抽取、转换和加载。在Kettle中,我们可以使用一些内置的功能来解析JSON数据。 首先,我们需要使用JSON输入步骤来读取包含JSON数据的文件或URL。在这个步骤中,我们可以选择输入JSON数据的来源方式,比如文件、URL或者直接输入JSON数据。对于文件或URL输入,我们可以指定文件路径或URL地址。对于直接输入JSON数据,我们可以在步骤中直接输入JSON字符串。 然后,在JSON输入步骤中,我们需要定义JSON路径,以便Kettle可以定位到我们需要的数据。JSON路径是一个描述JSON结构的达式,可以用来取出特定的数据。我们可以使用点号.来分隔层级,使用方括号[]来指定数组索引或属性名称。 接下来,在我们需要使用JSON数据的地方,可以使用Kettle的其他步骤对数据进行处理。比如,我们可以使用字段拆分步骤将JSON数据拆分成多个字段,以便后续处理。对于复杂的JSON结构,我们可以使用JSON转换步骤进行数据转换和重组。 最后,我们可以将解析后的JSON数据加载到目标数据库或文件中,使用Kettle的输出步骤进行数据输出。根据我们的需求,我们可以选择将数据输出为文件、数据库或其他数据存储介质。 总结来说,Kettle可以通过JSON输入步骤解析JSON数据,并使用其他内置步骤对数据进行处理和转换。最后,我们可以使用输出步骤将解析后的数据输出到目标位置。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

郑大钱呀

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值