kettle-输入组件

众所周知,要想深入的设计和了解一个系统,首先要了解系统的输入输出是什么,系统的输入是所有步骤中最为基础的一步,它是所有业务逻辑实现的前提条件。所以这一节是至关重要的,本小节内容将详细的讲解kettle常用的输入组件。

excel输入组件

在工作中经常进行处理的文件格式,就是excel文件。所以熟练掌握excel文件的处理是一种必备的技能。但是有时候,需要将excel文件中的表格数据,转化为其他的格式,如json,xml,txt格式。这种情况又该怎么处理呢?这些工作的前提就是将excel文件的表格数据提取出来,然后才能随心所欲的操作。对于开发者来说,excel输入组件替代了传统的poi解析过程,使excel的解析变得非常的简单透明。

首先,打开PDI工具,新建转换,如:图-1。

图-1
图-1

接着依次点击核心对象,输入,并在下拉列表中选择excel输入组件,并拖拽到工作空间上,

如图-2。

图-2

 双击excel输入这个组件,浏览(选择excel文件)——》添加

图-3

在“工作表”选项卡,点击“获取工作表”按钮。(其实获取的就是sheet页的名称)如下图:

图-4
图-4

在“字段”选项卡中,点击“获取来自头部数据的字段”,如下图。(“内容”选项卡,“错误处理”选项卡,“其他输出字段”选项卡 不需要进行配置)

图-5

点击“预览记录”按钮,查看最终结果。

图-6

文本文件输入组件

第一步:在工作区拖入“文本文件输入”节点,如下图所示:

第二步:双击“文本文件输入”节点,进行配置,在“文件”选项卡中:1,点击浏览按钮选择本地txt文件;2,点击增加;

文本文件
文件页签配置

第三步:在“字段”选项卡中,点击获取字段,如下图所示:

第四步:点击预览数据,查看最终结果。

表输入组件

 第一步:配置表输入节点:

第二步:配置数据库连接:按照如图的顺序进行配置即可。

第三步:数据库配置成功如下图:

第四步:获取sql语句:

第五步:预览结果

JSON输入组件

第一步:配置Json input组件

第二步: 双击 Json input,配置读取的js文件,其实就是json文件。

 json文件内容如下:

{ "store": {
    "book": [ 
      { "category": "reference",
        "author": "Nigel Rees",
        "title": "Sayings of the Century",
        "price": 8.95
      },
      { "category": "fiction",
        "author": "Evelyn Waugh",
        "title": "Sword of Honour",
        "price": 12.99
      },
      { "category": "fiction",
        "author": "Herman Melville",
        "title": "Moby Dick",
        "isbn": "0-553-21311-3",
        "price": 8.99
      },
      { "category": "fiction",
        "author": "J. R. R. Tolkien",
        "title": "The Lord of the Rings",
        "isbn": "0-395-19395-8",
        "price": 22.99
      }
      { "category": "fiction",
        "author": "Samatar",
        "title": "La belle vie",
        "isbn": "0-395-19395-8",
        "price": 24.99
      }
    ],
    "bicycle": {
      "color": "red",
      "price": 19.95
    }
  }
}

 第三步:配置需要从json文件中获取的字段,采用的是xpath的方式。

 第四步:预览结果

 其实,对json格式数据的操作才是互联网中最常用的。这里是从json文件获取的数据,实际工作中,json数据一般来源于三方接口,这就需要与kettle中的查询组件结合起来使用,后面的查询组件中会详细的讲到。

本节小结

        kettle输入组件,这里只讲解了excel输入组件,文本输入组件,表输入组件,json输入组件这四种组件是在实际工作中最常用的。相关的源码及文件,我会上传到一个github仓库,供大家参考使用。

扩展:

        左图是所有的输入组件,对应的demo参考右图(在pdi的安装目录下面)

        

 

 

 

 

 

 

 

 

 

 

 

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

qingxinziran007

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值