Kettle(六):输入控件 (CSV、文本文件、Excel、多文件合并、Get data from XML、JSON input、生成记录、表输入)

9 篇文章 0 订阅

本文介绍常用的输入控件:

目录

1 CSV文件输入

2 文本文件输入

3 Excel输入

4 多文件合并

5 Get data from XML

6 JSON input

7 生成记录

8 表输入


1 CSV文件输入

2 文本文件输入

 

 

3 Excel输入

前言:

微软的Excel目前有两种后缀名的文件分别为:xls和xlsx
xls:2007年之前
xlsx:2007年之后

对于Excel文件,需要先选择“表格类型(引擎)”,才会浏览到对应excel版本文件。

表格类型(引擎):

若Excel后缀名为.xls,则设为“Excel 97-2003 XLS (JXL)”;

若Excel后缀名为.xlsx,则为“Excel 2007 XLSX (Apache POl)”

4 多文件合并

”多文件合并“:将多个文件合并为一个文件。

5 Get data from XML

XML 指可扩展标记语言(EXtensible Markup Language)。

数据准备:

<?xml version="1.0" encoding="UTF-8" ?>
<all_data>
    <row id="1">
        <name>Amy</name>
        <age>18</age>
    </row>
    <row id="2">
        <name>Li</name>
        <age>20</age>
    </row>
</all_data>

XML结构分析:

前言:XPath

XPath即为XML路径语言(XML Path Language),它是一种用来确定XML文档中某部分位置的语言。

XPath基于XML的树状结构,提供在数据结构树中找寻节点的能力。

选取节点XPath使用路径表达式在XML文档中选取节点。节点是通过沿着路径或者step来选取的。


下面列出了最有用的路径表达式:

 路径表达式-示例:

控件要点:

 

 字段排列顺序与结果一致。

 

6 JSON input

JSON(0 avaScript Object Notation,JS对象简谱)是一种轻量级的数据交换格式。

数据准备:

{
  "userinfo": [
    {
      "name": "Amy",
      "age": "18"
    },
    {
      "name": "Li",
      "age": "20"
    }
  ]
}

JSON结构分析:

 前言:JSONPath

JSONPath类似于XPath在xml文档中的定位,JsonPath表达式通常是用来路径检索或设置Json的。


其表达式可以分为“"dot-notation”(点记法)和"bracket-notation”(括号记法)格式

点记法:$.store.book[0].title

括号记法:$['store']['book'][o]['tite']

下面列出了最有用的路径表达式:

 JSONPath示例:

控件要点:

 ​​​​​​

 

 参考:

遇见Kettle ETL工具课程入门-进阶-实战 Kettle2020全新从入门到精通实战课程

7 生成记录

”生成记录“控件:生成N行相同的数据行。

 

8 表输入

“表输入”:实际是对数据库表的查询

在这里插入图片描述

参考:遇见Kettle ETL工具课程入门-进阶-实战 Kettle2020全新从入门到精通实战课程

  • 2
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值