本文介绍常用的输入控件:
目录
1 CSV文件输入
2 文本文件输入
3 Excel输入
前言:
微软的Excel目前有两种后缀名的文件分别为:xls和xlsx
xls:2007年之前
xlsx:2007年之后
对于Excel文件,需要先选择“表格类型(引擎)”,才会浏览到对应excel版本文件。
表格类型(引擎):
若Excel后缀名为.xls,则设为“Excel 97-2003 XLS (JXL)”;
若Excel后缀名为.xlsx,则为“Excel 2007 XLSX (Apache POl)”
4 多文件合并
”多文件合并“:将多个文件合并为一个文件。
5 Get data from XML
XML 指可扩展标记语言(EXtensible Markup Language)。
数据准备:
<?xml version="1.0" encoding="UTF-8" ?>
<all_data>
<row id="1">
<name>Amy</name>
<age>18</age>
</row>
<row id="2">
<name>Li</name>
<age>20</age>
</row>
</all_data>
XML结构分析:
前言:XPath
XPath即为XML路径语言(XML Path Language),它是一种用来确定XML文档中某部分位置的语言。
XPath基于XML的树状结构,提供在数据结构树中找寻节点的能力。
选取节点XPath使用路径表达式在XML文档中选取节点。节点是通过沿着路径或者step来选取的。
下面列出了最有用的路径表达式:路径表达式-示例:
控件要点:
字段排列顺序与结果一致。
6 JSON input
JSON(0 avaScript Object Notation,JS对象简谱)是一种轻量级的数据交换格式。
数据准备:
{
"userinfo": [
{
"name": "Amy",
"age": "18"
},
{
"name": "Li",
"age": "20"
}
]
}
JSON结构分析:
前言:JSONPath
JSONPath类似于XPath在xml文档中的定位,JsonPath表达式通常是用来路径检索或设置Json的。
其表达式可以分为“"dot-notation”(点记法)和"bracket-notation”(括号记法)格式点记法:$.store.book[0].title
括号记法:$['store']['book'][o]['tite']
下面列出了最有用的路径表达式:
JSONPath示例:
控件要点:
参考:
遇见Kettle ETL工具课程入门-进阶-实战 Kettle2020全新从入门到精通实战课程
7 生成记录
”生成记录“控件:生成N行相同的数据行。
8 表输入
“表输入”:实际是对数据库表的查询