Kettle基本使用(一) —— 输入的使用

01.输入_CSV文件输入

• 使用 Ctrl+Alt+Space 选择一个变量

• Internal:内部,Entry Current Directory:进入当前目录

• #占位符,显示无意义的零,0占位符,不显示无意义的零

 

 

 02.输入_文本文件输入

浏览-增加,注意分隔符

 

 

 03.输入_Excel输入

表格类型(引擎):Excel 97-2003 XLS (JXL)

表格类型(引擎):Excel 2007 XLSX (Apache POI)

 

 

 04.输入_Excel输入_文件夹

${Internal.Entry.Current.Directory}\输入\文件夹\

.*.xlsx:表示任意数量的任意字符

可以手动删除多余字段

 

 05.输入_生成记录

生成指定值的重复行的表

 

 

 06.输入_表输入_数据库

MySQL驱动(jar)存储至lib目录,再重启Spoon

 

 

 07.输入_自定义常量数据

手动输入数据:先定义元数据(字段名称、数据类型及格式),再手动输入数据

 

 

 

 08.输入_生成随机数

生成随机数:随机整数、随机数字、随机字符串

 

 

 09.输入_获取子目录名和文件名

获取子目录名:获取指定文件夹下的子文件夹名

获取文件名:获取指定文件夹下的文件名 ${Internal.Entry.Current.Directory}\输入\文件夹

 

 

 10.输入_获取文件行数

获取指定文件的行数,需指定行分隔符

 

 11.输入_JSON_input

1.json语法:

1)什么是 JSON JSON

指的是 JavaScript 对象表示法(JavaScript Object Notation)

JSON 是轻量级的文本数据交换格式

{
    "sites": [
        {
            "name": "python",
            "url": "www.python.org"
        },
        {
            "name": "google",
            "url": "www.google.com"
        },
        {
            "name": "baidu",
            "url": "www.baidu.com"
        }
    ]
}

2)JSON 语法规则

JSON 语法是 JavaScript 对象表示语法的子集

        数据在键值对中

        数据由逗号分隔

        大括号 {} 保存对象,类似python字典

        中括号 [] 保存数组,类似python列表,数组可以包含多个对象

3)JSON 键值对

JSON 数据的书写格式是:

key : value

键值对包括字段名称(在双引号中),后面写一个冒号,然后是值:

"name" : "Python"

4)JSON 值

JSON 值可以是:

        数字(整数或浮点数)

        字符串(在双引号中)

        逻辑值(true 或 false)

        数组(在中括号中)

        对象(在大括号中)

         null

5)JSON 数字

JSON 数字可以是整型或者浮点型:

{ "age" : 30 }

6)JSON 对象

JSON 对象在大括号 {} 中书写,key 必须是字符串,通过.key或["key"]访问对象的值:

{ key1 : value1, key2 : value2, ... keyN : valueN }

对象可以包含多个键值对:

{ "name" : "Python", "url" : "www.python.org" }

6)JSON 数组

JSON 数组在中括号 [] 中书写,通过索引[index]访问数组的值,也支持切片[start:end]:

数组可包含多个对象:

[
    { key1 : value1-1, key2 : value1-2 },
    { key1 : value2-1, key2 : value2-2 },
    { key1 : value3-1, key2 : value3-2 },
    ...
    { key1 : valueN-1, key2 : valueN-2 },
]
{
    "sites": [
        {
            "name": "Python",
            "url": "www.python.org"
        },
        {
            "name": "google",
            "url": "www.google.com"
        },
        {
            "name": "baidu",
            "url": "www.baidu.com"
        }
    ]
}

以上例子中,对象sites是包含三个对象的数组,每个对象代表一条关于某个网站的记录。

7)JSON 布尔值

JSON 布尔值可以是 true 或者 false:

{ "flag" : true }

8)JSON null

JSON 可以设置 null 值:

{ "flag" : null }

9)JSON 操作符

操作说明
$根节点对象
*通配符,表示任意名称的节点或任意数字
obj..keyobj对象的所有key节点
obj.keyobj对象的key子节点

10)JSON 文件

JSON 文件的文件类型是 .json

2.输入_JSON_input

文件 > 文件或目录:指定文件路径

字段 > 获取字段(Select fields):自动解析字段

 

 

 1)json_columns

选择字段不能自动解析

 2)json_index

选择字段可以自动解析

 3)json_records

选择字段可以自动解析

 4)json_split

选择字段不能自动解析

 5)json_table

选择字段可以自动解析

 6)json_values

选择字段不能自动解析

 12.输入_Get_data_from_XML

文件 > 文件或目录:指定文件路径

内容 > 获取XML文档的所有路径:指定循环读取路径

字段 > 获取字段(Select fields):自动解析字段

 

 

 13.输入_获取表名

获取表名:获取指定数据库下所有的数据表名

 

 

 

  • 1
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值