kettle使用手册

word文档附件使用云盘保存的,下载地址如下:

http://pan.baidu.com/s/1gd9YPR9

Kettle使用手册

1.     引言... 8

1.1           编写目的... 8

1.2           阅读对象... 8

1.3           术语和定义... 8

1.3.1        资源库... 8

1.3.2        Transformation.. 8

1.3.3        Job.. 9

1.3.4        Hop.. 9

1.3.3.1             Transformation hop.. 9

1.3.3.2             Job hop.. 9

1.3.5        Chef. 9

1.3.6        Kitchen.. 9

1.3.7        Spoon.. 10

1.3.8        Pan.. 10

1.4           参考文献... 10

2.     产品介绍... 11

2.1           什么是kettle. 11

2.2           Kettle的整体结构图... 11

2.3           开发背景... 12

2.4           运行环境... 12

2.5           支持的DB种类... 12

2.6           支持的操作系统... 13

2.7           支持的文件类型... 13

2.8           安装说明... 13

2.8.1        Window下安装... 13

2.8.2        Linux下安装... 14

2.9           其他... 14

3.     使用须知... 15

4.     产品功能及使用... 15

4.1           资源库... 15

4.2           数据源... 17

4.3           转换... 18

4.3.1        输入... 18

4.3.1.1             生成记录... 18

4.3.1.2             自定义常量数据... 18

4.3.1.3             获取表名... 19

4.3.1.4             获取系统信息... 21

4.3.1.5             表输入... 21

4.3.1.6             文本文件输入... 22

4.3.1.7             Xml文件输入... 23

4.3.1.8             Excel输入... 24

4.3.1.9             CSV输入... 25

4.3.1.10           Json输入... 26

4.3.2        输出... 26

4.3.2.1             表输出... 26

4.3.2.2             插入/更新... 27

4.3.2.3             更新... 29

4.3.2.4             删除... 29

4.3.2.5             文本文件输出... 30

4.3.2.6             Xml文件输出... 31

4.3.2.7             Excel文件输出... 32

4.3.2.8             Json输出... 33

4.3.2.9             Sql文件输出... 34

4.3.3        转换... 35

4.3.3.1             值映射... 35

4.3.3.2             剪切字符串... 36

4.3.3.3             去除重复记录... 37

4.3.3.4             唯一行... 38

4.3.3.5             增加常量... 38

4.3.3.6             增加序列... 39

4.3.3.7             字段选择... 39

4.3.3.8             字符串操作... 40

4.3.3.9             字符串替换... 41

4.3.3.10           排序记录... 41

4.3.3.11           设置字段值... 42

4.3.3.12           计算器... 43

4.3.4        应用... 44

4.3.5        流程... 44

4.3.5.1             Switch / Case. 44

4.3.5.2             中止... 45

4.3.5.3             执行作业... 45

4.3.5.4             检测空流... 46

4.3.5.5             空操作... 47

4.3.5.6             识别流的最后一行... 47

4.3.5.7             过滤记录... 48

4.3.6        脚本... 49

4.3.6.1             Java代码... 49

4.3.6.2             Javascript代码... 49

4.3.6.3             执行sql脚本... 50

4.3.6.4             正则表达式... 51

4.3.7        查询... 52

4.3.7.1             调用DB存储过程... 52

4.3.7.2             流查询... 53

4.3.7.3             数据库查询... 54

4.3.8        连接... 56

4.3.8.1             合并记录... 56

4.3.8.2             排序合并... 57

4.3.8.3             记录关联(笛卡尔输出). 57

4.3.8.4             记录集连接... 58

4.3.9        数据仓库... 59

4.3.9.1             维度查询/更新... 59

4.3.9.2             联合查询/更新... 60

4.3.10              作业... 61

4.3.11.1           设置变量... 61

4.3.11.2           获取变量... 61

4.3.11.3           复制记录到结果... 62

4.3.11.4           从结果中获取记录... 63

4.3.11              批量加载... 63

4.3.11.5           ORACLE批量加载... 63

4.4           作业... 65

4.4.1        通用... 65

4.4.1.1             START. 65

4.4.1.2             DUMMY. 65

4.4.1.3             作业... 66

4.4.1.4             成功... 67

4.4.1.5             设置变量... 67

4.4.1.6             转换... 68

4.4.2        邮件... 69

4.4.2.1             发送邮件... 69

4.4.2.2             邮件验证... 70

4.4.3        文件管理... 71

4.4.3.1             创建目录... 71

4.4.3.2             创建文件... 72

4.4.3.3             删除目录... 72

4.4.3.4             删除一个文件... 72

4.4.3.5             删除多个文件... 73

4.4.4        条件... 73

4.4.4.1             检查目录是否为空... 73

4.4.4.2             检查一个文件是否存在... 74

4.4.4.3             检查多个文件是否存在... 74

4.4.4.4             检查文件是否被锁... 75

4.4.4.5             检查数据库连接... 76

4.4.4.6             检查表是否存在... 77

4.4.4.7             检查列是否存在... 77

4.4.4.8             检验字段的值... 78

4.4.4.9             计算表中的记录数... 79

4.4.4.10           等待... 80

4.4.4.11           计算文件的大小和个数... 81

4.4.5        脚本... 82

4.4.5.1             Shell82

4.4.5.2             Sql83

4.4.5.3             使用javascript脚本验证... 84

4.5           资源导出... 85

4.6           资源导入... 86

4.7           分区... 86

4.8           集群... 86

5.     示例演示... 87

6.     应用部署... 88

6.1           运行方式... 88

7.     常见问题及解答... 88

8.     总结... 94

9.     其他... 94

9.1           数据库用法... 94

展开阅读全文