【实验目的】
1.掌握jdk以及kettle的环境搭建方法;
2.完成kettle的第一个转换实例,并熟练掌握kettle的基本使用。
【实验原理】
1.安装前准备
(1)下载并安装jdk,配置环境变量,并在命令窗口输入java -version 判断是否安装成功
(2)安装并成功运行Navicat
(3)下载并解压kettle的安装包,双击spoon.bat文件运行
2.转换实例如下:
读入‘课程信息表.xlsx’文件,输出以‘firstChange.xls’命名的文件
3.转换的环境变量和命名参数的配置
4.Windows10 系统下设置kettle转换定时启动
【实验环境】
操作系统:Windows10
Kettle版本:7.1.0.0
jdk版本:1.8.0及以上版本
【实验步骤】
一、准备工作
1.成功安装jdk,并进行验证:
2.双击spoon.bat文件,打开kettle:
3.进入实验环境后,使用Navicat将课程信息表导入到mysql库
Step1:在Navicat图形界面,导入数据表:课程信息表
Step2:在命令窗口登录mysql,查看导入结果
二、各组件的配置
1.建立第一个转换,命名为firstChange,定义输入步骤、输出步骤和跳
2.配置“表输入”步骤
Step1:双击‘表输入’按钮,配置数据来源,为mysql 数据库 dataprepro 中的数据表 sheet1,并测试连接 sql_connect
Step2:预览数据结果如图所示:
2.配置“Microsoft Excel输出”步骤
Step1:配置输出文件的路径、文件名和文件类型
Step2:配置输出的格式,并获取字段
(1)输出表头
(2)获取的字段如下图所示:
三、运行上述案例转换
1.启动转换
2.执行结果:
四、实验结果
查看输入文件和输出文件:
输入文件‘课程信息表.xlsx’如下图所示:
输出文件‘firstChange.xls’结果如下:
五、参数配置
1.环境变量配置
Step1:修改 C:\Users\Administrator.kettle\kettle.properties 文件
修改文件内容如下:
Step2:修改完毕后,重启kettle(重中之重)
Step3:配置输出步骤的文件路径进行检验(无法进行截图,使用手机拍照展示)
2.命名参数配置
鼠标右击空白区域,点击‘转换设置CTRL-T’
配置输出步骤的文件路径进行检验
六、定时启动转换
1、打开控制面板 -> 管理工具 -> 任务计划程序 -> 创建基本任务
2、创建基本任务的配置过程
Step1:创建基本任务的配置
Step2:触发器的配置:
Step3:每日定时启动时间
Step4:在操作页面下,选择启动程序
Step5:定义启动程序的路径以及脚本文件的内容
脚本文件的内容如下:
Step6:基本完成配置
Step7:在计划任务的配置界面查看任务列表
七、实验过程中遇到的困难
(一)配置表输入步骤,没有复制mysql相关jar包到\data-integration\lib\目录下,导致步骤连接mysql数据库时报错
(二)Windows10的数据库mysql编码格式并非utf-8,导致在ketele配置表输入步骤中,进行预览数据时,数据无法解读而报错
(三)配置定时启动转换过程中,启动程序脚本的内容路径输入错误,导致程序在定时启动时,无法运行
八、实验总结
本次实验主要要求:完成kettle的环境搭建,kettle的第一个转换实例、还有其案例中环境变量和命名参数的设置与应用以及在操作系统Windows的环境下设置kettle地 定时启动操作。
在环境搭建的过程中,对jdk和Navicat的安装和使用进一步了解并熟练掌握其使用方法;在转换案例实现的每个步骤中,详细的了解kettle工具的转换过程,以及具体的使用方法,并且其中环境变量的设置为后续的实验提供了一定的便利,为后续的实验奠定了基础,。