目录
一、excel 读取并更改信息格式
1 读取信息
组件位置:转换-》输入-》Excel 输入
组件使用:
1)、文件
表格类型(引擎):Excel 97-2003 XLS (JXL) : 读取03版本excel;
Excel 2007 XLSX (Apache POI)、Excel 2007 XLSX (Apache POI Streaming) : 读取07版本excel
根据需求获取数据信息
- 读取本地单一Excel 。通过文件或目录,浏览本地文件,选择后增加即可。
- 读取本地某一类Excel。通过文件或目录,浏览excel所在文件,正则表达式,书写正则过滤条件,增加。或填写正则表达式(排除)来过滤。
- 从前面的步骤获取文件。点击勾选,并从填写哪个步骤、步骤的哪个字段。
2)、工作表
选取需要处理的sheet页即可。
部分人安装完成kettle,点击获取工作表名称时。会出现卡顿现象。可能是kettle的内存过小。
3)、错误处理
读取数据发生错误会直接停止,设置错误处理后错误数据会按照错误类型存储到制定目录文件或者直接跳过。
4)字段
获取 sheet 内的标题名称。标题名称必须严格按照excel sheet 顺序、名称罗列。
*****当预览数据成功看到数据则成功*****
二、数据更改
kettle 读取excel 可通过格式规范数值、时间类型的数据,处理方式为更改格式。
1、数值类型保留小数
根据需求在格式当中填写#.##(保留两位小数)等
2、时间类型规范格式
根据需求在格式当中填写 yyyy-MM-dd 等