一、kettle
1、概述
Kettle 最初是一个开源的 ETL(Extract-Transform-Load)工具,全称是 KDE Extraction, Transportation, Transformation and Loading Environment。后来,它被重命名为 Pentaho Data Integration。该工具使用 Java 开发,支持跨平台运行,其主要特点包括支持 100% 无编码、通过拖放方式进行 ETL 数据管道的开发;可以连接多种数据源,包括传统数据库、文件、大数据平台、接口以及流数据等;此外,它还支持在 ETL 数据管道中集成机器学习算法。Spoon 是 Kettle 提供的一个图形化界面工具,使用户能够更加直观便捷地进行 ETL 作业的设计与管理。
2、功能
Pentaho Data Integration 作为一个全面的数据集成平台,提供了从多种数据源抽取数据的能力,并支持数据加载、数据湖注入、数据清洗、数据转换、数据融合等多种操作。此外,它还能支持多维联机分析处理(OLAP)和数据挖掘,帮助用户更好地理解和利用数据。这一系列的功能使得 Pentaho Data Integration 成为一个强大的工具,适用于从数据准备到高级分析的全流程数据管理工作。
二、安装使用
1、安装JDK
因为Kettle工具是用java语言开发的,要想运行起来就必须安装jdk。
2、安装kettle
kettle 需要解压到一个非中文路径下。在windows操作系统下
可以更改一下图标,更好看。图标是拿个 spoon.ico文件。
打开spoon.bat文件,修改一下字符集
"-Dfile.encoding=UTF-8"
3、使用kettle
3.1将txt数据导⼊到excel 中
依次点击 文件 --> 新建 --> 转换
分别点击输入和输出选择对象
分别将他们拖出来
要连接起来,表示从文本文档转成execl
先【浏览】选择你要转换的文件,再点击【增加】添加进去
点击内容、确定你的分隔符以及编码方式
点击字段,获取字段
点击预览记录,可以看是否有数据
双击excel输出
点击字段、获取字段
点击运行,第一次运行会让你选择保存的地方
执行成功
若是输出有问题,可能是格式问题,修改输出格式
这个问题说明文件被打开了,要关闭掉。