kettle(pdi)的安装和简单使用

一、kettle

1、概述

Kettle 最初是一个开源的 ETL(Extract-Transform-Load)工具,全称是 KDE Extraction, Transportation, Transformation and Loading Environment。后来,它被重命名为 Pentaho Data Integration。该工具使用 Java 开发,支持跨平台运行,其主要特点包括支持 100% 无编码、通过拖放方式进行 ETL 数据管道的开发;可以连接多种数据源,包括传统数据库、文件、大数据平台、接口以及流数据等;此外,它还支持在 ETL 数据管道中集成机器学习算法。Spoon 是 Kettle 提供的一个图形化界面工具,使用户能够更加直观便捷地进行 ETL 作业的设计与管理。

2、功能

Pentaho Data Integration 作为一个全面的数据集成平台,提供了从多种数据源抽取数据的能力,并支持数据加载、数据湖注入、数据清洗、数据转换、数据融合等多种操作。此外,它还能支持多维联机分析处理(OLAP)和数据挖掘,帮助用户更好地理解和利用数据。这一系列的功能使得 Pentaho Data Integration 成为一个强大的工具,适用于从数据准备到高级分析的全流程数据管理工作。

二、安装使用

1、安装JDK

因为Kettle工具是用java语言开发的,要想运行起来就必须安装jdk。

2、安装kettle

kettle 需要解压到一个非中文路径下。在windows操作系统下

可以更改一下图标,更好看。图标是拿个 spoon.ico文件。

打开spoon.bat文件,修改一下字符集

"-Dfile.encoding=UTF-8"

 3、使用kettle

3.1将txt数据导⼊到excel 中

依次点击  文件 --> 新建 --> 转换

 分别点击输入和输出选择对象

分别将他们拖出来

要连接起来,表示从文本文档转成execl

先【浏览】选择你要转换的文件,再点击【增加】添加进去

点击内容、确定你的分隔符以及编码方式

点击字段,获取字段

点击预览记录,可以看是否有数据

双击excel输出

点击字段、获取字段

点击运行,第一次运行会让你选择保存的地方

执行成功

若是输出有问题,可能是格式问题,修改输出格式

这个问题说明文件被打开了,要关闭掉。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值