kettle8.3-win安装操作指南

This guide outlines the step-by-step process of installing and configuring Kettle 8.3 on a Windows 10 system, including connecting to MariaDB, creating repositories, setting up Hadoop connections, and handling Kettle operations. It also addresses issues like Spoon.bat crashing and provides solutions for database driver issues." 6731080,975310,C程序头文件管理与模块化编程实践,"['C语言', '编译器', '模块化编程', '头文件管理', '程序设计']
摘要由CSDN通过智能技术生成
  1. 百度云下载地址
  2. Spoon.bat 闪退问题
  3. 数据库连接设置
  4. 资源库连接设置
  5. CDH 集群连接设置
  6. Kettle 小 Demo

环境

win10kettle8.3mariadb10.1

下载地址

链接:https://pan.baidu.com/s/1N3UFd1ePxNY0MZrvA8wfEg 提取码:y1qj

window安装与配置

解压pdi-ce-8.3.0.0-371.zip运行:{KETTLE_HOME}\data-integration下的Spoon.bat

遇见闪退修改Spoon.bat文件

if "%PENTAHO_DI_JAVA_OPTIONS%"=="" set PENTAHO_DI_JAVA_OPTIONS="-Xms1024m" "-Xmx2048m" "-XX:MaxPermSize=256m"修改为以下:if "%PENTAHO_DI_JAVA_OPTIONS%"=="" set PENTAHO_DI_JAVA_OPTIONS="-Xms512m" "-Xmx512m" "-XX:MaxPermSize=256m"

kettle中连接设置

连接数据库mariadb

  1. 双击转换按钮在这里插入图片描述

  2. 依次点击主对象树、DB连接在这里插入图片描述

  3. 右键DB连接新建,填写相应信息在这里插入图片描述

  4. 如果显示以下内容说明kettle缺少数据库驱动

错误连接数据库 [154.8.210.176] : org.pentaho.di.core.exception.KettleDatabaseException: Error occurred while trying to connect to the databaseDriver class 'org.mariadb.jdbc.Driver' could not be found, make sure the 'MariaDB' driver (jar file) is installed.org.mariadb.jdbc.Driver
  1. 将mariadb-java-client-2.4.2.jar放置在{KETTLE_HOME}\data-integration\lib目录下
  2. 重新打开kettle显示以下内容连接成功在这里插入图片描述

创建资源库

  1. 点击connect在这里插入图片描述

  2. 点击other repositories在这里插入图片描述

  3. 设置资源库这里选择数据库资源库在这里插入图片描述

  4. 设置资源库名称并点击数据库连接设置资源库在这里插入图片描述

  5. 创建一个新的连接在这里插入图片描述

  6. 数据库中新建kettle数据库在这里插入图片描述

  7. 填写相应信息,红框中填写刚新建的kettle库在这里插入图片描述

  8. 点击back在这里插入图片描述

  9. 点击finish在这里插入图片描述

  10. 出现这个画面创建资源库成功在这里插入图片描述

  11. 验证:查看刚才创建的kettle库已经生成了46张表创建成功在这里插入图片描述

连接资源库

用户名/密码 admin/admin

在这里插入图片描述

重设资源库密码

点击工具-资源库-探索资源库依次点安全、admin、修改、填写新密码、确定在这里插入图片描述

hadoop cluster连接

软件cdh6.2

从CM管理页面在hive、hbase中下载配置文件

将文件中的以下内容复制到本地{KETTLE_NAME}\data-integration\plugins\pentaho-big-data-plugin\hadoop-configurations\cdh61下core-site.xmlhbase-site.xmlhdfs-site.xmlhive-site.xmlmapred-site.xmlyarn-site.xml

其它{KETTLE_NAME}\data-integration\plugins\pentaho-big-data-plugin\hadoop-configurations

在这里插入图片描述

其中的文件夹名称可以改但是要跟cdh(或者其它文件夹)下的config.properties文件内的name名字保持一致 在这里插入图片描述

将cdh安装目录中的hive lib包下的hive*所有内容复制到{KETTLENAME}\data-integration\lib下有的文档说要把文件放到{KETTLENAME}\data-integration\plugins\pentaho-big-data-plugin\hadoop-configurations\lib或者{KETTLE_NAME}\data-integration\plugins\pentaho-big-data-plugin\hadoop-configurations\lib\client下。但是经过我测试发现只要放在主目录的lib下就行,如果还是显示driver问题,可以试试上面两个地方

右键hadoop clusters 新建new cluster填写一下内容在这里插入图片描述

连接成功在这里插入图片描述

oozie报红是因为服务没开 user home directory access如果报错是需要一下操作 在集群中切换到 su - hdfs 用户 hdfs dfs -mkdir /user/admin 创建kettle所属admin用户就可以了 如果显示黄色三角叹号跟配置文件(集群中文件)那些hostname有关

kettle操作

kettle日志记录

环境描述:现在一个项目有很多个作业,需要知道每次跑批后哪些ktr跑成功,哪些失败了

问题解决:下面是一个具体的操作流程

首先建立数据库表

CREATE TABLE test_1(id INT,NAME VARCHAR(10));INSERT INTO test_1 VALUES(1,'hsj');CREATE TABLE test_2(id INT  PRIMARY KEY NOT NULL,NAME VARCHAR(10));

数据库表建立完毕之后,新建ktr,ktr示意图如下(正常写流程就好):在这里插入图片描述

在上图界面右键--“转换设置”,可以看到如下界面:在这里插入图片描述

上图中日志数据库连接为数据库日志表所存放数据库的连接,日志表名称随便命名 点击“SQL”,出现如下界面在这里插入图片描述

点击上图中“执行”在这里插入图片描述

日志表已经成功建立。接着执行测试在这里插入图片描述

查询数据库日志表

SELECT * FROM ETL_LOG

以下是LOG_FIELD字段的值:

2019/09/04 09:20:30 - RepositoriesMeta - Reading repositories XML file: D:\data-integration\.kettle\repositories.xml2019/09/04 09:20:32 - RepositoriesMeta - Reading repositories XML file: D:\data-integration\.kettle\repositories.xml2019/09/04 09:20:40 - Spoon - Connected to metastore : kettleDB, added to delegating metastore2019/09/04 09:20:40 - RepositoriesMeta - Reading repositories XML file: D:\data-integration\.kettle\repositories.xml2019/09/04 09:22:46 - Spoon - Using legacy execution engine2019/09/04 09:22:46 - Spoon - 转换已经打开.2019/09/04 09:22:46 - Spoon - 正在打开转换 [test01]...2019/09/04 09:22:46 - Spoon - 开始执行转换.2019/09/04 09:22:46 - Spoon - 转换完成!!2019/09/04 09:32:43 - Spoon - Using legacy execution engine2019/09/04 09:32:43 - Spoon - 转换已经打开.2019/09/04 09:32:43 - Spoon - 正在打开转换 [日志记录]...2019/09/04 09:32:43 - Spoon - 开始执行转换.2019/09/04 09:32:44 - 表输出.0 - Connected to database [linkmysql] (commit=1000)2019/09/04 09:32:44 - 表输入.0 - Finished reading query, closing connection.2019/09/04 09:32:44 - 表输入.0 - 完成处理 (I=1, O=0, R=0, W=1, U=0, E=0)2019/09/04 09:32:44 - 表输出.0 - 完成处理 (I=0, O=1, R=1, W=1, U=0, E=0)END

本文首发于 GitChat,未经授权不得转载,转载需与 GitChat 联系。

阅读全文: http://gitbook.cn/gitchat/activity/5d9c03cf8a27a445a035b655

您还可以下载 CSDN 旗下精品原创内容社区 GitChat App ,阅读更多 GitChat 专享技术内容哦。

FtooAtPSkEJwnW-9xkCLqSTRpBKX

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值