kettle最新下载地址(填写表单再下载):https://pentaho.com/pentaho-community-edition/#communityProducts
或直接0积分下载:https://download.csdn.net/download/m0_49605579/89400508
user_info
industry_info
1.点击文件新建转换
2.点击主对象树新建DB连接
3.正确填写数据库连接,点击测试弹出此弹框说明连接成功
(1)mysql填写方式
![在这里插入图片描述](https://img-blog.csdnimg.cn/aae0bc5b5e78450887200c5b1827287a.png
(2)Oracle填写方式<1>
连接Oracle数据库时:
连接名称:必填,随便起一个连接名称即可
连接类型:选择Oracle
连接方式:Native(JDBC)
主机名称:空着
数据库名称:地址+端口号+实例名,例如:(description=(address_list= (address=(host=xx.xx.xx.xx)(protocol=tcp)(port=xxxx))) (load_balance=on)(failover=on))(connect_data=(service_name= xxxxx))))
数据表空间:空着
索引表空间:空着
端口号:-1(此处为Oracle数据库时填-1,其他数据库正常填端口
用户名密码正常填,无说明
注:这里有坑,以oracle19c版本为例,需导入这几个jar包才能正常连接(0积分下载)
https://download.csdn.net/download/m0_49605579/88540951
Oracle填写方式<2>
也可填写对应指标,没有的空着
注:若想连接像国产达梦这类初始没有的数据库
<1>、下载达梦驱动放到kittle文件夹的lib目录下
<2>.填写连接信息,连接类型选择Generic database
注:自定义连接url格式为
jdbc:dm://xxx.xxx.x.x:端口/模式名(表名)?STU&zeroDateTimeBehavior=convertToNull&useUnicode=true&characterEncoding=utf-8&clobAsString=true
<3>.测试连接成功
4.新建kittle模块如下(按住鼠标中键或者按住shift指明流程方向箭头,点击某个连线箭头可取消联系)
5.点击表输入,编写sql语句,点击预览看是否查询数据正确(第二个表输入同理)
6.点击排序记录,选择排序字段
7.点击记录集连接,填写两表关联字段(前面排序的目的就是因为这个弹窗)
8.复制记录到结果无需处理,点击增加常量,这里的常量为要修改的值(因为是写死,所以为常量)
9.点击排序,这里按user表id排序
10.因为有重复数据,所以先去重
11.点击更新,这里使用id相等作为条件,更新字段为user_name,值为刚建的常量值(注:必须有箭头连接才能提示字段下拉)
12.执行启动,点击步骤度量,可查看每个步骤执行数据,点击节点在点击Preview data可查看具体数据
13.最终效果