Users.ktr使用文档

本文档详细介绍了Kettle工具中Users.ktr文件的使用方法,主要用于单表数据迁移。核心步骤包括:数据输入、数据筛选及去重、数据输出。在数据输入阶段选择数据库连接,数据去重提供了排序筛选和哈希值两种方式,数据输出则涉及字段映射。适用场景包括不同数据库间的数据迁移。
摘要由CSDN通过智能技术生成

流程分析

使用Kettle进行单表迁移
两个文档侧重点不太一样,本文档侧重于针对功能进行分析和说明(如何只修改Users.ktr的一部分内容就完成单表迁移),而链接的文档侧重于对整个流程的建立思路和步骤选用进行说明。

功能介绍

本流程主要完成数据库中的单表迁移。主要步骤包括:数据输入、数据筛选及去重、数据输出。
将从这三个步骤介绍具体的使用方法。

适用场景举例

  • 将旧NEUOJ中的用户信息迁移到新NEUOJ的数据库中(只需要做必做项)
  • 需要将一些用户信息导入新NEUOJ的数据库(除了必做项,还需要修改数据库查询SQL语句,可能还需要修改筛选和去重的步骤)
  • 需要将数据库A中的某些数据导入数据库B中(除了必做项,还需要修改数据库查询SQL语句,可能还需要修改筛选和去重的步骤)

流程图示

在这里插入图片描述

必做选项

数据输入

选择数据库连接

这一步是必须的,因为在实际的使用场景下数据库连接不同。
双击O_users,找到数据库连接,点击右侧的编辑按钮。
在这里插入图片描述
修改相应的连接类型、主机名、数据库名、端口号、用户名、密码等信息。
在这里插入图片描述
在不需要对原数据库进行修改的时候,推荐使用一个只读权限的用户进行数据库连接。可以点击数据库连接页面底下的测试按钮来检测数据库是否能成功连接。
在这里插入图片描述

数据筛选及去重

选择错误数据文件的路径,或取消该步骤

流程支持将错误数据输出到Excel表格,以便查看未被插入进数据库的数据。在Users.ktr文件中的具体表现为:

  • 输出用户名为空的数据
  • 输出用户名重复的数据
  • 输出邮箱重复的数据
    在这里插入图片描述
    如果不希望执行该步骤,单击连向该步骤的连接线,使其变为灰色(在Kettle中意味着这条连接线不会生效)。如下图最左边的流程所示。或者直接右键删除步骤
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值