第六章 数据转换

本章节介绍如何利用Kettle工具将文本文件personal_data.txt中的household_register字段转换为省份信息,并将结果存入personnel_data_new.txt。通过配置文本文件输入、字段选择、排序记录、记录集连接及表输出等控件,实现了数据的转换和整合。
摘要由CSDN通过智能技术生成

1.对文本文件personal_data.txt中的数据进行数据粒度转换,即将文本文件personnel_data.txt中字段household_register的数据统一成省份,并且输出到文本文档personnel_data_new.txt中。

(1)打开Kettle工具,新建转换

使用Kettle工具,创建一个转换,并添加文本文件输入控件、表输入控件、字段选择控件、排序记录控件、记录集连接控件、表输出控件以及Hop跳连接线。

图1-创建转换

(2)配置文本文件输入控件

双击图中的“文本文件输入”控件,进入“文本文件输入”界面,单击【浏览】按钮,选择要抽取personnel_data.txt文件;单击【增加】按钮,将要抽取的personnel_data.txt文件添加到转换中

单击内容选项卡,在分隔符处清除默认分隔符,单击【Insert TAB】按钮,在分隔符处插入一个制表符;取消勾选头部复选框。“内容选项卡的配置具体效果如图所示 

单击“字段”选项卡,根据personnel_data.txt文件的内容添加对应的字段名称,并指定数据类型。“字段”选项卡的配置 

 单击【确定】按钮,完成“文本文件输入控件的配置。

(3)配置字段选择控件

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值