6.3数据粒度的转换
业务系统一般存储非常明细的数据,而数据仓库中数据是用来分析的,不需要非常明细的数据。一般情况下会将业务系统数据按照仓库粒度进行聚合,这个过程被称为数据粒度的转换。
一.数据粒度转换
面通过Kettle工具对文本文件personnel_data.txt中的数据进行数据粒度的转换,即将文本文件personnel_data.txt中字段为household_register的数据统一省份,并输出到文本文件personnel_data_new.txt中。
1.打开Kettle文件,创建转换
创建转换zuanghuna2 如下图所示:
创建转换 zuanghuan2
2.配置 “文本文件输入控件”
进入“文本文件输入控件”界面·,单击“浏览”,选择抽取文件“personnel_data.txt",然后单击”增加“按钮,将要抽取的文件”personnel_data.txt文件添加到zuanghuan2
配置“文本文件”选项卡
“内容”选项卡的配置
“字段”选项卡的配置
3.配置字段选择配置
添加字段
4.配置排序记录控件