kettle实战项目精选(一)流感数据预处理与数据重塑
#1.读取2004-2016年的流感数据,并拼接为一个数据框
#2.读入人口数据,按年份和地区对流感数据填充人口数
Kettle总流程图:
1、读取所有年份csv文件名:
2、year_CSV文件输入
3、字段选择
4、过滤杂行
5、字段字符串清洗
6、替换NULL值
7、增加index
8、JavaScript增加年份
9、读人口csv文件
10、人口年份行转列
11、清洗人口数据年份字符串
12、过滤人口数据杂行
13、人口数据地区字段清洗
14、笛卡尔积合并数据
15、排
原创
2021-05-23 22:23:16 ·
2566 阅读 ·
11 评论