Kettle(二)

目录

 

1、Concat fields

2、值映射

3、增加常量

4、增加序列

5、字段选择

6、计算器

7、字符串剪切、替换、操作

8、去除重复记录、排序记录

9、唯一行(哈希值)

10、拆分字段

11、列拆分为多行

12、列转行

13、行转列

14、行扁平化


 

1、Concat fields

concat fields就是多个字段连接起来形成一个新的字段

拼接成新的字段name,将firstname和lastname进行拼接。

 

2、值映射

将f的值映射为female,m的值映射为male

3、增加常量

增加常量就是在本身的数据流里面添加一列数据,该列的数据都是相同的值

案例:从Excel读取数据,增加一个新列language值为en,把数据保存在Excel中

 

成功增加新的一列。

4、增加序列

增加序列就是给数据流添加一个序列字段

案例:从Excel读取数据,并添加序列,把数据保存到Excel。

5、字段选择

字段选择是从数据流中选择字段、改变名称、修改数据类型

案例:从Excel读取数据,移除sex,并把name改为quancheng,id改为key。

修改字段名称

删除字段

6、计算器

计算器:一个函数集合创建新的字段,还可以设置字段是否移除(临时字段)

案例:从Excel中读取数据,生成name,quarter,week_of_day,account,列,把数据存在Excel表中

7、字符串剪切、替换、操作

剪切字符串:指定输入流字段剪切位置剪切出新的字段。

字符串操作去除字符串两端的空格大小写的切换,并生成新的字段。

案例:从Excel中读取数据,获取title的首位字符,生成title_begin字段,把description中you改为starry生成desc字段,去除author两边的空格,字符变大写,生成author_update,保存到Excel

剪切字符串:

字符串替换

字符串操作

 

输入的Excel

输出的Excel

 

8、去除重复记录、排序记录

去除重复记录是去除数据流里面相同的数据行。(注意:必须先对数据流进行排序。)

9、唯一行(哈希值)

唯一行(哈希值)就是删除数据流重复的行

输入的Excel

输出的Excel

10、拆分字段

拆分字段就是把字段按照分隔符拆分成两个或多个字段。

注意:拆分字段后,原字段就不存在于数据流中。

案例:把name拆分为FirstName和LastName,并保存数据到Excel中

拆分字段:

11、列拆分为多行

列拆分为多行就是把指定分隔符的字段进行拆分为多行

csv文件输入:

列拆分为多行

拆分前:

拆分后:

12、列转行

案例:从Excel中读取数据,按照姓名进行分组,把星期、工作小时从列转化为行,并保存在Excel中

列转行:

输入的Excel:

输出的Excel

 

13、行转列

14、行扁平化

 

 

 

 

 

 

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值