【数据挖掘】Kettle分组合并

说在前面

  • 操作系统:win10
  • kettle版本:8.3
  • 数据集:Soda

场景

  • 存在表order内容如下:
    在这里插入图片描述
    需要将单个订单中的所有商品放在同一行中。

当前实现思路

  • 方案一:分组排序后列转行
  • 其他方案:应该有更快捷的实现,当前没找到

具体操作

  • 方案一

    • 整体结构
      在这里插入图片描述
    • CSV文件输入
      在这里插入图片描述
    • 字段选择
      因为我们只需要订单号以及商品名
      在这里插入图片描述
    • 排序记录
      在使用分组前需要进行排序
      在这里插入图片描述
    • 分组
      在这里插入图片描述
      结果预览 (emmm,商品序号那个字段请忽视)
      在这里插入图片描述
    • 根据字段值来改变序列
      当订单号的值更改后会重新从1开始计数
      在这里插入图片描述
      结果预览 (emmm,商品序号那个字段请忽视)
      result为序号
      在这里插入图片描述
    • 字段选择
    • 列转行
      转换关系见下面的表格
      在这里插入图片描述
      结果预览
      在这里插入图片描述
    • 字段选择
    • 文本文件输出
      在这里插入图片描述在这里插入图片描述
    • 结果
      在这里插入图片描述
    • 转换关系
分组字段关键字段数据字段
订单号1关键值1数据值1
订单号1关键值2数据值2
订单号1关键值3数据值3
订单号2关键值2数据值4
订单号2关键值3数据值5
分组字段关键值1关键值2关键值3
订单号1数据值1数据值2数据值3
订单号2数据值4数据值2
  • 其他方案

    • 待补充
  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值