kettle——实验三(对教员数据处理)

一、数据结构

教练员编号 driverinfoid,车辆号牌号码 hphm,教练 员性别 sex,车类型 carmodle,车颜色 carcolor,教练员生日 birth, 驾校名称 jxmc

 原始数据如图:

二、实验目的

  1. 获得没有冗余的教练员任职信息,不考虑 createtime 字段。
  2. 去除含有空值的记录。
  3. 去除号牌号码中代表地区的汉字,仅保留车牌的字母和数字位。
  4. 保留车型为小型车或微型车的记录。
  5. 将 birth 属性保留后六位出生年月位。

三、操作步骤

3.1、步骤总览

3.2、详细步骤

3.2.1、(表输入)从MySQL导入数据

在表输入中选择新建,新建数据库连接,如下图右边:

 选择所需数据后,点击预览查看导入的数据:

 

3.2.2、增加校验列

 

注意:需要修改Evaluation method,否则会添加失败,报错。

 3.2.3、对数据排序(按add排序)

 

3.2.4、去除重复数据(按add)

 

3.2.5、过滤数据(去除null值)

 

 3.2.6、按车牌分类

此处步骤如下:

 

 3.2.7、空数据,不做处理

 3.2.8、去除“贵”字

 

 

3.2.9、去除车辆类型不满足的数据

 

 3.2.10、对新生成的hphm1改名

 

 3.2.11、处理brith

 

 3.2.12、移除 birth 和 all,将 birth 字改名

 

 3.2.13、获取信息系统

不做处理

 

3.2.14、输出到excel

 

四、结果查看

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值