一、数据结构
网址信息 url,标题 title,发布 时间 post_time,内容 content
二、实验目的
- title,content 字段含有空值,将含有空值的数据记录去除。
- id 为 2 的记录,其 post_time 属性值相比其他记录多了时分秒, 对该属性值进行修改,使得全体数据格式保持一致。
三、实验步骤
3.1、步骤概览
3.2、详细步骤
3.2.1、表输入,将MySQL中数据表导入到 kettle 当中
点击预览查看导入数据:
3.2.2 、过滤记录(去除空值记录)
将属性 title 和 content 的值为空的数据记录进行过滤,存留下来的数 据则不含空值。
3.2.3、过滤记录,按post_time对数据记录进行分类处理
是否含有英文冒号。
3.2.4、剪切字符串
去除时间前面的文字并新增 post_time1 字段、去除时间前面的文字和时分秒并新增 post_time1 字段。
3.2.5、剪切字符串
3.2.6、移除 post_time
3.2.7、移除 post_time
3.2.8、改名post_time1
3.2.9、改名post_time1
3.2.10、数据输出到MySQL
选择好目标表后,选择SQL,对表进行修改,新增属性。
选择指定数据库字段后,选择输入的数据库字段。
四、结果