kettle
文章平均质量分 53
It's a cinch!
这个作者很勤快,什么都没留下
展开
-
kettle——数据一致性、数据规范化
创建表结构数据记录。原创 2023-06-09 18:27:57 · 924 阅读 · 0 评论 -
kettle——异常值的删除、替换
①点击”浏览”,将转换结果保存到test6_1.xls文件。②分隔符改为“tab”,取消”头部”复选框。①将转换结果保存为test6_2.xls文件。②获取字段,将温度的值设置成整数。可通过“测试”,验证是否连接数据库。根据执行过程看出过滤了一条记录。③获取字段,并修改字段名称。验证 可知137已被过滤。③预览查看数据表信息。原创 2023-06-09 18:09:06 · 1736 阅读 · 0 评论 -
kettle——处理缺失值
①设置输出到revenue_test.xls文件。①选择输出到的people_test.xls文件。查看revenue_test.xls文件。② 分隔符为’tab’,取消头部复选框。勾选“选择字段”并设置要替换的字段及值。②分隔符采用tab,取消头部复选框。②移除flagfield字段。③ 获取字段并修改字段名称。②移除‘sex’字段。原创 2023-05-18 17:39:04 · 1637 阅读 · 0 评论 -
kettle——数据清洗(.xml/.json——>数据表)
准备:①创建xml表的结构②创建json表的结构。原创 2023-04-28 00:18:37 · 1032 阅读 · 0 评论 -
kettle——数据清洗(数据表——>转换——>数据表)
准备:表a的结构表a 的数据表b的结构。原创 2023-04-19 21:46:31 · 1373 阅读 · 0 评论 -
kettle——数据清洗(数据表-->文本文件)
1)文件:文件名为test.txt,点击“浏览”保存到指定目录。2.kettle连接模块(图片加分析,每个模块实现的功能)①新建“转换”文件,”文件”——>“新建”——>“转换”。1.数据表(图片加分析,创建表的过程和对应的字段及记录)⑤保存,按“CTRL+S”,取名为example。2)内容:指定字段分布格式,点击“插入TAB”⑥运行,按“ALT+F9”,选择“本地执行”若如下图所示,显示7条数据,则表明加载成功。3)字段:点击“获取字段“,得到如下图数据。4)点击“预览”,查看是否加载成功。原创 2023-04-12 20:26:00 · 1115 阅读 · 0 评论 -
kettle——数据清洗(文本文件-->数据表)
分隔符换为tab键,取消复选框“头部”,编码方式改为“UTF-8”点击“浏览”,选择文件“test.tsv”②进行如下设置后点击测试,将提示连接成功。点击“增加”,将文件转入选中。点击确认,将显示“扫描结果”原创 2023-04-15 18:02:35 · 329 阅读 · 0 评论