kettle-8.3.0.0:数据检验、统计与脚本

本文介绍了Kettle在数据检验和统计方面的应用。数据剖析使用DataCleaner插件进行,包括数据类型、长度和值域的分析。数据校验则涉及错误代码和字典表匹配,可配合SWITCH CASE进行后续处理。此外,文章还探讨了Kettle中的统计功能,并讲解了如何在脚本中使用JavaScript,包括调用Java类、获取和设置字段值的方法。
摘要由CSDN通过智能技术生成

概述

数据剖析和数据检验:用于数据的检查、清洗 。
统计步骤:提供数据采样和统计的功能。
分区:根据数据里某个字段的值,拆分成多个数据块。输出到不同的库表和文件中。

脚本:Javascript 基础

数据剖析和数据检验

1.数据剖析

分析原始数据的数据类型、长度、值域等,属于ETL的第一步

kettle中使用DataCleaner进行数据剖析

首先需要在工具-marketPlace中安装改插件并重启:https://wiki.pentaho.com/pages/viewpage.action?pageId=23533803

2.数据校验

示例可以查看samples,可以配置例如错误代码,字典表校验等:

一个简单的检验如下:

也可以后面接SWITCH CASE,通过错误代码等进

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值