【kettle8.2——从零开始】一、kettle的介绍以及组成

一个有点长的前言…

最近在做一个政府项目,数据来源非常复杂:公安的,居委会的,发改委的…

如果以传统的方式,将接收到的数据直接放入一张表中,然后直接对这张表进行增删改查,那么就会涉及到一个问题:如果中途某一步骤时,发现数据有问题,那么如何判断到底是不是源头数据本身就有问题导致的?(其实主要是为了防止如果源头数据出了问题,我们要找到证据,否则只能打碎了牙往肚里咽)

基于这个原因,我们对数据库进行了物理分隔——分为ODSDW两层,ODS存放源数据,DW存放我们真正在生产、测试等环境中使用的数据。

即比如从公安来了一条数据,姓名张三,年龄25,生日XXXX…,我们原封不动的放进ODS的人员表中,然后再将这些数据经过一些清洗(去重,根据业务去除无效数据等等的操作)后,放进DW中,如果要对某些人员的信息进行修改,则修改DW中的,ODS只是存放来源数据,而不会做任何修改。

以前清洗数据的操作,大多都是编写一些测试类,然后进行逻辑处理,这虽然也能达到效果,但测试类本身不好管理(很容易被误删,且等时间一长,哪怕有注释,重新读一遍

  • 3
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
### 回答1: kettle8.2开发手册是关于kettle8.2版本的开发指南。Kettle,也被称为Pentaho Data Integration,是一款开源的ETL工具,用于数据的抽取、转换和加载。而Kettle8.2是其最新版本,这个开发手册提供了详细的指导,帮助开发人员在Kettle8.2上进行数据集成和转换开发。 这本开发手册涵盖了Kettle8.2的各个方面,包括安装和配置Kettle8.2的过程,以及在不同操作系统上运行Kettle8.2所需的要求。它还介绍Kettle8.2的基本概念和架构,让开发人员对Kettle8.2的工作原理有更深入的理解。 开发手册还提供了大量的示例代码和实用技巧,帮助开发人员快速上手,并掌握Kettle8.2的开发技能。手册中详细讲解了如何创建和管理转换任务、定义数据源和目标、进行数据转换和清洗等常见的开发操作。开发人员可以按照手册中的指导一步一步进行开发,轻松地实现数据的ETL过程。 此外,开发手册还介绍Kettle8.2的高级功能和扩展插件的使用方法,如定时任务调度、并行处理、错误处理等。这些高级功能可以帮助开发人员更好地优化和管理数据转换任务,提高数据处理的效率和准确性。 总而言之,Kettle8.2开发手册是一本很有价值的指南,为开发人员提供了全面的Kettle8.2开发知识和技能。通过学习和掌握手册中的内容,开发人员能够更好地利用Kettle8.2进行数据集成和转换开发。 ### 回答2: kettle8.2开发手册是一本关于Kettle 8.2版本的开发指南,它提供了详细的信息和指导,帮助开发人员快速上手和深入了解Kettle的开发。 在Kettle 8.2开发手册中,首先介绍Kettle的基本概念和架构。Kettle是一款强大的开源ETL(Extract, Transform, Load)工具,用于数据集成和转换。手册详细介绍Kettle的组件、作业和转换等基本概念,让开发人员能够全面理解Kettle的工作原理。 手册还提供了用于Kettle开发的工具和技术的详细说明。其中包括Kettle的图形界面开发工具Spoon,以及Kettle的命令行开发工具Pan和Kitchen。手册详细介绍了这些工具的使用方法和功能,帮助开发人员快速上手。 同时,手册还介绍Kettle的转换和作业的开发方法和技巧。手册提供了实际的案例和示例,让开发人员能够通过实践掌握Kettle的各种技术和功能。手册还介绍Kettle的插件机制和扩展开发,让开发人员能够根据自身需求进行个性化的开发。 此外,手册还包括了Kettle API的详细文档和使用方法。通过对API的介绍,开发人员可以深入了解Kettle的内部机制和实现,实现更高级的自定义功能。 总之,Kettle 8.2开发手册是一本全面的开发指南,对于想要学习和使用Kettle的开发人员来说是一本宝贵的参考资料。无论是初学者还是有一定经验的开发人员,都可以通过这本手册快速提升自己的Kettle开发能力。 ### 回答3: Kettle 8.2是一款开发工具,用于数据集成、数据转换和数据处理等任务。它提供了丰富的功能和强大的扩展性,可以轻松地处理各种数据源和数据格式。 Kettle 8.2的开发手册是指导开发人员如何使用这个工具进行数据集成开发的指南。手册详细介绍Kettle 8.2的安装和配置,以及各种功能的使用方法和操作步骤。 手册中首先介绍Kettle 8.2的基础知识,包括工具的主要组件、架构和工作流程等。然后,手册介绍了如何创建和配置数据源连接,包括数据库连接和文件连接等。 接下来,手册详细介绍Kettle 8.2中各种数据转换操作的使用方法,包括数据抽取、转换、加载和清洗等。手册中提供了丰富的示例和实践案例,帮助开发人员理解和掌握不同的数据转换技术和策略。 此外,手册还介绍Kettle 8.2的高级功能和扩展性,包括使用Java编写自定义插件和脚本,以及与其他工具和平台的集成等。这些功能可以帮助开发人员根据实际需求扩展和定制Kettle 8.2的功能。 最后,手册还提供了一些开发技巧和最佳实践,帮助开发人员更加高效地使用Kettle 8.2进行数据集成开发。 总之,Kettle 8.2开发手册是一本详细而全面的指南,可以帮助开发人员快速上手并掌握Kettle 8.2的开发技能,从而更好地完成各种数据集成任务。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

LanceQiPing

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值