数据预处理专题-PDI(KETTLE)
文章平均质量分 95
常用的ETL工具PDI,又称为KETTLE的相关介绍与案例
IT从业者张某某
致力成为一个做事高效,待人认真,对社会产生价值的人
展开
-
07-PDI(Kettle)源码编译8.2.0.0.R版本
本文主要实现了PDI(kettle)8.2.0.0.R源码编译,在编译的过程中,遇到了大量的问题,并查找了大量的的文章。网络提供的资源给了我很多的参考,但直接参考存在一些小问题,或是文件无法下载,或是没有一些问题的解决方案,本文的主要目的就是希望读者可以一步到位的实现PDI的源码编译,有问题的读者,可以留言,看到如果可以复现的话,我会及时回复的。原创 2021-12-14 16:05:32 · 3468 阅读 · 4 评论 -
06-PDI(Kettle)读取Hive写入HDFS,读取HDFS写入HBase中
本文主要描述了基于kettle实现从hive读取数据写入到hdfs,同时实现从HDFS读取数据写入HBase中的完整流程,同时为便于读者能根据本博客实现完整的实验,还参考了部分博客,增加了mysql和hive的安装过程,并针对自己安装过程中遇到的问题,进行了记录。原创 2021-12-13 08:44:24 · 1960 阅读 · 0 评论 -
05-PDI(Kettle)脚本执行
本文主要介绍PDI(Kettle)的Pan和Kitchen命令,并封装成脚本执行,并提供了相关参考连接原创 2021-11-19 09:21:20 · 1015 阅读 · 0 评论 -
04-PDI(Kettle)job案例
job与步骤的区别在于,步骤是并行执行,作业的各作业项具有先后执行顺序,这在处理某些问题的时候具有很大优势。本文包括作业项的创建,变量的设置,与邮件监控的基本操作。原创 2021-11-19 15:14:26 · 971 阅读 · 0 评论 -
03-PDI(Kettle)导入与导出CDC
本文主要完成PDI(Kettle)导入与导出的CDC部分案例,CDC为变化数据捕获,也即增量数据捕获,是企业中常见的场景之一。本文包括基于时间戳,触发器,快照的CDC案例。原创 2021-11-11 11:36:15 · 908 阅读 · 2 评论 -
02-PDI(Kettle)导入与导出
本文主要介绍基于Kettle的导入与导出,并针对每种文件特点进行相关介绍。包括excel,文本,xml,json,数据库等。原创 2021-11-09 16:39:08 · 2409 阅读 · 0 评论 -
01-PDI(Kettle)简介与安装
本文主要为PDI(Kettle)简介与安装,包括 PDI(Kettle)简介, Kettle下载与安装,Kettle核心知识点等。原创 2021-11-09 13:44:08 · 1755 阅读 · 0 评论