kettle
Kettle是一款国外开源的ETL工具,纯java编写,可以在Windows、Linux、Unix上运行,数据抽取高效稳定。
Kettle 中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。
kismetG
HelloWorld
展开
-
kettle -- 连接hdfs 的转换 HDFS –Excel json -HDFS
HDFS –Excel 需求:将hdfs上的文件转为Excel文件 1.创建步骤 2.连接hdfs 3.设置hdfs输入 4.设置Excel输出,运行 json--HDFS 需求:将json上传到HDFS 1.创建步骤,读取json数据 2.上传hdfs,执行运行 ...原创 2020-04-23 10:49:04 · 1272 阅读 · 0 评论 -
kettle -- 连接hive读取数据导入hdfs
1.环境准备 1.进入kettle安装文件目录的data-integration\plugins\pentaho-big-data-plugin,修改plugin.properties文件 根据自己的hadoop版本添加不同的类型 2.修改完成后进入自己对应的版本进入不同的目录,我进入的是plugins\pentaho-big-data-plugin\hadoop-config...原创 2020-04-22 11:54:00 · 3513 阅读 · 0 评论 -
Kettle --实操类型 csv转excel json转excel mysql转excel 生成数据输出为Excel 删除mysql表中指定id的数据
Test1 csv-excel 需求:把数据从CSV文件抽取到Excel文件 设置CSV输入步骤 设置Excel输出步骤 启动保存运行 Test2 json-excel 需求:把数据从json文件抽取到Excel文件(具体步骤跟test1大同小异) 设置json输入步骤 设置Excel输出步骤(具体步骤跟test1一模一样,这里省略) 启动保存运行 ...原创 2020-04-22 08:57:14 · 1177 阅读 · 0 评论 -
kettle --入门安装测试
Kettle简介 ETL(Extract-Transform-Load的缩写,即数据抽取、转换、装载的过程),对于企业或行业应用来说,我们经常会遇到各种数据的处理,转换,迁移,所以了解并掌握一种etl工具的使用,必不可少。kettle是纯java编写,支持图形化的GUI设计界面,然后可以以工作流的形式流转,在做一些简单或复杂的数据抽取、质量检测、数据清洗、数据转换、数据过滤等方面有着比较稳定的...原创 2020-04-21 18:07:35 · 3059 阅读 · 0 评论