最近想要在windows10上使用kettle做数据ETL,首先安装配置作为新手也是踩坑无数,主要环境版本目前不是本人能够修改的,而kettle这东西对版本对应要求又比较严格,虽然只是连接就已经踩坑无数,主要问题集中在连接hive的时候,下面看图说话:
测试环境版本:
hadoop-2.6.4
apache-hive-0.13.0
启动之后先连个MySQL
- kettle7.1下载地址
下载好软件之后直接进去
\pdi-ce-7.1.0.0-12\pdi-ce-7.1.0.0-12\data-integration
双击运行Spoon.bat
启动,新建转换返回主对象树视图之后界面如下:
建立数据库连接:首先你需要放一个
mysql-connector-java-5.1.6-bin.jar
到\pdi-ce-7.1.0.0-12\pdi-ce-7.1.0.0-12\data-integration\lib
文件夹下否则会报驱动错误,然后回到界面在右击DB连接,选择数据库mysql,其他照图填