大数据定时处理流程(结构化数据)
- 一、使用kattle工具或sqoop工具把数据导入hdfs
-
1、Kattle工具配置
复制hadoop服务中hdfs-site.xml hive-site.xml yarn-site.xml文件,并放入Kattle的C:\Users\Administrator\Desktop\pdi-ce-8.2.0.0-342\pdi-ce-8.2.0.0-342\data-integration\plugins\pentaho-big-data-plugin\hadoop-configurations\hdp30目录中
2、启动Kattle Spoon.bat
3、创建转换
1)编辑表输入