Kettle表输入到Parquet表输出 图示 local_oracle_table_input table_parquet_output 注:压缩格式有两种: Gzip 优点: 压缩解压速度快 , 压缩率高 , hadoop本身支持 处理压缩文件时方便 , 和处理文本一样 大部分linux 系统自带 Gzip 命令 , 使用方便 Snappy优点: 高压缩解压速度 , 压缩率还可以