Kettle 抽取导出hive 数据 到 文本文件问题——分隔符
表输入中遇到两个问题,1是 字段太长,无法识别,需要转换成String
2是 中文内容中有英文逗号,我选择英文逗号作为分隔符后导致不该被分割的内容被切开
所有需要注意的地方都用红框框了出来
注意kettle date类型导出来是2019/07/28 这种分隔符 所以要在文本文件输出指定格式
并且注意 更改原来自带的Timestamp 为Date 格式,否则hive映射会失败,显示NULL
最后说说今天学到的东西
本来觉得时间类型处理完毕,就可以高枕无忧了,结果英文逗号的问题出来了,问题的原因是源数据库的数据不规范,因此遇到下一个这样的工作,首先要做的就是研究原数据,每个字段的特点,数值类型