Kettle 抽取导出hive 数据 到 文本文件问题——分隔符

博客讨论了在Kettle中抽取Hive数据到文本文件时遇到的字段长度限制和分隔符问题。作者强调了数据不规范导致的英文逗号问题,并提供了两种解决方案:1. 替换英文逗号为中文逗号;2. 使用其他分隔符。还提到Hive建表时使用英文逗号作为分隔符能顺利映射。此外,建议在大规模操作前进行小规模测试,并确保所有步骤与改动同步。
摘要由CSDN通过智能技术生成

Kettle 抽取导出hive 数据 到 文本文件问题——分隔符

在这里插入图片描述
表输入中遇到两个问题,1是 字段太长,无法识别,需要转换成String
2是 中文内容中有英文逗号,我选择英文逗号作为分隔符后导致不该被分割的内容被切开

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

所有需要注意的地方都用红框框了出来

注意kettle date类型导出来是2019/07/28 这种分隔符 所以要在文本文件输出指定格式
并且注意 更改原来自带的Timestamp 为Date 格式,否则hive映射会失败,显示NULL

最后说说今天学到的东西

本来觉得时间类型处理完毕,就可以高枕无忧了,结果英文逗号的问题出来了,问题的原因是源数据库的数据不规范,因此遇到下一个这样的工作,首先要做的就是研究原数据,每个字段的特点,数值类型࿰

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值