DataX
datax
Wang Zhuoqun
我还能学!!!
展开
-
HdfsReader数据包含双引号导致数据拉取异常
1、问题场景使用datax从hive同步数据到orace。采用了hdfsreader和oraclewriter。当hdfs上的数据的某一个列是以“双引号”开头的,会导致“双引号”后的所有数据被当做一个长字符串,进而导致同步数据失败。2、问题定位翻看datax的hdfsreader部分的源码,发现datax在读取数据时采用了com.csvreader.CsvReader这个工具。3、测试com.csvreader.CsvR...原创 2022-04-25 21:40:27 · 1721 阅读 · 0 评论 -
DataX核心源码流程
原创 2022-03-27 19:43:00 · 317 阅读 · 0 评论