目录 0 引言 1 现象 2 问题解决 03 小结 0 引言 “ 本文讲解了Sqoop同步数据中存在特殊换行符导致两边数据不一致问题的解决方法,同时对AVRO对解决这一类问题进行了重点讲解,包括AVRO语法格式、Hive建表语法等。” 本文主要知识点:AVRO存储格式及建表语法 1 现象 问题:Sqoop采集完成后导致HDFS数据与Oracle数据量不符。 原因 sqoop以文本格式导入数据时,默认的换行符是特殊字符 Oracle中的数据列中如果出现了\n、\r、\t等特殊字符,就会被划分为多行 Oracle数据 id