用sqoop抽取数据的时候,若记录中含有“由空格组成的字符串”,由于空字符串是由引号括起来,因此,需要对引号进行转义。否则sqoop 完成后, hive加载hdfs文件时,会自动对其截断,从而导致字段数增多。 解决的办法分为2步 : 1、建表的时候设定escaped 属性:escaped by '\\'。 eg: row format delimited fields terminated by '\t'