sqoop中,我们都知道可以指定关系型数据库字段导入hive
有两种方式:
第一种:用query查询语句把结果存放在hdfs
第二种:用column指定字段到hdfs
表面看似没差别,但这两种有底层区别,
前者是直接结果字段为指定字段,
后者则是先从关系型数据库查询所有,再获取指定字段存入hdfs作为结果集。(在执行日志中,可以看到首先打印出来的是INFO manager.SqlManager: Executing SQL statement: SELECT t.* FROM `xxx` AS t LIMIT 1)